编辑推荐
《STATA实用教程》采用作者设计的LaTeX格式排版印刷,可读性较强。《STATA实用教程》对读者的计算机知识和统计知识不做区分,适合于医学、社会科学(包括经济学、社会学、政治学、财政金融学等)以及一些数理学科的教学与研究。《STATA实用教程》对于市场调查、政府统计调查以及其他涉及统计分析建模的实际应用部门也有参考作用。
内容简介
本书通过使用大量实际数据,详细讲解统计分析软件Stata的基础知识与基本技能,介绍应用于实际学习与工作中的统计分析方法,并讨论绘图、数据管理以及编程等高级技术。读者可以通过本书清楚地了解Stata是怎样将特定的数据处理、统计分析技术与计算机技术结合起来的,并在此基础上熟练使用Stata来解决和完成学习、研究及工作中的实际问题与任务。本书采用作者设计的LaTeX格式排版印刷,可读性较强。本书对读者的计算机知识和统计知识不做区分,适合于医学、社会科学(包括经济学、社会学、政治学、财政金融学等)以及一些数理学科的教学与研究。本书对于市场凋查、政府统计调查以及其他涉及统计分析建模的实际应用部门也有参考作用。
作者简介
王天夫,毕业于芝加哥大学,获社会学博士与统计学硕士学位。现为清华大学人文社会科学学院社会学系副教授、系副主任。他近年来的研究领域包括中国社会收入分配、社会分层与流动、社会研究方法、家庭社会学、城市空间变换以及城市化过程中的社会冲突等。在中外刊物上发表了十余篇论文,并翻译了《复杂调查设计与分析的实用方法》。
李博柏,毕业于斯坦福大学,获社会学博士与社会学硕士学位。现为北京大学光华管理学院组织管理系副教授,曾任美国西北大学社会学系助理教授。他近年来的研究领域包括组织社会学、企业内部劳工市场、社会网络分析以及经济社会学等。
内页插图
目录
第一章 接触Stata
1. 1 Stata的特点与优势
1. 2 Stata的计算环境
1. 3 开始使用Stata
1. 4 一个简单的Stata分析流程
第二章 使用Stata的基础
2. 1 Stata的命令结构
2. 2 使用Stata的运算结果
2. 3 Stata的系统参数
2. 4 学习Stata的资源
第三章 使用Stata数据文件
3. 1 数据的结构
3. 2 读取与生成数据文件
3. 3 在Stata中输入数据
3. 4 转换数据
3. 5 数据的标签与注释
3. 6 数据文件的存储
3. 7 数据的输出
3. 8 数据文件使用命令的小结列表
第四章 数据处理与数据运算
4. 1 变量与变量值
4. 2 变量取值的类型与存储格式
4. 3 数据的显示
4. 4 变量的运算
4. 5 生成新变量与变量赋值
4. 6 连续变量转换成非连续变量
4. 7 虚拟变量的生成
4. 8 数值变量与字符变量间的转换
4. 9 系统变量
4. 10 Stata中的函数
4. 11 作为计算器的Stata:使用display命令
4. 12 数据中的选择
第五章 编写命令程序文件
5. 1 命令程序文件简介
5. 2 命令程序文件的内容
5. 3 运行命令程序文件
5. 4 读取其他命令程序文件
5. 5 命令程序文件举例profiledo
第六章 数据描述. 制表. 比较与检验
6. 1 查看数据
6. 2 描述性统计量
6. 3 制表
6. 4 均值比较与t-检验
6. 5 方差分析
第七章 线性回归分析
7. 1 相关分析
7. 2 回归分析
7. 3 估算后的拟合值及其他统计量
7. 4 回归分析中的图形
7. 5 假设检验
7. 6 变量转换
7. 7 非连续性变量
7. 8 交互作用
7. 9 逐步回归
7. 10 小结与讨论
第八章 绘制图形
8. 1 Stata制图简介
8. 2 直方图
8. 3 扇形图
8. 4 条形图
8. 5 散点图
8. 6 直线图
8. 7 数据拟合图形
8. 8 其他类型的图形
8. 9 制图过程中的质量控制
8. 10 图形管理与控制
8. 11 使用命令程序文件制图
第九章 数据管理
9. 1 数据合并
9. 2 数据重组
9. 3 数据抽取
9. 4 数据管理中的变量类型
9. 5 缺失数值编码
第十章 编程入门
10. 1 宏的使用
10. 2 构建重复命令
10. 3 创建新命令
10. 4 ado文件的编写
10. 5 编写帮助文件
10. 6 小结
附录A 常用Stata命令
索引
精彩书摘
第一章 接触Stata
Stata的用户群较为广泛,既有专业的统计学家,也有将统计分析作为工具的其他学科和领域的学者与实际工作者。但是,不论读者的背景与知识结构如何,了解Stata的基本运行知识都是使用Stata的第一步。本章的主要内容就是介绍Stata的运行环境及基本应用,目的是让初学者能够对Stata有一个大致的了解。
1.1 Stata的特点与优势
作为一个数据处理与统计分析的软件程序,在短短的二十多年来,Stata作为一个扩张力十足的后起之秀,逐渐席卷了统计应用的各个学科与领域。在医学、社会科学(包括经济学、社会学、政治学、财政金融学等)以及一些数理学科的教学与研究中使用Stata的老师、学生与学者越来越多;在市场调查、政府统计调查以及其他涉及统计分析建模的实际应用中,Stata的优势也逐渐为大家所认识。
在我们看来,与其他计算机统计软件相比,Stata至少拥有以下几个优势:
1.短小精悍,功能强大。
早期Stata的整个程序可以放入两张小小的3寸软盘中。这在计算机硬盘与内存容量较小的历史时期具有相当的优势。随着Stata功能的扩展,特别是完全更新制图引擎之后,整个程序的规模增大了。
在如今硬盘容量的局限性影响甚微的时代,这样的功能扩展已经不成为问题了。与其他“巨无霸”规模的统计软件相比,Stata仍然是“袖珍型”的。但是tata在数据管理、统计分析以及制图等功能上与其他软件相比并没有因规模小而显得逊色。如今的tata能够涵盖广泛的统计模型与技术。
前言/序言
随着大规模数据与统计分析在实际学习和工作中的使用日益频繁,越来越多的人认识到能够熟练使用统计软件的重要性。很多时候,正是由于统计分析与计算手段的局限,导致了不少人对庞大复杂的数据资料望而却步。在我们看来,stata是一个功能强大而又相对简单易学的统计软件,值得向更多的人介绍和推广,让更多的人学会使用Stata,提高人们对大规模数据的处理和分析的能力。
《STATA实用教程》:洞悉数据,驾驭分析 在信息爆炸的时代,数据已成为驱动决策、揭示规律、预测未来的关键要素。而STATA,作为一款在经济学、社会学、统计学、流行病学等诸多领域广受赞誉的统计分析软件,以其强大的功能、灵活的命令以及优秀的报告生成能力,赢得了全球学者的青睐。本书《STATA实用教程》正是您踏入STATA精彩世界、掌握数据分析精髓的理想向导。 本书并非一本仅仅罗列STATA命令的枯燥手册,而是致力于构建一套系统、完整、易于理解的学习体系。我们深知,真正掌握一款软件,不仅在于熟悉其语法,更在于理解其背后的统计思想和应用逻辑。因此,《STATA实用教程》从最基础的概念入手,循序渐进地引导读者深入理解STATA的运行机制,并将其与实际研究问题紧密结合,最终实现高效、准确的数据分析。 为谁而设? 本书面向广泛的数据分析爱好者和实践者,包括但不限于: 在校学生: 无论是本科生、硕士生还是博士生,在学习统计学、计量经济学、数据科学等课程时,都需要掌握专业的数据分析工具。本书将帮助您快速上手STATA,顺利完成课程作业、论文研究以及毕业设计。 科研人员: 致力于在各学科领域进行严谨学术研究的学者,无论是经济学家、社会学家、流行病学家、心理学家,还是市场研究员,都将从本书中受益。我们将为您展示如何利用STATA进行复杂的统计建模、面板数据分析、时间序列分析,以及如何生成符合学术规范的研究报告。 数据分析从业者: 在金融、市场营销、咨询、医疗等行业从事数据分析工作的专业人士,本书将为您提供更深入、更专业的STATA应用技巧,帮助您提升数据分析效率和决策质量。 对数据分析感兴趣的初学者: 即使您之前没有任何统计分析背景,本书也会从零开始,用清晰易懂的语言和丰富的实例,带领您逐步建立起对数据分析和STATA的认知。 内容涵盖与特色解析 《STATA实用教程》力求全面而深入,覆盖STATA的核心功能,并着重于实际应用。本书的内容设计遵循以下几个核心原则: 1. 系统性与逻辑性: 我们将STATA的功能划分为若干个逻辑单元,从数据管理、基本统计分析、图形展示,到各种回归模型、高级统计方法,层层递进,确保读者能够建立起完整的知识框架。 2. 理论与实践并重: 每一个统计概念的引入,都将伴随详细的STATA命令演示和真实数据案例。您不仅能学会“如何做”,更能理解“为什么这么做”,从而真正理解统计方法的内在逻辑。 3. 注重细节与易用性: STATA的强大之处在于其灵活性,但也可能让初学者感到困惑。本书将深入剖析命令的各种选项和参数,并提供实用的技巧,帮助您规避常见错误,提高操作效率。 4. 贴近实际研究需求: 我们精心挑选了具有代表性的案例,这些案例覆盖了经济学、社会学、医学等多个领域,力求反映真实研究场景,让学习过程更具目标性和启发性。 核心内容板块 本书的内容结构大致分为以下几个主要板块: 第一部分:STATA入门与数据准备 STATA界面与基本操作: 熟悉STATA的用户界面,了解命令窗口、变量窗口、属性窗口等基本组成部分,掌握基本的命令输入、执行和结果查看方法。 数据输入与导入: 学习如何直接在STATA中创建数据集,或从Excel、CSV、文本文件等常见格式导入数据。我们将详细讲解数据导入时的常见问题及解决方法,如编码、分隔符、变量类型等。 数据管理与清洗: 这是数据分析的基石。《STATA实用教程》将详尽介绍变量的创建、重编码、合并、拆分、缺失值处理、异常值识别与处理、数据筛选与排序等关键操作。您将学会如何将原始数据转化为可用于分析的干净数据。 变量标签与值标签: 掌握如何为变量和观测值设置有意义的标签,这对于提高数据可读性和后续分析的准确性至关重要。 第二部分:描述性统计与数据可视化 描述性统计量计算: 学习计算均值、中位数、标准差、方差、分位数、偏度、峰度等各种描述性统计量,全面了解数据的集中趋势、离散程度和分布形态。 频率分布与交叉表: 掌握如何分析分类变量的频率分布,以及如何使用交叉表(contingency tables)探索两个或多个分类变量之间的关系。 数据可视化: “一图胜千言”。本书将重点介绍STATA强大的图形绘制功能,包括: 基本图表: 直方图(histograms)、密度图(density plots)、箱线图(box plots)、散点图(scatter plots)、折线图(line plots)等,用于直观展示变量的分布和关系。 高级图表: 学习如何绘制条形图(bar charts)、饼图(pie charts)、雷达图(radar charts)等,以及如何自定义图表的颜色、样式、标题、轴标签等,使其更具表现力。 多变量图表: 探索如何绘制散点图矩阵(scatter plot matrices)、分组箱线图等,以揭示变量间的复杂关系。 图形编辑与导出: 掌握如何对生成的图形进行精细编辑,并将其导出为各种格式(如PNG、EPS、PDF)以用于报告和出版。 第三部分:推断性统计与假设检验 概率分布回顾: 简要回顾正态分布、t分布、卡方分布、F分布等常用概率分布,为理解统计推断打下基础。 单样本与双样本均值检验: 学习如何使用t检验(t-tests)和z检验(z-tests)来检验单个总体均值或两个总体均值是否存在显著差异。 方差分析(ANOVA): 掌握如何使用ANOVA分析一个或多个分类自变量对一个连续因变量的影响,以及如何进行多重比较。 比例检验: 学习如何检验单个比例或两个比例的差异。 卡方检验: 深入理解卡方检验在分析分类变量之间关系时的应用,包括拟合优度检验和独立性检验。 第四部分:回归分析与模型构建 线性回归模型(OLS): 这是本书的核心章节之一。我们将详细讲解: 基本OLS回归: 如何运行简单的线性回归,解释回归系数、R方、p值等统计量。 多重线性回归: 如何加入多个自变量,处理多重共线性问题。 回归模型的假设检验: 检验模型假设的有效性,如残差的正态性、同方差性、独立性等。 模型诊断与改进: 学习如何识别和处理异方差(heteroskedasticity)、自相关(autocorrelation)等问题,以及如何选择合适的回归模型。 虚拟变量(Dummy Variables): 掌握如何使用虚拟变量来处理定性自变量,以及如何进行交互项分析。 预测与拟合优度: 如何利用回归模型进行预测,并评估模型的整体拟合效果。 广义线性模型(GLM): 介绍泊松回归(Poisson regression)、逻辑回归(logistic regression)等,用于处理非正态分布的因变量,如计数数据和二元响应变量。 模型选择与比较: 学习AIC、BIC等信息准则,以及F检验、Wald检验等方法,用于比较不同模型的优劣。 第五部分:高级统计方法 面板数据分析: 在社会科学和经济学研究中,面板数据(longitudinal data)非常普遍。《STATA实用教程》将系统介绍固定效应模型(fixed effects models)和随机效应模型(random effects models),帮助您处理面板数据中的个体效应和时间效应。 时间序列分析: 学习ARIMA模型、单位根检验(unit root tests)、协整(cointegration)等,用于分析具有时间依赖性的数据。 生存分析(Survival Analysis): 在医学、工程等领域,生存分析至关重要。本书将介绍Kaplan-Meier曲线、Cox比例风险模型等。 聚类分析与因子分析: 探索如何通过聚类分析将相似的观测值分组,以及如何通过因子分析简化变量结构。 工具变量法(Instrumental Variables): 在存在内生性问题时,学习如何使用工具变量法解决问题。 第六部分:STATA编程与用户自定义 Do-files: 掌握使用Do-files来组织和管理您的STATA分析过程,实现结果的可重复性。 循环与条件语句: 学习使用`for`循环、`if`条件语句等,编写更复杂的程序,自动化重复性任务。 用户自定义命令(ado-files): 了解如何创建和使用用户自定义命令,进一步扩展STATA的功能。 宏(Macros): 掌握宏的使用,提高代码的灵活性和效率。 学习方法与建议 为了最大化您的学习效果,《STATA实用教程》为您提供了如下学习建议: 1. 勤于实践: 理论学习固然重要,但数据分析最终是实践的艺术。请务必跟随书中的每一个例子,动手在STATA中进行操作。 2. 理解而非记忆: 努力理解每个统计方法背后的逻辑和STATA命令的含义,而不是死记硬背。当您真正理解了,才能灵活运用。 3. 从简单到复杂: 不要急于求成,从最基础的数据管理和描述性统计开始,逐步过渡到复杂的回归模型和高级方法。 4. 遇到问题,主动解决: 在学习过程中,难免会遇到各种问题。请积极查阅STATA的帮助文档(`help`命令),或者在相关的论坛和社区寻求帮助。 5. 将学习内容应用于实际: 如果您有自己的研究数据,尝试将学到的知识应用到您的数据上,这将极大地加深您的理解和熟练度。 结语 《STATA实用教程》旨在成为您数据分析旅程中一位得力而可靠的伙伴。我们希望通过本书,您不仅能熟练掌握STATA这款强大的统计软件,更能培养严谨的数据分析思维,提升解决实际问题的能力。数据是未来的语言,而STATA是解读这种语言的利器。让我们一同开启这段精彩的数据探索之旅吧!