内容简介
本书对分类数据分析的方法和模型,及其在社会科学研究中的应用做了全面介绍。它的一个目标是整合变换方法和潜在变量方法,这是两类不同但又相互补充的处理分类数据分析的传统方法。这也是di一次在一本单册书中详细地介绍针对离散因变量、交叉分类和跟踪数据的模型与方法对于广大的社会科学研究者来说,意义重大,既可以使得他们能顺利使用合适的定类数据的统计方法,又可以让他们对统计后的结果作进一步的科学检验,使得研究能够更加深入下去。
作者简介
Dan Powers and Xieyu 作者之一的谢宇是美国密歇根大学教授,1959年出生于中国江苏省镇江市。1982年获得上海工业大学工学学士学位,1984年获得美国威斯康星大学科学史硕士和社会学硕士学位,1989年获得同所大学社会学博士学位。毕业后在美国密歇根大学社会学系任助理教授(1989—1994)、副教授(1994—1996)、正教授(1996年至今)。1996年被授予Perrin讲座教授,1999年被授予Huetwell讲座教授,2002年被授予社会学系和统计系的Otis Dudley Duncan讲座教授。同时担任密歇根大学社会研究所人口研究中心和调查研究中心的研究教授。2004年当选为美国艺术科学院院士。研究范围:统计方法、社会分层和社会人口学。著作:《类型变量的分析方法》、《妇女科学家》、《亚裔美国人》(英文)。
目录
图目录/1
表目录/1
中文版序/1
前 言/1
第1 章 绪论/1
1.1 为什么需要分类数据分析?/1
1.2 分类数据的两种哲学观点/6
1.3 一个发展史的注脚/8
1.4 本书特点/9
第2 章 线性回归模型回顾/11
2.1 回归模型/11
2.2 再谈线性回归模型/17
2.3 分类变量和连续型因变量之间的区别/27
第3 章 二分类数据模型/29
3.1 二分类数据介绍/29
3.2 变换的方法/30
3.3 Logit模型和Probit模型的论证/39
3.4 解释估计值/54
3.5 其他的概率模型/61
3.6 小结/62
第4 章 列联表的对数线性模型/64
4.1 列联表/64
4.2 关联的测量/68
4.3 估计与拟合优度/73
4.4 二维表模型/79
4.5 次序变量模型/89
4.6 多维表的模型/97
第5 章 二分类数据多层模型/110
5.1 导言/110
5.2 聚类二分类数据模型/113
5.3 追踪二分类数据模型/130
5.4 模型估计方法/136
5.5 项目响应模型/151
5.6 小结/159
第6 章 关于事件发生的统计模型/161
6.1 导言/161
6.2 分析转换数据的框架/162
6.3 离散时间方法/163
6.4 连续时间模型/177
6.5 半参数比率模型/188
6.6 小结/211
第7 章 次序因变量模型/213
7.1 导言/213
7.2 赋值方法/214
7.3 分组数据的Logit模型/216
7.4 次序Logit和Probit模型/220
7.5 小结/232
第8 章 名义因变量模型/234
8.1 导言/234
8.2 多项Logit模型/235
8.3 标准多项Logit模型/237
8.4 分组数据的对数线性模型/242
8.5 潜在变量方法/245
8.6 条件Logit模型/246
8.7 设定问题/251
8.8 小结/258
附录A 回归的矩阵方法/259
A.1 导言/259
A.2 矩阵代数/259
附录B 大似然估计/266
B.1 导言/266
B.2 基本原理/266
参考文献/285
索 引/295
译后记/314
图目录
图1-1 四种测量的分类模式/5
图2-1 关于θ的L对数的大化/19
图2-2 二分类数据的逻辑斯蒂回归与线性回归的比较/27
图3-1 p的logit和probit变换/38
图3-2 以累积概率函数曲线切线的斜率表示的边际效应/57
图3-3 虚拟变量的边际效应/58
图3-4 按家庭收入水平变化的毕业概率/60
图3-5 p的互补双对数变换/61
图5-1 显示预测概率向总比例收缩的观测概率和预测概率/124
图5-2 模型2按照家庭结构和母亲的受教育水平分的婚前生育预测概率/127
图5-3 家庭别随机效应分布/129
图5-4 家庭别随机效应的经验贝叶斯估计值/130
图5-5 观测的、边际的和条件的logit/136
图5-6 β3和σ20的迹线图与直方图/142
图5-7 赋闲比数比的后验分布(南部居住地vs.非南部居住地)(高中毕业vs.未毕业)/147
图5-8 包含3个题项的1PL模型的题项特征曲线/153
图5-9 2PL模型的题项特征曲线/155
图5-10 使用LSAT数据估计的1PL和2PL模型的题项特征曲线/159
图6-1 退学的离散时间风险和生存函数/168
图6-2 对数累积风险和生存函数图/204
图6-3 家庭收入效应的Schoenfeld残差图/207
图6-4 随时间变化的家庭收入效应图/209
图7-1 对应于一个四分类响应变量的累积分布/221
图7-2 潜在变量和现实结果之间的关系/224
表目录
表2-1 瑞典于默奥市婴儿出生后前6个月的死亡数/24
表2-2 列向布局的数据文件/25
表2-3 对数-比率模型的OLS、FGLS和ML估计值/26
表2-4 回归模型的类型/28
表3-1 按种族、性别和家庭结构分类的高中毕业生/31
表3-2 用虚拟变量以列的形式概括表3-1的数据/32
表3-3 替代的二分类因变量模型估计结果/38
表3-4 按照种族、性别和家庭结构分类的估计毕业概率/39
表3-5 比较主效应和二维交互作用模型/50
表3-6 收入和性别对投票倾向的影响/58
表3-7 个人水平数据的logit和probit模型估计值/59
表4-1 受教育水平和对婚前性行为的态度/65
表4-2 观测(期望)频次/66
表4-3 期望概率/67
表4-4 独立情形下的期望频次/68
表4-5 各单元格对皮尔逊卡方的贡献/68
表4-6 独立情形下的行比例/69
表4-7 观测数据的行比例/69
表4-8 态度例子的完整表格/71
表4-9 基于相邻行和列的局部比数比/72
表4-10 模型A下的皮尔逊卡方构成/74
表4-11 可识别的参数/80
表4-12 Hauser的流动表格/83
表4-13 饱和模型的交互参数:代际流动的例子/83
表4-14 参数μh的估计值/84
表4-15 流动表模型的拟合优度统计量/93
表4-16 对堕胎和婚前性行为的态度/96
表4-17 估计的测度得分/96
表4-18 加州大学伯克利分校的研究生录取数据/98
表4-19 合并后的研究生录取数据/99
表4-20 对录取数据所拟合模型的拟合优度统计量/104
表4-21 模型4的交互参数估计值/105
表4-22 三国阶级流动数据的模型/107
表4-23 国家别的�疾问�/109
表5-1 生物化学领域的博士后训练与NIH资金分布/120
表5-2 常规与随机截距模型/121
表5-3 观测比例()与模型预测的比例()/123
表5-4 初次婚前生育的logit模型/126
表5-5 数值积分的支点(u)和权重(p)/129
表5-6 拟合青年就业数据的追踪模型/135
表5-7 不同方法的估计值/144
表5-8 观测的与期望的响应模式/146
表5-9 logit模型拟合统计量/148
表5-10 Bock和Lieberman法学院能力倾向测试(LSAT)数据/157
表5-11 使用LSAT数据估计的1PL和2PL模型/158
表6-1 事件发生数据/165
表6-2 退学生命表/167
表6-3 人-层(person-level)和人-期(person-period)数据格式/172
表6-4 5次追踪观测到的二分类响应序列/172
表6-5 研究退学的离散时间logit模型估计值/175
表6-6 项目完成之前的等待时间/179
表6-7 表6-6所含数据的发生数-暴露量矩阵/180
表6-8 美国按照年龄、种族和出生结果进行分类的婴儿死亡数(暴露量,以天为单位)
——1995~1998年/185
表6-9 婴儿死亡数据的模型及其拟合统计量/186
表6-10 美国婴儿死亡的基线风险与风险比(1995~1998年)/187
表6-11 事件史数据的概念格式/188
表6-12 分时段事件史数据格式/191
表6-13 表6-12的交互分类数据/192
表6-14 含非比例效应的分段式恒定率模型/192
表6-15 初次婚前生育风险的分段式恒定指数模型/193
表6-16 非比例性诊断检验/206
表6-17 含比例效应与非比例效应的Cox回归模型/208
表7-1 以态度为例的标准分变换/216
表7-2 受教育水平与对婚前性行为的态度/219
表7-3 不同参数求解方法下的次序logit估计值/227
表7-4 次序probit估计值与边际效应/228
表7-5 对妇女就业的态度/229
表7-6 次序logit与单独logit的估计值/230
表7-7 比例比数假定的Brant检验/231
表7-8 部分比例比数模型/231
表8-1 多项logit结果/241
表8-2 三维表情况下多项logit和对数线性模型之间的等价/244
表8-3 按照种族和父亲的受教育年限分的就业状况/244
表8-4 从对数线性模型推出的多项logit估计值/245
表8-5 条件logit模型的估计值/248
表8-6 混合模型的结果/250
表8-7 教育获得/257
前言/序言
修订译本说明
《分类数据分析的统计方法》(第2版)一书自2009年7月出版以来,受到广大学生和教师的高度好评。此书不仅是北京大学-密歇根大学学院暑期量化课程的教学参考书,而且是许多高校讲授社会科学量化分析方面课程的教材或参考书。我们经常收到学员和教师对此书的反馈建议和评价。作为译者,我们感谢读者对本书翻译质量的肯定,同时也感谢读者针对本书一些翻译细节提出的很好的建议。这些建议加上我们在教学过程中学生提出的问题,累积起来也有不少。为此,我们在进一步理解原书内容的同时,在有机会的时候也向原书作者谢宇教授和Dan当面请教。借此书翻译修订的机会,我们对译著做了以下几方面的修正和补充。
(1)纠正了文中的一些错别字;进一步区分公式中符号的正斜体,并予以正确标注。
(2)统一了书中的个别关键词。
(3)重新翻译和修改了一些不太通顺或不太符合中文表达习惯的语句,尽可能减少语言表达上存在的明显的翻译痕迹。
(4)按照英文书籍的传统格式,我们在中文译本“主题索引”的基础上制作了中文版“索引”,在内容和格式上基本与原著的索引保持一致。
此修订译本,可能依然存在对原著的理解不足和翻译错误,或者错别字,欢迎读者批评、指正。
译者
2018年1月12日
中文版序
《分类数据分析的统计方法》(第2版)的中文版终于和读者见面了,我感到非常高兴。
《分类数据分析的统计方法》是我和Daniel Powers合著的,也是我的di一本书。di一版于2000年由美国的学术出版社(Academic Press)出版,第二版于2008年由英国的翡翠出版社(Emerald Group)出版。很荣幸的是,我们能在2009年英文第2版刚刚出版后不久就见到由社会科学文献出版社出版发行的中文版。
《分类数据分析的统计方法》是为社会科学——特别是社会学——做定量研究的学者和学生专门写作的教......
分类数据分析的统计方法(第2版) [Statistical Methods for Categorical Data Analysis(Second Edition)] 下载 mobi epub pdf txt 电子书 格式
分类数据分析的统计方法(第2版) [Statistical Methods for Categorical Data Analysis(Second Edition)] 下载 mobi pdf epub txt 电子书 格式 2024
分类数据分析的统计方法(第2版) [Statistical Methods for Categorical Data Analysis(Second Edition)] 下载 mobi epub pdf 电子书
分类数据分析的统计方法(第2版) [Statistical Methods for Categorical Data Analysis(Second Edition)] mobi epub pdf txt 电子书 格式下载 2024