内容简介
近年来,针对属性数据的特殊统计方法的应用日益广泛,尤其是在生物医学和社会科学领域。这个现象一定程度上反映了过去几十年里属性数据分析方法的发展,同时也反映了科学家和应用统计学家方法论的日益精湛。如今,绝大多数科学家和应用统计学家已经意识到,将针对连续数据的分析方法应用于属性数据是没有必要而且通常是不合适的。
《属性数据分析》展示了针对属性数据*重要的分析方法,概述了诸如卡方检验等长期占主导地位的方法。除此之外,《属性数据分析》特别强调了建模技巧,尤其是logistic回归。
《属性数据分析》的表述基于一个较低的技术层面上,并不要求熟悉如微积分学和矩阵代数等高等数学内容。但是读者应该具备一些相关统计背景知识。这些知识包括非统计专业的本科生或研究生两学期的统计方法系列教材所含的内容,即估计、假设检验、回归模型。
《属性数据分析》是为学习属性数据分析入门课程的学生而设计。同时我也为应用统计学家和在实际工作中涉及数据分析的科学家而写。我希望这《属性数据分析》能对社会科学、行为科学和生物医学领域,以及公共卫生、市场营销、教育、生物、农业科学和工业质量控制等领域的分析师们处理属性响应数据有所帮助。《属性数据分析》1-8章涵盖了*基础的属性数据分析方法。第2章将介绍诸如优势比、独立性检验、条件关联性以及边缘关联性等针对列联表的标准描述方法和推断方法。然而,我觉得可以通过在统计模型背景里观察统计方法以加强对它们的理解。因此,《属性数据分析》其余篇幅主要聚焦于属性响应数据的建模。第3章将介绍二分数据和计数数据的广义线性模型。第4章以及第5章将讨论二项(二分)数据的*重要的模型——logistic回归模型。第6章将介绍名义和有序多项响应的logistic回归模型。第7章将讨论泊松(计数)数据的对数线性模型。第8章将展示针对配对数据的分析方法。
内页插图
目录
第1章 导言
1.1 属性响应数据
1.1.1 响应变量和解释变量的区别
1.1.2 名义量表和有序量表的区别
1.1.3 本书的结构
1.2 属性数据的概率分布
1.2.1 二项分布
1.2.2 多项分布
1.3 比例的统计推断
1.3.1 似然函数和极大似然估计
1.3.2 二项比例的显著性检验
1.3.3 案例:关于堕胎合法化的调查结果
1.3.4 二项比例的置信区间
1.4 关于离散数据的更多统计推断
1.4.1 Wald,似然比和得分推断
1.4.2 二项参数的Wald,得分和似然比推断
1.4.3 小样本二项推断
1.4.4 小样本离散数据推断的保守性*
1.4.5 基于中间P-值的推断*
1.4.6 小结
习题
第2章 列联表
2.1 列联表的概率结构
2.1.1 联合概率,边缘概率以及条件概率
2.1.2 案例:关于来世
2.1.3 诊断检验的敏感度和特异度
2.1.4 独立性
2.1.5 二项抽样和多项抽样
2.2 2×2表比例的比较
2.2.1 比例差
2.2.2 案例:阿司匹林与心脏病
2.2.3 相对风险
2.3 优势比
2.3.1 优势比的性质
2.3.2 案例:阿司匹林和心脏病案例中的优势比
2.3.3 优势比和对数优势比的推断
2.3.4 优势比和相对风险的联系
2.3.5 案例对照研究中优势比的应用
2.3.6 观测研究的种类
2.4 独立性的卡方检验
2.4.1 皮尔逊统计量和卡方分布
2.4.2 似然比统计量
2.4.3 独立性检验
2.4.4 案例:政党认同中的性别差异
2.4.5 列联表的单元残差
2.4.6 卡方统计量的分解
2.4.7 卡方检验的小结
2.5 有序数据的独立性检验
2.5.1 线性趋势与独立性
2.5.2 案例:饮酒与婴儿畸形
2.5.3 有序检验的特殊功效
2.5.4 得分的选择
2.5.5 I×2表和2×J表趋势的检验
2.5.6 名义变量一有序变量列联表
2.6 小样本的精确推断
2.6.1 2×2表的费希尔精确检验
2.6.2 案例:费希尔的品茶者试验
……
第3章 广义线性模型
第4章 logistic回归
第5章 logistic回归模型的构建及应用
第6章 多类别logit模型
第7章 列联表的对数线性模型
第8章 配对数据的模型
第9章 关联,聚簇响应的建模
第10章 随机效应:广义线性混合模型
第11章 属性数据分析史漫谈
附录A:针对属性数据分析的软件
附录B:卡方分布表
参考文献
案例索引
名词索引
部分奇数号习题的简要答案
前言/序言
近年来,针对属性数据的特殊统计方法的应用日益广泛,尤其是在生物医学和社会科学领域。这个现象一定程度上反映了过去几十年里属性数据分析方法的发展,同时也反映了科学家和应用统计学家方法论的日益精湛。如今,绝大多数科学家和应用统计学家已经意识到,将针对连续数据的分析方法应用于属性数据是没有必要而且通常是不合适的。
本书展示了针对属性数据最重要的分析方法,概述了诸如卡方检验等长期占主导地位的方法。除此之外,本书特别强调了建模技巧,尤其是logistic回归。
本书的表述基于一个较低的技术层面上,并不要求熟悉如微积分学和矩阵代数等高等数学内容。但是读者应该具备一些相关统计背景知识。这些知识包括非统计专业的本科生或研究生两学期的统计方法系列教材所含的内容,即估计、假设检验、回归模型。
本书是为学习属性数据分析入门课程的学生而设计。同时我也为应用统计学家和在实际工作中涉及数据分析的科学家而写。我希望这本书能对社会科学、行为科学和生物医学领域,以及公共卫生、市场营销、教育、生物、农业科学和工业质量控制等领域的分析师们处理属性响应数据有所帮助。本书1-8章涵盖了最基础的属性数据分析方法。第2章将介绍诸如优势比、独立性检验、条件关联性以及边缘关联性等针对列联表的标准描述方法和推断方法。然而,我觉得可以通过在统计模型背景里观察统计方法以加强对它们的理解。因此,本书其余篇幅主要聚焦于属性响应数据的建模。第3章将介绍二分数据和计数数据的广义线性模型。第4章以及第5章将讨论二项(二分)数据的最重要的模型——logistic回归模型。第6章将介绍名义和有序多项响应的logistic回归模型。第7章将讨论泊松(计数)数据的对数线性模型。第8章将展示针对配对数据的分析方法。
我认为logistic回归模型比对数线性模型更加重要,因为在实际应用中多数属性响应就是一个单独的二项或多项响应变量。因此我将主要精力放在了与此模型有关的章节以及后面章节中讨论此模型推广的部分。与本书第一版相比,第二版更加强调了logistic回归而较少强调对数线性模型。
我喜欢通过使前述模型与通常的回归分析和ANOVA模型一致化来教授属性数据分析方法。第3章将通过广义线性模型来完成这个工作。一些教师可以选择轻描淡写地讲授这一章,主要将这一章用来介绍二项数据的logistic回归模型(3.1及3.2节1。
第二版相对于第一版的主要变化是增加了两章,这两章主要是分析诸如具有个体重复测量的纵向研究中出现的聚簇关联属性数据。第9章和第10章把第8章的配对方法推广到聚簇数据中。第9章通过边缘模型完成这项工作,并强调了广义估计方程(GEE)方法,而第10章则基于随机效应更充分地对关联性进行建模。本书最后一章以历史的角度回顾了属性数据发展的历程(第11章),附录给出了本书中出现的几乎所有方法的SAS程序。
第1-8章的内容是属性数据分析入门课程的核心部分。若想为其它主题留出余‘力,可以略过2.5、2.6、3.3、3.5、5.3-5.5、6.3、6.4、7.4、7.5以及8.3-8.6节。教师可以选择9-11章的内容作为1-8章基础主题的补充。本书加星号的章节相对次要,想要迅速接触主题的读者可以略过这些章节。
属性数据分析 [An Introduction to Categorical Data Analysis] 下载 mobi epub pdf txt 电子书 格式
属性数据分析 [An Introduction to Categorical Data Analysis] 下载 mobi pdf epub txt 电子书 格式 2024
属性数据分析 [An Introduction to Categorical Data Analysis] 下载 mobi epub pdf 电子书
属性数据分析 [An Introduction to Categorical Data Analysis] mobi epub pdf txt 电子书 格式下载 2024