内容简介
近年来,在心理、教育、管理等社科研究领域,大量基于问卷数据的实证研究使用了中介模型或基于中介模型的复杂模型(包括有调节的中介和有中介的调节)进行分析。在国外,有人检索2005-2009年在Journal of Personality and Social Psychology和Personality and Social Psychology Bulletin,上发表的文章,发现分别有59%和65%进行了中介效应分析(Rucker,Preacher,Tormala & Petty,2011)。在国内,我们检索了2010-2014年五年间发表在《心理学报》、《心理科学》和《心理发展与教育》上的文章,前两种期刊发表的基于问卷、量表收集数据的实证文章略多于一成,最后一种期刊则超过了三成。其中,使用了中介模型或基于中介模型的复杂模型分析的在三种期刊都占了六成左右。
中介模型受欢迎的原因在于,它可以分析变量之间影响的过程和机制。与单纯分析自变量对因变量影响的同类研究,中介效应分析不仅仅有方法上的进步,而且往往能得到更深入的结果。例如,有研究发现,父母社会经济地位会影响儿女社会经济地位;后来有人引入中介效应分析,验证父母社会经济地位高的家庭,可以提供子女更好的教育条件、让子女接受更好的教育,而更好的教育会带来更高的社会经济地位,因而子女的教育水平就是一个中介变量。这个包含中介的研究显然是以往研究的深化。再如,有人研究发现A影响B,还有人研究发现B影响C,那么不论之前是否有人研究过A影响C,都可以做一个新的研究:建立中介模型,验证B是A影响C的中介变量。这个研究不仅是对前人研究的整合,而且有创新,因为之前不同的研究使用的是不同的样本,而新的研究使用的是单一样本。只有使用单一样本建立中介模型,才能验证B的中介作用。
《中介效应分析技术及应用》包含了叶宝娟副教授做博士后(导师是胡竹菁教授)研究期间的主要成果,理论部分主要是与其博士导师温忠麟教授合作的成果,应用部分还包含了与多位作者的合作成果。这些成果的主要部分都以论文形式发表在《心理学报》、《心理科学》、《心理科学进展》、《心理发展与教育》、《中国临床心理学杂志》等核心期刊上。
第一章是中介效应分析方法,讨论了中介效应模型和检验方法的发展,给出了实用的中介效应检验流程,并分别显变量和潜变量给出Mplus程序。第二章包含中介效应分析的若干案例,内容涉及汉区高校少数民族大学生幸福感、青少年烟酒使用、大学生可就业能力、问题性网络使用等。第三章讨论了有调节的中介效应分析方法,对现有的分析方法进行梳理,提出方法之间的替补关系;总结出检验有调节的中介模型的步骤;讨论了有调节的中介模型与有中介的调节模型的联系与区别。第四章是有调节的中介效应分析案例,内容涉及青少年主观幸福感、工读生毒品使用、青少年学业成就、青少年生活满意度、汉区高校少数民族大学生学校适应、高考焦虑等内容。第五章讨论了有中介的调节效应分析方法,对现有的有中介的调节模型,逐一甄别,推荐较好的分析方法:总结出检验有中介的调节模型检验步骤。第六章是有中介的调节分析案例,内容涉及工读生的毒品使用、病理性网络使用及汉区少数民族大学生的幸福感等内容。
内页插图
目录
第一章 中介效应分析方法
第一节 中介效应模型
第二节 对Baron和Kenny逐步法的质疑和辨析
一 依次检验还有用吗
二 要先检验总效应吗
三 区分完全中介和部分中介是否合适
四 逐步法能验证因果关系吗
第三节 新的中介效应检验流程
第四节 中介效应模型的发展
一 类别变量的中介效应模型
二 多重中介效应模型
三 多层中介效应模型
本章小结
附录1-1 用偏差校正的非参数百分位Bootstrap法检验
显变量中介效应Mplus程序
附录1-2 用偏差校正的非参数百分位Bootstrap法检验
潜变量中介效应Mplus程序
第二章 中介效应实证研究
第一节 感恩对汉区高校少数民族大学生幸福感的影响:
基本心理需要的中介作用
一 引言
二 方法
五 结论
本章小结
第三章 有调节的中介效应分析方法
第一节 有调节的中介模型类型
一 只调节间接效应
二 同时调节间接效应和直接效应
三 一个路径图两种解释
第二节 有调节的中介模型检验方法
一 系数乘积的检验
二 中介效应差异的检验
三 检验方法的比较
第三节 有调节的中介模型分析步骤
本章小结
附录3-1 变量间的协方差矩阵文件(pl. txt)
附录3-2 分析图3-11所示模型的Mplus程序
附录3-3 用偏差校正的百分位Bootstrap法检验有调节的
中介模型的Mplus程序
第四章 有调节的中介效应实证研究
第一节 压力性生活事件对青少年主观幸福感的影响:
应对方式和情绪智力的作用
一 引言
二 方法
三 结果
四 讨论
五 结论
第二节 压力性生活事件对工读生毒品使用的影响:
基本心理需要和感恩的作用
一 引言
……
第五章 有中介的调节效应分析
第六章 有中介的调节效应实证研究
前言/序言
近年来,在心理、教育、管理等社科研究领域,大量基于问卷数据的实证研究使用了中介模型或基于中介模型的复杂模型(包括有调节的中介和有中介的调节)进行分析。在国外,有人检索2005-2009年在JournalofPerson,alityan,dSocialPsychology和PersonalityandSocialPsychologyBulletin,上发表的文章,发现分别有59%和65%进行了中介效应分析(Rucker,Preacher,Tormala&Petty;,2011)。在国内,我们检索了2010-2014年五年间发表在《心理学报》、《心理科学》和《心理发展与教育》上的文章,前两种期刊发表的基于问卷、量表收集数据的实证文章略多于一成,最后一种期刊则超过了三成。其中,使用了中介模型或基于中介模型的复杂模型分析的在三种期刊都占了六成左右。
中介模型受欢迎的原因在于,它可以分析变量之间影响的过程和机制。与单纯分析自变量对因变量影响的同类研究,中介效应分析不仅仅有方法上的进步,而且往往能得到更深入的结果。例如,有研究发现,父母社会经济地位会影响儿女社会经济地位;后来有人引入中介效应分析,验证父母社会经济地位高的家庭,可以提供子女更好的教育条件、让子女接受更好的教育,而更好的教育会带来更高的社会经济地位,因而子女的教育水平就是一个中介变量。这个包含中介的研究显然是以往研究的深化。再如,有人研究发现A影响B,还有人研究发现B影响C,那么不论之前是否有人研究过A影响C,都可以做一个新的研究:建立中介模型,验证B是A影响C的中介变量。这个研究不仅是对前人研究的整合,而且有创新,因为之前不同的研究使用的是不同的样本,而新的研究使用的是单一样本。只有使用单一样本建立中介模型,才能验证B的中介作用。
本书包含了叶宝娟副教授做博士后(导师是胡竹菁教授)研究期间的主要成果,理论部分主要是与其博士导师温忠麟教授合作的成果,应用部分还包含了与多位作者的合作成果。这些成果的主要部分都以论文形式发表在《心理学报》、《心理科学》、《心理科学进展》、《心理发展与教育》、《中国临床心理学杂志》等核心期刊上。
第一章是中介效应分析方法,讨论了中介效应模型和检验方法的发展,给出了实用的中介效应检验流程,并分别显变量和潜变量给出Mplus程序。第二章包含中介效应分析的若干案例,内容涉及汉区高校少数民族大学生幸福感、青少年烟酒使用、大学生可就业能力、问题性网络使用等。第三章讨论了有调节的中介效应分析方法,对现有的分析方法进行梳理,提出方法之间的替补关系;总结出检验有调节的中介模型的步骤;讨论了有调节的中介模型与有中介的调节模型的联系与区别。第四章是有调节的中介效应分析案例,内容涉及青少年主观幸福感、工读生毒品使用、青少年学业成就、青少年生活满意度、汉区高校少数民族大学生学校适应、高考焦虑等内容。第五章讨论了有中介的调节效应分析方法,对现有的有中介的调节模型,逐一甄别,推荐较好的分析方法:总结出检验有中介的调节模型检验步骤。第六章是有中介的调节分析案例,内容涉及工读生的毒品使用、病理性网络使用及汉区少数民族大学生的幸福感等内容。
《统计分析与数据挖掘实战》 内容简介 本书旨在为读者提供一套系统、实用的统计分析和数据挖掘技术学习指南,涵盖从基础概念到高级应用的完整流程。全书以理论与实践相结合为核心,通过大量真实案例和详尽的步骤解析,帮助读者深入理解统计学在数据分析中的重要性,并掌握数据挖掘的关键方法和工具。 第一部分:统计分析基础与原理 本部分将读者带入统计分析的广阔世界,从最基本的概念入手,逐步建立起扎实的理论基础。 第一章:数据与统计学概览 数据的类型与测量尺度: 详细阐述定性数据(分类数据,如性别、职业)和定量数据(数值数据,如年龄、收入)的区别,以及名义、顺序、间隔和比例等四种测量尺度的特性。理解不同数据类型和测量尺度对于选择合适的统计方法至关重要。 统计学的基本概念: 介绍总体与样本、参数与统计量、描述性统计与推断性统计等核心概念。重点讲解抽样的目的、不同抽样方法的优缺点(如简单随机抽样、分层抽样、整群抽样),以及抽样误差的来源和控制。 数据收集与整理: 讨论数据收集的常见渠道(问卷调查、实验、二手数据等)及其注意事项。讲解数据清洗(缺失值处理、异常值识别与处理)、数据转换(如对数转换、标准化)和数据编码等预处理步骤,确保数据的质量和可用性。 统计软件介绍: 简要介绍常用的统计分析软件,如R、Python(结合Pandas, NumPy, SciPy, Scikit-learn库)、SPSS、SAS等,并说明它们在数据分析中的优势与适用场景。本书将主要以R语言和Python为主要实践平台进行案例演示。 第二章:描述性统计——数据初探 集中趋势的度量: 深入解析均值、中位数和众数。讲解它们各自的适用条件,特别是在数据分布不对称时,中位数和众数比均值更能反映数据的中心位置。 离散程度的度量: 讲解极差、四分位距、方差和标准差。强调标准差作为衡量数据分散程度的最常用指标,以及它在比较不同数据集的变异性时的作用。 分布形态的描述: 介绍偏度(Skewness)和峰度(Kurtosis),用以描述数据分布的对称性和尖峭程度。通过图示和计算示例,帮助读者理解这些指标的含义及其对数据理解的影响。 可视化技术: 重点介绍直方图、箱线图(Box Plot)、散点图(Scatter Plot)、条形图(Bar Chart)和饼图(Pie Chart)等可视化工具。演示如何使用这些图表直观地展示数据的分布、关系和趋势,以及如何选择最适合表达数据特征的图表类型。 第三章:概率论基础与概率分布 概率的基本概念: 介绍随机事件、样本空间、概率的定义和性质,以及条件概率、独立事件和全概率公式。 常用概率分布: 详细讲解二项分布、泊松分布、正态分布(高斯分布)、均匀分布、指数分布等。重点分析正态分布在自然科学和社会科学中的普遍性,以及其重要性质(如68-95-99.7法则)。 中心极限定理: 阐述中心极限定理的核心思想及其在统计推断中的关键作用,即无论总体分布如何,当样本量足够大时,样本均值的抽样分布近似服从正态分布。 第四章:统计推断——从样本到总体 参数估计: 区分点估计和区间估计。详细介绍置信区间的概念、计算方法和解释,以及置信水平的含义。 假设检验: 讲解假设检验的基本流程,包括建立原假设(H0)和备择假设(H1),选择检验统计量,确定临界区域,计算P值,并根据P值做出决策。 常见假设检验方法: 介绍Z检验、t检验(单样本t检验、配对t检验、独立样本t检验)、卡方检验(独立性检验、拟合度检验)等。并通过实例演示如何应用这些检验来解决实际问题。 第二部分:数据挖掘方法与技术 本部分将引导读者进入数据挖掘的领域,学习如何从海量数据中发现有价值的信息和模式。 第五章:相关性分析与回归分析 相关性分析: 介绍Pearson相关系数、Spearman秩相关系数和Kendall秩相关系数,分析变量间的线性或单调关系强度和方向。讲解相关不等于因果的原则。 简单线性回归: 建立一个因变量与一个自变量之间的线性模型,讲解回归方程的意义、最小二乘法原理,以及模型拟合优度(R方)的解释。 多元线性回归: 扩展到多个自变量与一个因变量之间的线性关系。介绍多重共线性问题及其检测与处理方法,以及变量选择的策略(如向前选择、向后剔除、逐步回归)。 回归诊断: 讲解残差分析、识别异常点和强影响点,确保回归模型的有效性和可靠性。 第六章:分类模型——预测离散结果 逻辑回归: 讲解逻辑回归模型如何用于预测二分类或多分类的离散结果。介绍Sigmoid函数、Logit变换,以及模型参数的解释(Odds Ratio)。 决策树: 阐述决策树的工作原理,包括节点分裂标准(如信息增益、基尼不纯度),剪枝技术以防止过拟合。 支持向量机(SVM): 介绍SVM的基本思想,包括最大间隔分类器、核技巧(Kernel Trick)在处理非线性可分问题中的作用。 K近邻(KNN): 讲解KNN算法的原理,如何基于样本的邻近性进行分类,以及距离度量和K值的选择。 第七章:聚类分析——发现隐藏的群体 聚类分析概述: 介绍聚类分析的目标和应用场景,如客户细分、市场分区等。 层次聚类: 讲解凝聚型(Agglomerative)和分裂型(Divisive)层次聚类的区别,以及不同链接准则(如Ward、Average、Complete)对聚类结果的影响。 划分聚类(K-Means): 详细阐述K-Means算法的步骤,包括初始化中心点、分配样本、更新中心点等迭代过程。讨论如何选择合适的K值(如肘部法则、轮廓系数)。 聚类结果的评估: 介绍评价聚类质量的指标,以及如何解释聚类结果。 第八章:关联规则挖掘——发现物品间的联系 关联规则基础: 讲解频繁项集(Frequent Itemset)、支持度(Support)、置信度(Confidence)和提升度(Lift)等核心概念。 Apriori算法: 详细介绍Apriori算法的工作流程,如何高效地生成频繁项集,并从中挖掘出强关联规则。 FP-Growth算法: 介绍FP-Growth算法,它作为Apriori算法的改进,能更有效地挖掘频繁项集,尤其是在大型数据集上。 实际应用: 结合超市购物篮分析、网站推荐系统等案例,展示关联规则挖掘的价值。 第三部分:高级应用与案例实践 本部分将前面学到的技术融会贯通,并通过实际案例展示它们在不同领域的应用。 第九章:时间序列分析 时间序列数据的特点: 讲解趋势、季节性、周期性和随机性等时间序列的组成成分。 平稳性检验与处理: 介绍ADF检验等方法判断时间序列的平稳性,以及差分等方法实现平稳化。 ARIMA模型: 详细介绍ARIMA(自回归积分滑动平均)模型的原理、参数选择(p, d, q),以及模型拟合与诊断。 应用案例: 如股票价格预测、销售额预测、经济指标分析等。 第十章:文本挖掘与情感分析 文本预处理: 讲解分词(Tokenization)、去除停用词(Stop Word Removal)、词干提取(Stemming)和词形还原(Lemmatization)等步骤。 文本表示: 介绍词袋模型(Bag-of-Words)、TF-IDF(Term Frequency-Inverse Document Frequency)等文本特征提取方法。 情感分析: 讲解如何利用机器学习算法(如朴素贝叶斯、SVM)或基于词典的方法进行情感分析,识别文本中的主观信息(正面、负面、中性)。 案例应用: 如社交媒体评论情感分析、产品评价挖掘、新闻舆情监控等。 第十一章:模型评估与选择 分类模型评估: 讲解准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数(F1-Score)和ROC曲线(Receiver Operating Characteristic Curve)及AUC值。 回归模型评估: 讲解均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)等指标。 交叉验证: 介绍K折交叉验证(K-Fold Cross-Validation)等技术,用于更鲁棒地评估模型的泛化能力。 模型选择策略: 讨论如何根据业务需求、数据特性和模型性能选择最优模型。 第十二章:实战项目演练 数据获取与理解: 指导读者如何从公开数据集中获取数据,并进行初步的探索性数据分析。 问题定义与分析框架构建: 引导读者将实际业务问题转化为统计分析或数据挖掘问题,并设计分析流程。 多模型应用与比较: 选取一个综合性数据分析项目,演示如何运用书中讲解的多种技术(如回归、分类、聚类),并比较不同模型的表现。 结果解读与报告撰写: 强调如何清晰、准确地解读分析结果,并将其转化为业务洞察,最终撰写一份有说服力的数据分析报告。 附录: 常用统计学公式汇总 R语言与Python常用函数速查表 常见统计检验的适用场景指南 本书不仅提供了理论知识,更重要的是通过大量的实践环节,使读者能够独立运用统计分析和数据挖掘技术解决现实世界中的问题,提升数据驱动决策的能力。无论您是学生、研究人员还是希望提升数据分析技能的从业者,本书都将是您宝贵的学习资源。