【预售】 心理与教育测量(第四版)戴海崎,张锋 十二五“普通高等教育本科*规划教材 312学硕

【预售】 心理与教育测量(第四版)戴海崎,张锋 十二五“普通高等教育本科*规划教材 312学硕 pdf epub mobi txt 电子书 下载 2025

戴海琦 张锋 著
图书标签:
  • 心理测量
  • 教育测量
  • 心理学
  • 教育学
  • 研究生教材
  • 312学硕
  • 戴海崎
  • 张锋
  • 高等教育
  • 规划教材
想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 云图盛世图书专营店
出版社: 暨南大学出版社
ISBN:9787566823700
商品编码:16633591416

具体描述

内容简介

本书是华南师范大学心理学系组织南方八省师范大学编写的心理学主干课程系列教材之一。本书从测量学基本原理、测验编制技术、知名测验性能三个方面总结前人所编教材的经验,力求反映测量研究领域的当代特色。本书既可作为心理学、教育学、社会学等专业的测量课教材,也可以作为从事心理咨询、考试评价、人员测评等工作人员的参考书。

作者简介

戴海琦,华南师范大学教育学硕士。曾任江西师范大学教育学院教授、基础心理学专业博士生导师,兼任中国心理学会心理测验专业委员会委员、中国教育学会教育统计测量分会常务理事、江西省心理学会副理事长。长期从事心理与教育统计学、测量学的教学和科研工作,主编心理学教材多部,教材被多所院校采用。
张锋,浙江大学基础心理学专业博士,宁波大学心理学教授(二级)。曾任宁波大学教师教育学院副院长,心理学学科负责人;现任心理学研究所所长,心理学学科负责人。2012年被浙江省人民政府授予高校优秀教师称号。长期从事基础及应用心理学领域的研究工作,主要研究方向为人格心理及应用,其特殊人群(海洛因戒除者、病理性网络使用者等)心理与行为问题研究在国内具有重要影响。

目录

第四版前言
编写说明
第一章  心理与教育测量概论
第二章  心理与教育测量简史
第三章  经典测验理论的基本假设
第四章  测量信度
第五章  测量效度
……
第十七章  测量理论与应用的新发展
附录一  心理测验管理条例
附录二  心理测验工作者职业道德规范
附表一  正态分布表
附表二  t分布检验临界值表
附表三  积差相关系数显著性检验表
参考文献


心理测量学与教育测量学:理论、方法与应用 本书旨在系统深入地介绍心理测量学与教育测量学的基本原理、核心方法、关键技术及其在教育实践中的广泛应用。内容涵盖了测量学的历史发展、理论基础、测量工具的设计与开发、信度与效度的评估、分数解释与应用,以及常模的建立与应用等关键环节。本书不仅注重理论的严谨性,更强调实践的可操作性,旨在为读者提供一套全面、系统、实用的测量学知识体系,帮助读者理解和掌握如何科学地进行心理与教育测量,从而更有效地服务于教学、科研与人才选拔等领域。 第一部分:测量学基础与理论 第一章:测量学概述 1.1 什么是测量? 测量作为一种科学活动,其核心在于量化。它并非简单地赋予数字,而是将观察到的现象与预设的规则相对应,从而获得关于该现象的数值信息。这些数值信息承载着事物的属性、特征或状态,并使我们能够对其进行比较、分析和理解。 1.2 心理测量与教育测量的概念与范畴 心理测量,顾名思义,专注于测量人的心理特质、状态和行为。这包括但不限于智力、人格、情绪、动机、兴趣、价值观等。其研究对象是内在的、非直接可观察的心理结构,因此需要通过间接的、科学的工具来进行推断和评估。 教育测量,则将测量学的原理与方法应用于教育领域,以评估学习效果、教学质量、学生发展状况等。它关注的是教育过程中可量化的因素,例如知识掌握程度、技能水平、学习态度、教学成效等。教育测量是教育评估的重要组成部分,为教育决策提供客观依据。 两者的范畴相互交叉,许多测量工具和方法可以同时服务于心理测量和教育测量。例如,用于评估学生学习成绩的标准化考试,既是教育测量的工具,其背后也蕴含着对学生学习能力这一心理特质的测量。 1.3 测量学的发展简史 测量学的历史是一部不断探索与进步的史诗。早期,测量更多地是基于经验和直觉,缺乏系统的理论支持。随着科学的发展,尤其是统计学和心理学的兴起,测量学开始走向科学化、系统化。 19世纪末至20世纪初: 弗朗西斯·高尔顿(Francis Galton)和詹姆斯·麦肯·凯特尔(James McKeen Cattell)等先驱者将测量方法引入心理学研究,奠定了现代心理测量学的基础。他们开始了对个体差异的研究,并尝试用量化的方式来描述和比较人的能力。 20世纪初至中期: 阿尔弗雷德·比奈(Alfred Binet)在智力测验领域的开创性工作,标志着测量学进入了一个新的阶段。他的智力量表极大促进了心理测量的发展,并在教育领域得到广泛应用。西格蒙德·费尔德曼(Charles Spearman)提出的“二因素论”以及信度、效度等概念的引入,为测量学的理论体系构建提供了重要支撑。 20世纪中期至今: 随着教育的普及和心理学的深入发展,测量学呈现出多元化、精细化的趋势。项目反应理论(Item Response Theory, IRT)、计算机化自适应测验(Computerized Adaptive Testing, CAT)等先进理论与技术应运而生,极大地提高了测量的效率和准确性。标准化测验的广泛使用,为教育评估、人才选拔、学业诊断等提供了重要的工具。 1.4 测量学的基本概念 测验(Test): 一种用于收集个体行为样本的系统化程序,通过对这些样本的观察和记录,来推断个体的某种心理特质或能力。 测量(Measurement): 将客观的符号(通常是数字)赋予事物或现象的过程,以表示其属性的程度。 评估(Evaluation): 对测量结果进行判断和解释,以确定其价值、意义或质量的过程。评估是在测量基础上进行的更高层次的判断。 指标(Indicator): 用于量化某种抽象概念或特质的具体、可观察的变量。 量表(Scale): 一组按照特定规则排列的测量项,用于测量某个特定的构念。 第二章:测量理论与尺度 2.1 测量的层次:构念(Construct) 构念是测量学的核心概念之一,指那些直接观察不到但可以通过行为和反应来推断的心理特质或概念。例如,智力、焦虑、创造力、学习动机等都是构念。测量学的目标就是通过操作化(Operationalization)将这些抽象的构念转化为可测量的指标。 2.2 测量尺度:同等量表、顺序量表、区间量表与比率量表 同等量表(Nominal Scale): 仅用于分类,数字之间没有大小或顺序之分,仅作为标记。例如,性别(1=男,2=女),血型(A, B, AB, O)。 顺序量表(Ordinal Scale): 仅能表示事物之间的等级或顺序关系,但不能表示等级之间的差异大小。例如,考试成绩排名(第一名、第二名),满意度(非常满意、满意、一般、不满意)。 区间量表(Interval Scale): 既有顺序关系,又能表示等级之间的差异大小,但没有绝对零点。例如,摄氏温度(0℃并非没有温度),智商分数(IQ)。 比率量表(Ratio Scale): 具有绝对零点,可以表示比例关系。例如,身高、体重、反应时。 2.3 经典测量理论(Classical Test Theory, CTT) 2.3.1 CTT的基本假设与模型 CTT认为,任何一次测验分数(观察分数)可以分解为真实分数(True Score)和测量误差(Error Score)两部分:$X = T + E$。 CTT的三个基本假设: 1. 测验分数与真实分数的期望值相等:$E(X) = T$。 2. 误差分数与真实分数不相关:$Cov(T, E) = 0$。 3. 不同测验的误差分数之间不相关:$Cov(E_i, E_j) = 0$(对于不同的测验 i 和 j)。 2.3.2 CTT在信度与效度评估中的应用 CTT是理解和计算信度与效度的基础。信度主要关注测量误差的大小,效度则关注测量内容与实际测量目标的一致性。 2.4 项目反应理论(Item Response Theory, IRT) 2.4.1 IRT的基本思想与模型 IRT是一种比CTT更先进的测量模型,它关注项目(Item)本身的特性以及被试(Test Taker)的潜在特质水平之间的关系。IRT假设被试在某个潜在特质上的水平决定了其回答某个项目的可能性。 IRT模型(如单参数模型、双参数模型、三参数模型)能够更精确地描述项目特性(如难度、区分度、猜测度)和被试特质水平。 2.4.2 IRT在测验编排与等化中的优势 IRT的优点在于,它将项目特性与被试特质分离开来,使得测验编排更加灵活,可以根据被试的具体情况进行个性化设计(如计算机化自适应测验 CAT)。IRT也为不同版本测验的等化(Equating)提供了科学的方法,确保不同测验分数的可比性。 第二部分:测量工具的设计与开发 第三章:测验编制的基本步骤与原则 3.1 明确测量目标与测验用途 在开始编制任何测验之前,最重要的一步是清晰地界定测验要测量的是什么(目标构念),以及测验将用于何种目的(例如,诊断、选拔、评估教学效果)。明确的目标决定了后续测验设计的方向和内容。 3.2 界定测验内容(Content Domain) 根据测量目标,需要细致地界定测验所要涵盖的内容范围。这通常需要通过文献研究、专家咨询、课程标准分析等方式来完成。 3.3 编写测验项目(Item Writing) 3.3.1 项目类型的选择 客观题(Objective Items): 如选择题、填空题、判断题。优点是评分客观、效率高,适合测量知识和理解。 主观题(Subjective Items): 如论述题、简答题、作文、操作性任务。优点是能测量高层次思维能力、创造性,但评分可能存在主观性。 3.3.2 项目编写的基本原则 清晰性与准确性: 项目语言必须清晰、 unambiguous,避免歧义。 针对性: 每个项目都应与测验目标紧密相关。 区分度: 项目应能区分不同水平的被试。 避免干扰项(Distractors): 在选择题中,错误选项应具有迷惑性,但又不应过于容易被排除,同时也要避免包含正确答案的线索。 避免不当内容: 避免文化偏见、性别偏见等,确保项目的公平性。 3.4 制定测验说明与评分标准 测验说明应简洁明了,指导被试如何作答。评分标准(尤其是主观题)必须详细、客观,以确保评分的一致性。 3.5 试测(Pilot Testing) 编制好的测验需要进行小范围的试测,以发现项目存在的问题,评估项目的初步效度和信度,并为后续项目修改提供依据。 第四章:测量项目的质量分析 4.1 项目难度(Item Difficulty) 定义: 指项目被正确回答的难易程度。通常以p值(被正确回答的比例)来表示。p值越大,项目越容易;p值越小,项目越难。 分析与应用: 理想的难度分布取决于测验的目的。高难度项目通常用于区分能力强的被试,低难度项目则用于区分能力弱的被试。 4.2 项目区分度(Item Discrimination) 定义: 指项目区分高分组被试和低分组被试的能力。通常用项目区分度指数(如点二列相关系数、四分位点相关系数)来衡量。 分析与应用: 区分度高的项目能够有效地将能力强的被试与能力弱的被试区分开来。低区分度项目可能需要修改或删除。 4.3 项目与测验总分的相关性 分析项目与整个测验总分的相关性,是评估项目质量的重要指标。高相关性表明该项目与测验所测量的整体构念一致。 4.4 项目反应理论(IRT)下的项目分析 IRT提供了一种更精细的项目分析方法,能够独立地评估项目难度、区分度(与特质水平相关),以及(在三参数模型中)猜测度。IRT分析的结果可以更准确地指导项目筛选与优化。 第三部分:测量结果的评估与应用 第五章:信度(Reliability):测量的稳定性和一致性 5.1 信度的定义与意义 信度是指测量工具在重复测量时结果的一致性或稳定性程度。高信度的测验,其测量结果受随机误差的影响较小,能够更稳定地反映被试的真实水平。 5.2 信度的评估方法 重测信度(Test-Retest Reliability): 同一测验对同一批被试在不同时间进行两次施测,计算两次分数的相关性。适用于测量相对稳定的特质。 复本信度(Parallel-Forms Reliability): 编制两个或多个形式等价的测验,对同一批被试施测,计算不同形式测验分数的相关性。 内部一致性信度(Internal Consistency Reliability): 测量测验内部项目之间的一致性。 分半信度(Split-Half Reliability): 将测验分为两半,计算两半分数的相关性。 Cronbach's α系数: 最常用的内部一致性系数,适用于连续变量。 Kuder-Richardson(KR)公式: 适用于二分变量(如对错)。 评分者信度(Inter-Rater Reliability): 评估不同评分者对同一被试的评分结果是否一致,主要适用于主观题。 5.3 影响信度的因素 测验长度、项目同质性、施测情境、被试的随机情绪波动等。 5.4 信度系数的解释与应用 信度系数取值范围在0到1之间,越接近1表示信度越高。一般认为0.7以上的信度可接受,0.8以上较好,0.9以上优秀。 第六章:效度(Validity):测量的准确性 6.1 效度的定义与意义 效度是指测量工具能够准确测量其所要测量构念的程度。高效度的测验,其测量结果真正反映了被测量的目标,而不是其他无关因素。效度是测量质量的最高标准。 6.2 效度的评估方法 内容效度(Content Validity): 评估测验内容是否能充分代表所要测量的构念的全部范围。通常依靠专家判断。 结构效度(Construct Validity): 评估测验分数是否能反映其所要测量的理论构念。 聚合效度(Convergent Validity): 测验分数与理论上应高度相关的其他测量构念(如测量同一构念的不同方法)之间存在高相关。 区分效度(Discriminant Validity): 测验分数与理论上应低度相关或不相关的其他测量构念(如测量不同构念的方法)之间存在低相关。 因子分析(Factor Analysis): 通过统计方法分析项目之间的关系,检验测验结构是否符合理论预期。 效标效度(Criterion-Related Validity): 评估测验分数与某一外部效标(Criterion)之间的相关程度。 预测效度(Predictive Validity): 测验分数能否有效预测未来的效标表现(如入学考试分数预测大学成绩)。 同时效度(Concurrent Validity): 测验分数与当前可获得的效标之间的相关性(如一项新的测验与一项已广泛使用的、被认为有效的测验分数相关性)。 反应效度(Response Process Validity): 评估被试在作答项目时的心理过程是否与测验设计者预期的相符。 结果效度(Consequence Validity): 评估测验的使用所带来的实际后果,包括其教育意义和社会影响。 6.3 效度与信度的关系 信度是效度的必要条件,但不是充分条件。一个测验必须是可靠的(信度高),才可能有效(效度高)。但一个可靠的测验不一定是有效的,它可能稳定地测量了错误的东西。 6.4 效度系数的解释与应用 效度系数也通常以相关系数的形式呈现,其解释也类似于相关系数,但更强调测量的准确性。 第七章:分数解释、常模与测验应用 7.1 原始分数(Raw Score)及其局限性 原始分数是测验直接获得的数字,其意义需要参照。 7.2 导出分数(Derived Scores) 百分等级(Percentile Rank): 表示被试的分数高于(或等于)百分之多少的参照群体。 标准分数(Standard Scores): Z分数(Z-score): 将分数转换为以平均数为0,标准差为1的单位。 T分数(T-score): 将Z分数转换为以平均数为50,标准差为10的单位,通常用于一些心理和教育测验。 其他标准分数: IQ分数(平均100,标准差15)、ETS标准分数(平均500,标准差100)等。 7.3 常模(Norms):参照群体与常模团 定义: 常模是指在标准化测验中,从具有代表性的参照群体(Norming Group)获得的平均分数、分数分布等信息。 常模的建立: 抽样方法、样本代表性、分数转换等。 常模的应用: 帮助解释个体分数,进行个体比较、群体比较,以及诊断和评估。 7.4 测验结果的报告与应用 7.4.1 测验报告的要素 被试基本信息、测验名称、施测日期、测验目的、原始分数、导出分数、信度与效度信息、解释性文字。 7.4.2 测验在教育实践中的应用 学业诊断与辅导: 识别学生学习困难,制定个性化辅导方案。 教学效果评估: 评价教学方法、课程设置的有效性。 学生选拔与分班: 为招生、分班提供客观依据。 学生发展性评估: 追踪学生在不同维度上的成长。 7.4.3 测验在心理咨询与临床实践中的应用 心理诊断: 评估心理健康状况,识别心理障碍。 治疗效果评估: 追踪治疗进展,评估干预效果。 人格评估与职业咨询: 了解个体人格特质,为职业发展提供建议。 7.5 测验的伦理问题与使用规范 确保测验使用的公平性、保密性,避免滥用测验结果,以及测验的信度和效度在实际应用中的保障。 本书致力于提供一个严谨、系统且实用的测量学知识框架,帮助读者深入理解心理与教育测量学的核心概念、方法和技术,并能够将其有效应用于实际工作中,从而提升测量决策的科学性和有效性。

用户评价

评分

这本《心理与教育测量(第四版)》简直是我的救星!之前看其他教材,总是觉得枯燥乏味,概念一大堆,但实际应用却摸不着头脑。翻开这本书,立刻就被它清晰的逻辑和生动的讲解吸引了。特别是关于信度效度那一章,作者用了很多形象的比喻,让我这个对统计一直感到头疼的人,竟然也能理解得七七八八。不像有些书,上来就给你一堆公式和术语,看得人云里雾里。这本书的优点在于,它不仅告诉你“是什么”,更重要的是告诉你“为什么”以及“怎么用”。每个测量方法的介绍,都紧密联系着实际的教育和心理学研究场景,让我觉得这些知识是有生命力的,不是死记硬背的条条框框。而且,书中还穿插了很多案例分析,这些案例都非常贴近我们学习和未来可能遇到的工作内容,让我能够把理论知识转化为解决实际问题的能力。我特别喜欢它在讲解一些经典测量工具时,会追溯其发展历程,介绍其优缺点,这让我对这些工具有了更深刻的认识,也更容易在实际应用中做出选择。总而言之,这本书让我对心理与教育测量这门学科的兴趣大大提升,也为我后续的学习打下了坚实的基础。

评分

作为一名心理学专业的学生,阅读《心理与教育测量(第四版)》给我带来了全新的视角和深刻的启发。我之前接触过一些心理测量方面的书籍,但很多都侧重于理论的阐述,缺乏对实际操作的指导,有时甚至会觉得枯燥乏味,难以提起兴趣。然而,这本书的出现彻底改变了我的看法。它在理论深度上毫不含糊,但又用一种非常易于理解的方式呈现出来,特别是对于一些复杂的统计概念,作者运用了大量的图表和实例,使得抽象的理论变得生动形象。我尤其欣赏它对测量误差来源的深入剖析,以及如何通过科学的方法来控制和减小这些误差,这对于我们今后进行严谨的心理研究至关重要。书中关于不同类型测量工具的介绍,也让我对如何选择、编制和评价测量工具有了更系统的认识。它不仅是知识的传授,更是一种思维方式的培养,引导我学会用批判性的眼光去审视各种测量结果,去思考其背后的科学依据。这本书的价值在于,它不仅仅满足了我对知识的渴求,更激发了我对心理测量领域更深入的探索欲望。

评分

我之前一直为312学硕考试的心理测量部分而苦恼,感觉资料太多,不知道从何下手。偶然间听同学推荐了这本《心理与教育测量(第四版)》,抱着试试看的心态买了下来,没想到效果出奇的好!这本书的编排非常有条理,从基础概念到高级理论,层层递进,一点点地构建起完整的知识体系。最让我惊喜的是,它不仅仅是知识的堆砌,而是非常注重理论与实践的结合。书中大量的例题和习题,设计得既有代表性,又具有一定的挑战性,能够有效地检验我是否真正掌握了所学的知识。而且,这些习题的难度和题型都非常符合312考试的要求,很多知识点在考试中都以类似的形式出现。我花了不少时间做习题,反复琢磨解析,感觉自己的解题思路清晰了很多,也掌握了许多解题技巧。这本书让我不再感到迷茫,而是有了明确的学习方向和高效的学习方法。它就像一位经验丰富的老师,耐心地引导我一步步攻克难关。对于备考312学硕的同学来说,这本书绝对是不可或缺的神器,强烈推荐!

评分

说实话,我之前对“十二五‘普通高等教育本科规划教材’”这种标签没什么特别的感觉,认为可能只是学术界的一种标志。但是,当我真正翻阅这本《心理与教育测量(第四版)》后,我才明白它背后的意义。这本书在内容上非常系统和全面,涵盖了心理与教育测量领域的核心知识点,而且更新及时,符合当前学术研究的最新动态。最令我印象深刻的是,它在理论讲解的同时,非常注重培养读者的实践能力。书中提供了许多实际的应用案例,让我能够将书本上的理论知识与现实世界中的问题联系起来。例如,在讲解如何编制一份有效的问卷时,它不仅列出了步骤,还通过具体的例子说明了每个步骤需要注意的问题,以及如何避免常见的陷阱。这让我觉得,这本书不仅仅是一本教科书,更是一本指导我如何成为一名合格的心理测量工作者的实操指南。它的逻辑清晰,结构严谨,每一章都像是为前一章打基础,又为后一章做铺垫,整体性非常强。对于想要系统学习心理测量这门学科的学生,这本书无疑是一个非常优秀的选择。

评分

我本来对心理与教育测量这门课抱有一种“听天书”的心态,觉得里面充斥着各种统计公式和复杂的概念,自己可能永远也学不会。直到我遇到了这本《心理与教育测量(第四版)》,我的看法才发生了翻天覆地的变化。这本书的语言风格非常亲切,就像和一位经验丰富的老师在聊天一样,娓娓道来,一点点地消除了我对这门学科的恐惧感。作者在解释一些高深的理论时,会用很多生动形象的比喻,比如把信度比作一把尺子的稳定性,把效度比作这把尺子是否真的在测量它应该测量的长度,这样的类比让我瞬间就茅塞顿开,理解了很多以前难以理解的概念。而且,这本书的排版也非常人性化,重点内容会有突出显示,公式也会有详细的解释,让我能够清晰地把握知识的重点。最让我感动的是,书中很多地方都体现了作者对初学者的关怀,会提前提醒读者注意一些容易混淆的地方,并给出避免错误的建议。这让我感觉自己不是在孤军奋战,而是有人在背后默默地支持我。这本书让我觉得,原来心理测量也可以如此有趣和易懂!

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有