本书详细阐述如何选择统计检验方法,以及在应用这些方法时如何为统计理论和佳实践提供基础。本书聚焦于可应用于实际用户研究项目的方法,是作者实际工作经验、调查研究,以及对新的统计学、心理学、人因工程学的文献资料研读的结晶。它不只是对传统统计学的复述,而是为当今从业者提供了全新和切题的解读。
目 录
译者序
作者介绍
推荐序
前言
致谢
第1章 导论1
1.1 简介1
1.2 本书的组织结构1
1.3 如何使用本书2
1.3.1 应该使用何种检验2
1.3.2 我需要多大的样本量5
1.3.3 你不必手动计算6
1.4 本章要点6
1.5 本章思考题6
1.6 本章思考题答案6
1.7 参考资料7
第2章 量化用户研究8
2.1 什么是用户研究8
2.2 用户研究的数据8
2.3 可用性测试9
2.3.1 样本量9
2.3.2 代表性和随机性9
2.3.3 用户研究的三种研究类型11
2.3.4 数据收集11
2.3.5 任务完成率12
2.3.6 可用性问题12
2.3.7 任务时间13
2.3.8 出错数13
2.3.9 满意度评分14
2.3.10 复合分数14
2.4 A/B测试14
2.5 调查数据15
2.5.1 等级量表15
2.5.2 净推荐值15
2.5.3 评论和开放性数据16
2.6 需求收集16
2.7 本章要点16
2.8 参考资料17
第3章 我们的估算到底有多准确18
3.1 简介18
3.1.1 置信区间=误差幅度的两倍18
3.1.2 置信区间提供了精确度和位置19
3.1.3 置信区间的三个组成要素19
3.2 完成率的置信区间19
3.2.1 置信区间的历史20
3.2.2 Wald区间:对于小样本来说太不靠谱了20
3.2.3 精确置信区间21
3.2.4 Wald校正区间:增加两次成功与两次失败21
3.2.5 完成率的最佳点估计…23
3.2.6 遭遇可用性问题的置信区间24
3.3 等级量表和其他连续性数据的置信区间25
3.3.1 任务时长数据的置信区间27
3.3.2 任务时长均值还是任务时长中位数28
3.3.3 几何平均数28
3.3.4 大样本任务时长的置信区间30
3.3.5 围绕中位数的置信区间30
3.4 本章要点32
3.5 本章思考题33
3.6 本章思考题答案33
3.7 参考资料34
第4章 我们达到或超过目标了吗35
4.1 简介35
4.2 单侧检验和双侧检验38
4.3 完成率与基准的比对39
4.3.1 小样本检验39
4.3.2 大样本检验42
4.4 满意度评分与基准的比对43
4.5 任务时间和基准的比对47
4.6 本章要点51
4.7 本章思考题51
4.8 本章思考题答案52
4.9 参考资料55
第5章 不同设计之间有统计学差异吗56
5.1 简介56
5.2 比较两个平均值(等级量表和反应时)56
5.2.1 组内比较——配对t检验57
5.2.2 比较任务时长59
5.2.3 组间比较(双样本t检验)61
5.2.4 t检验的假设65
5.3 比较完成率、转换率以及A/B测试66
5.3.1 组间比较66
5.3.2 组内比较74
5.4 本章要点82
5.5 本章思考题84
5.6 本章思考题答案86
5.7 参考资料90
第6章 关于样本量大小的总结性研究91
6.1 简介91
6.1.1 我们为何要关注91
6.1.2 可用性研究的类型至关重要92
6.1.3 总结性可用性测试样本量预估的基本原则92
6.2 预估数值93
6.3 比较数值99
6.4 如何控制变异性104
6.5 二项置信区间样本量的估计105
6.5.1 大样本的二项样本量估计105
6.5.2 小样本的二项样本量估计106
6.5.3 与基准比例相比较的样本量109
6.6 卡方检验的样本量预估(独立比例)111
6.7 McNemar精确检验的样本预估(配对比例)114
6.8 本章要点117
6.9 本章思考题119
6.10 本章思考题答案120
6.11 参考资料123
第7章 关于样本量大小的形成性研究125
7.1 简介125
7.2 使用发现问题的概率模型来估计形成性用户研究的样本量125
7.2.1 著名方程:P(x≥1)=1-(1-p)n125
7.2.2 从1-(1-p)n中推导出样本量估计方程127
7.2.3 使用表格计划形成性用户研究样本量129
7.3 二项概率模型的假设130
7.4 模型的附加应用131
7.4.1 估计多重问题或其他事件的复合p值131
7.4.2 校正小样本p的复合评估值132
7.4.3 估计可发现的问题数和未被发现的问题数136
7.5 影响p值的是什么138
7.6 什么是合理的目标问题发现率138
7.7 调解“神奇的数字5”和“8还不够”140
7.7.1 一段历史——20世纪80年代141
7.7.2 又一段历史——20世纪90年代141
7.7.3 “神奇的数字5”的起源142
7.7.4 “8还不够”——一个调解方法144
7.8 更多关于二项概率公式及其小样本校正147
7.8.1 二项概率公式的起源147
7.8.2 紧缩校正是如何起作用的149
7.9 针对问题发现的其他统计模型151
7.9.1 对问题发现使用二项分布模型的批评151
7.9.2 扩展的二项分布模型152
7.9.3 捕获-再捕获模型153
7.9.4 在计划形成性用户研究时为什么不用其他模型153
7.10 本章要点156
7.11 本章思考题158
7.12 本章思考题答案159
7.13 参考资料159
第8章 标准化的可用性问卷163
8.1 简介163
8.1.1 什么是标准化的问卷163
8.1.2 标准化可用性问卷的优点163
8.1.3 什么样的标准化可用性问卷是有用的164
8.1.4 标准化问卷的质量评估:信度、效度和灵敏度165
8.1.5 其他项目的特征166
8.2 后续研究的调查问卷167
前 言欢迎阅读本书第2版!在这一版中,我们自始至终致力于提供关于如何检验和分析用户研究数据的最新且实用的信息。第2版的主要变化如下:
我们重新审阅了2012年以来的相关文献,并根据需要更新了内容和参考文献列表。
在本书涉及的话题中,自2012年以来在标准化的可用性问卷方面,有了最新的研究成果发表,所以我们全面更新了第8章的内容。
关于第1版,反馈最多的是希望加入相关性分析的内容。所以在第2版中我们增加全新的一章来介绍相关性分析、回归分析和方差分析。
由于全新的第10章,我们调整了第1章中的决策导图,以引导读者更好地理解书中的主题。
撰写本书的一个最主要目的是为尽可能广泛的用户体验设计师和研究人员提供切实可行的用户体验评估方法。我们从熟悉用户的研究人员最常遇到的数据着手,紧接着介绍适合分析这类数据的方法——显著性检验、置信区间和样本大小评估等。这其中包含一些较为常见的检验方法,例如t检验。然而,有一些检验方法是我们希望被纳入统计学的教学中,但目前还没有的,例如“调整的Wald二项分布比例的置信区间”(adjusted-Wald binomial confidence interval)。
我想我们可以做到的是,在基于背景因素的情况下,提供有理有据的方法建议。当遇到难以给出建议的案例时,我们也希望可以提供有效的信息,以帮助人们更好地做出决策。所有的这一切都是希望能够为创造更好的产品和服务出一份力,为使用它们的人们带来益处,为提供它们的企业带来价值。
致 谢非常感谢Morgan Kaufmann的团队邀请我们进行第2版的撰写。非常感谢Lynda Finn、Linda Lior和Phil Kortum对本书各章节初稿深思熟虑地审校。对于他们付出的宝贵时间和给予的重要建议,我们表示深深的感激。
Jeff的致谢本书代表了近10年来重新采样和研究的成果。我们阅读并参考了来自各个学科的数十篇期刊论文,以帮助我们更好地解答用户体验领域的问题。在这个过程中,我不仅找到了满意的答案,还学到了很多知识,结识了许多朋友。这其中便包括我的合著者——James R.Lewis。感谢在著书的整个过程中我的家人对我的包容和鼓励。
James的致谢感谢每一位使我对可用性研究和用户体验设计如此感兴趣的人,是他们让我对我这份事业乐此不疲——从我的合著者Jeff Sauro到IBM的用户体验团队,以及州立农业保险公司,他们是我最宝贵的学习财富,他们鼓舞了我对教育事业的不断追求。当然,还要感谢我的家人一直以来对我的支持和鼓励。
评价四: 这本书的辅助材料和索引系统做得非常出色,这对于一本需要频繁查阅参考的书籍来说至关重要。我特别留意了书后提供的术语对照表和参考文献部分,其详尽程度远超我的预期。参考文献的引用格式统一规范,方便读者进行更深层次的知识追溯,这体现了作者对学术规范的尊重。此外,书中穿插的一些小贴士和“思考题”区域,虽然不是核心内容,却极大地激发了我的批判性思维,它们往往是针对某个理论的潜在弱点或应用场景的延伸思考,迫使我不能仅仅满足于“知道”是什么,而要深入探究“为什么”以及“在什么情况下”更好。这种设计极大地增强了这本书作为学习资料的实用价值和生命力,它鼓励读者在阅读后主动去消化和挑战既有的知识结构,而不是被动地接受作者的结论。
评分评价二: 这本书的目录结构简直就是一场精心策划的旅行路线图,每一个章节的标题都充满了悬念和指向性,引导着读者从基础概念稳步走向高阶应用,这种循序渐进的编排方式极大地降低了初学者的心理门槛。我个人尤其欣赏它对理论框架的梳理,不同于市面上很多只罗列公式而不解释背景的书籍,这里的组织逻辑非常清晰,仿佛是邀请了一位经验丰富的老教授在你身旁,耐心地为你勾勒出整个学科的脉络。当我翻阅其中一个关于数据清洗与预处理的章节时,那种对细节的极致把控让我印象深刻——作者似乎料到了读者在实际操作中可能遇到的每一个“坑”,并提前给出了富有洞察力的建议。这种前瞻性的设计,让阅读过程不再是被动的接收信息,而更像是一种主动的、与作者进行深度思维碰撞的体验,我感觉自己每翻过一页,对整个领域的理解都在潜移默化中得到了巩固和深化。
评分评价三: 这本书的语言风格呈现出一种罕见的平衡感:既保持了学术著作应有的精确和严谨,又在关键时刻穿插了非常贴近实际案例的类比和解释,使得那些抽象的统计学原理不再是高不可攀的空中楼阁。我发现作者在阐述复杂概念时,很少使用那种故作高深的行话,而是倾向于用清晰、直白的口吻去描摹背后的逻辑和实际影响。比如,在讨论某种检验方法有效性的时候,作者没有直接丢出复杂的数学证明,而是构建了一个非常生动的场景,让我能立刻抓住这个方法的应用边界和局限性。这种“讲人话”的写作功底,对于那些希望将理论快速应用于工作实践的专业人士来说,无疑是巨大的福音。它成功地搭建起了一座桥梁,连接了象牙塔内的理论与职场中瞬息万变的真实需求,让学习过程充满了即时的成就感。
评分评价五: 阅读体验的流畅性很大程度上取决于译者的功力,而这本书的译文质量无疑达到了一个令人赞叹的高度。很多专业书籍的中文版常有“翻译腔”过重或术语不一致的问题,但这里的译者显然对用户体验和统计学的双重领域都有着深刻的理解。他们不仅准确地传达了原文的字面含义,更重要的是,成功地再现了原作者的论证节奏和语气。在处理那些需要精确表达的语气词或强调部分时,译者运用了非常地道的中文表达习惯,使得阅读体验几乎没有被语言障碍所打断。这种高质量的本地化工作,使得我们这些中文读者能够以接近母语阅读的效率,去吸收那些原本可能需要反复咀嚼才能理解的复杂信息,极大地提升了知识的吸收效率和阅读的连贯性。
评分好的,这是一份以读者口吻撰写的,针对《用户体验度量:量化用户体验的统计学方法(原书第2版)》的五段不包含原书内容的独立评价: 评价一: 这本书的封面设计给我留下了非常深刻的印象,那种沉稳的蓝色调配上清晰的字体,瞬间就将我拉入了一个严谨的学术氛围中。我拿到书的时候,首先关注的就是它的装帧和纸张的质感,说实话,在这个电子书普及的时代,手里捧着一本实体书,尤其是内容如此专业的书籍,翻阅起来的感觉是无可替代的。书的版式设计非常人性化,行距和字号的搭配让长时间阅读下来眼睛也不会感到特别疲劳,这一点对于需要细致钻研统计模型的读者来说至关重要。而且,我注意到书页的边缘处理得很细致,没有那种廉价的粗糙感,这在一定程度上提升了阅读的愉悦度。总的来说,初次接触这本书,它给我的感觉就是一本制作精良、值得信赖的工具书,光是拿在手上,就已经对后续的学习内容充满了期待和信心,这绝对不是那种粗制滥造的速成指南能比拟的。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有