语音用户界面设计：对话式体验设计原则 pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

[美] Cathy Pearl（凯瑟彼尔）著，王一行译

图书标签:

语音用户界面
对话式AI
用户体验设计
交互设计
人机交互
语音技术
自然语言处理
VUI设计
对话系统
智能助手

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到新城书站

book.cndgn.com

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

出版社：电子工业出版社

ISBN：9787121325557

版次：1

商品编码：12233175

品牌：Broadview

包装：平装

开本：16开

出版时间：2017-11-01

用纸：胶版纸

页数：336

具体描述

产品特色

编辑推荐

　　1.这是一本由设计专家呈现自己17年经验的语音界面设计经典！！
　　2.这是由阿里资深设计师倾情翻译的语音界面设计经典！！
　　3.这是阿里巴巴国际UED负责人傅利民、Designaffairs合伙人小猴科技创始人兼CEO刘力丹、同济大学设计创意学院副院长孙效华、物灵科技CEO前百度少帅顾嘉唯倾情作序力荐的语音界面设计经典！！
　　

内容简介

　　《语音用户界面设计：对话式体验设计原则》是一本由拥有17年从业经验的资深语音用户界面设计(VUI)系统设计专家CathyPearl撰写的语音设计经典，从VUI系统简史开始讲述，包括了语音用户界面设计的基本原则，VUI系统设计中必不可少的人物模型设计，还包括一些语音用户界面设计的进阶知识，如语音识别技术，自然语言理解、情感分析、数据收集和文本语音转换策略等，另外还介绍了语音界面用户测试的知识，以及VUI在投入实际使用后需要注意的地方，特别提到了包括家庭助理设备和可穿戴设备等如何设计VUI系统。
　　
　　

作者简介

　　Cathy Pearl，Sensely 用户体验总监，为Sensely 创造了富有同理心和对话性的虚拟护士形象。在Nuance和微软任职期间，为银行、航空、医疗公司设计了多款VUI系统，也是福特SYNC系统的设计师。在沃尔沃任职期间，她创造的对话式 ipad app 使用户可以从 Esquire magazine的生活专栏作家获得建议，与圣诞老人聊天或者与脱口秀演员说笑。

　　王一行，设计师。设计领域涉及交互设计、智能硬件设计、工业设计。曾先后任职于百度、网易，目前就职于阿里，从事平台设计创新工作。关注设计与技术背后的人文思考，致力于使技术为人道服务的设计实践。

第1 章导语 1
1.1 语音用户界面（VUI）简史 1
1.2 对话式用户界面 7
1.3 VUI 设计师是什么 11
1.4 聊天机器人 11
1.5 本章小结 14
第2 章语音用户界面基本设计原则 17
2.1 移动设备与 IVR 系统设计 17
2.2 对话式设计 21
2.3 设定用户期望 25
2.4 设计工具 28
2.5 确认策略 32
2.6 命令—控制模式和对话模式 41
2.7 对话式标识 50
2.8 异常处理 52
2.9 不要责怪用户 60
2.10 新手和专家用户 61
2.11 持续跟踪上下文 63
2.12 帮助和其他通用部分 68
2.13 延迟 72
2.14 消除歧义 74
2.15 设计文档 76
2.16 无障碍设计 78
2.17 本章小结 88
第3 章人物模型、虚拟形象、演员和视频游戏 91
3.1 人物模型 92
3.2 我的VUI 应该做成可视化的吗 98
3.3 使用虚拟角色时不该做什么 99
3.4 使用虚拟角色（或预先录制的视频）时该怎么做 103
3.5 我什么时候该在VUI 中使用视频 111
3.6 视觉VUI——最佳实践 113
3.7 视觉反馈（无虚拟角色） 124
3.8 选择一个声音 128
3.9 虚拟角色的优点 128
3.10 虚拟角色的缺点 132
3.11 本章小结 136
第4 章语音识别技术 139
4.1 选择语音识别引擎 139
4.2 语音打断 141
4.3 N-Best 列表 156
4.4 语音识别的挑战 158
4.5 数据隐私 165
4.6 本章小结 166
第5 章语音用户界面设计进阶 167
5.1 不同类型的语音输入 169
5.2 消除歧义 175
5.3 处理否定 182
5.4 捕获意图和对象 183
5.5 对话管理 184
5.6 不要晾着用户不管 187
5.7 VUI 要显示识别到的信息吗 188
5.8 情感分析和情绪检测 190
5.9 文本转语音和预录语音 193
5.10 说话者确认 197
5.11 “唤醒”词 199
5.12 语境 200
5.13 高级多模态交互 201
5.14 自助数据集 202
5.15 高级自然语言理解（NLU） 204
5.16 本章小结 209
第6 章语音用户界面的用户测试 211
6.1 VUI 用户测试的特殊考虑因素 211
6.2 用户及用例背景研究 212
6.3 为真实用户设计研究方案 214
6.4 早期测试 226
6.5 可用性测试 233
6.6 衡量测试结果 239
6.7 下一步计划 240
6.8 测试汽车、硬件设备和机器人的VUI 系统 241
6.9 本章小结 244
第7 章完成VUI 后，下一步该做什么 247
7.1 预发布测试 248
7.2 效果评估 252
7.3 日志 264
7.4 转录 266
7.5 发布阶段 268
7.6 调研 269
7.7 分析 270
7.8 工具 275
7.9 本章小结 278
第8 章带语音功能的设备和汽车 279
8.1 设备 279
8.2 汽车和无人驾驶车辆 295
8.3 本章小结 308
后记 309
附录书中提到的产品 311

精彩书摘

　　《语音用户界面设计：对话式体验设计原则》：
　　另一个使用热词的场景是，用户需要在对话中先暂停并完成一项操作。这种一般发生在用户需要去找一些物品来回答问题的时候，比如在续订处方的过程中，用户需要去拿一个药瓶来确认处方编号。此时系统问：“你需要一些时间来确认处方编号吗？”如果用户说“是的”，系统会提示用户在找到后说句“我回来了”或者“继续”。这也就相当于暂停了对话。
　　对于那些不仅仅依赖于语音的VUI系统，不建议经常使用打断功能。比如，如果你的VUI使用了预先录制的视频，就不应该使用打断功能。因为被打断时，预先录制的视频很难处理。难道视频应该突然停止吗？之后要从刚才停止的地方重新开始播放吗？当你的VUI系统有一个虚拟形象或者预先录制的视频时，它的体验会更像和一个真人进行交谈，用户往往会更有礼貌，并耐心等待系统把话说完。当虚拟形象或预录视频说话时，用户可能也在说话（与别人交谈），显然此时用户并不需要虚拟形象听自己说话。如果你的系统没有启用打断功能，请不要强制用户收听很长的列表或菜单，而应该把事情分成更多的步骤，并依靠可视化的列表来减轻认知负担。
　　……

前言/序言

　　推荐序一
　　我在用半语音、半打字的模式写下这段文字时，联想到语音用户界面的发展与互联网技术的发展非常类似。
　　在互联网时代来临之前，用户界面是以Windows为主的GUI，当用户需要工作、娱乐和游戏的时候，就购买相应的软件，安装后才可以使用。当时大部分的设计和研究方法都集中在独立程序上。大概在1998年，拨号上网时代结束，Web浏览器在功能上的完善让大家的眼光开始关注到互联网上，那时Amazon刚刚有了百万用户，WebVan和Pets.com正在蓬勃发展(这两款应用目前均已消失)。各种产品开始转向互联网，因为Web浏览器可以穿透各个程序，方便地把各种各样的内容和功能都呈现在前端页面上。之后，互联网给整个IT行业带来了深刻的变化，独立程序渐渐消失，取而代之的是在浏览器界面中的应用。
　　到了移动互联网的时代，一轮新的程序开发又开始了。App像雨后春笋一样涌现出来，满足用户在娱乐、游戏、工作等各个方面的需求，由于移动屏幕尺寸和网络速度的限制，单单使用一个简单的移动浏览器不能解决所有的问题。
　　语音和当年的浏览器一样，是一个可以穿透所有程序、解决用户所有问题的方法。当需要叫车服务的时候，我并不在乎是哪个软件在叫车，最好的情况是语音发出后，通过各个应用的比较，找出一个最佳的路线，并且最符合我使用习惯的叫车方案。语音是人类古老和自然的交互方式，在人工智能发展到可以部分理解语音的时候，语音时代开启了。语音除了在娱乐、游戏、工作上有广泛应用，还会广泛应用在IoT上。越来越多的设计师的工作会涉及语音界面设计。这本书的作者Pearl把自己17年的工作经验总结出来，介绍了语音界面的设计原则、语音识别技术、自然语言理解、语音用户研究方法，以及语音在设备上的应用。理论和实践相结合，非常实用！
　　这本书是天猫精灵设计团队的参考书之一，在使用过程中发现这本书非常有用，因此我们的设计师一行花时间把整本书翻译成中文分享给大家。
　　PaulFu
　　Sr.Director,UserExperience,AlibabaGroup
　　推荐序二
　　一行嘱我为他翻译的书写序，还没有看过是什么，我便欣然同意了。一行曾是我的学生。学生时代的一行就成熟得不像他的年龄。在初期时我对他说，“小心技术过于成熟而落入俗套。”事实证明我是错的。一行最大的特点是冷静并特立独行。每次问他问题，他先是沉默，想好后可以很缜密地回答，往往挑不出什么漏洞。基于这样的经验，之后的合作我便选择完全地相信他。所以我想一行精心挑选翻译的书籍，一定不会差。
　　一行陆续给我寄了原稿和翻译稿，我读后有一些感想：交互方式正从单纯的视觉、硬件交互转化为多感官综合的交互。每一次技术的变革都带来交互上的巨大挑战。“与机器像和人一样对话”，VUI不是一次升级，而是一个完全不同的新世界。这个世界正在来临，但又还有很多未知；这个全新的体验正呼之欲出，等待人们去定义。
　　VUI感性层面的需求比视觉交互和硬件交互更为复杂。除了合理的逻辑之外，场景、对话的上下文关联、角色的设定、语境的感知等都对用户体验起到了重要的作用。VUI像是给机器赋予一个新的性格。在这个领域也将产生不同的人才需求。最近遇见Dyson的设计师，他称自己为工程师，并解释他自己也不知道自己是什么样的定义，只知道伴随了产品整个的研发流程。在VUI领域，同时需要被打破的职业界限，需要更多元的职业类型介入去共同定义。他们可能是设计师，是开发者，是语言学家，是心理学家，是剧作家，等等。
　　最近我买了AmazonEcho,女儿每天早上向Echo问好。Echo没有屏幕，环转的灯光非常友好地展示了拟人化的倾听。我意识到VUI已经来了，它很聪明，但是又还很鲁莽；它让人兴奋，但又时时给人带来与机器对话的挫败感受。哪怕产品很智能，一个不好的VUI就像是一个聪明人无法倾听和表达一样无奈。在这个技术与设计并行发展的进程中，VUI还处在一个很早期的状态，会有很多令人困扰的问题：怎样的设计流程可以支持这个新的领域？VUI和屏幕交互是什么样的关系？什么样的场景最为适合？机器需要有什么样的性格？如何管理用户的期望值？如何弥补对话中带来的挫败体验？交互过程中的情感感受将会怎样？
　　VUI领域还没有太多的经验可以参考，设计教育界也还没有做好足够的应对，而这是一本来得如此及时的、难得的、实用的工具书。一行告诉我，书的内容只是一个开始，希望读者通过此书能开启一个全新的思考。
　　刘力丹
　　designaffairs合伙人、小猴科技创始人兼CEO
　　推荐序三
　　从软件工程转到工业设计专业，现在又在从事交互设计的工作，王一行一直是一个在自己喜欢的方向上执着钻研、追求完美的学生和设计师。当以往的学霸和红点得主来找我为他的译著写序时，我很是欣喜。非常钦佩一行哥（同学中的昵称）在阿里繁忙的工作之余还能挤出时间来学习新知识，并有心布道语音交互界面设计这一交互设计的新成员。
　　作为一种自然人机交互方式，语音交互由来以久，近年来更是被运用到了越来越多的产品之中，如从手机到智能产品、智能家居，从机器人到车载HMI。然而对语音交互的设计方法、流程，以及对其特有的设计问题的研究却非常匮乏。15年前在IBMT.J.Watson参与基于对话的语音交互系统的研究与应用实践，到现在进行多模态车载HMI的设计中，我大都是把语音交互作为交互系统中的一个重要元素加以运用。本书将语音交互作为一个与视觉交互界面（GUI）并列的界面类型，对其设计进行系统地分析、研究与实践指导，视角新颖，为对语音交互设计的深入研究打开了一片天地。相信一行精准到位的翻译可以将大家完美地带入这一交互设计的新领地。
　　孙效华
　　博士、教授、博士研究生导师
　　同济大学设计创意学院副院长，交互设计方向负责人
　　数字创意中心负责人
　　推荐序四
　　当很多人正在热议AI究竟是会帮助人类还是毁灭人类的时候，人工智能的浪潮正在悄然颠覆着我们生活的一点一滴。而基于CUI（ConversationalUserInterface，对话式用户界面）的智能产品，就好像是冲在AI浪潮最前沿的浪花，将隐藏其身下的算法和数据幻化成最能“直接拍打在用户皮肤上”的体验。作为一个新生的领域，VUI（VoiceUserInterface，语音用户交互界面）对于用户体验设计提出了更多语言学、情感塑造、逻辑搭建等方面的新要求，于是这样一本专业、全面的VUI设计指南的出现，就更显得弥足珍贵。
　　我在第一时间就和我的团队一起精读了英文原版，受益匪浅，相信中文译本的出版一定会帮助更多的共同前行的伙伴，受邀作序，备感荣幸。
　　就在我敲下这些文字的时候，大多数行业从业者都激进地把人工智能在人类历史上的重要性堪比、甚至远超过工业革命，很多人正担忧人工智能即将陆续取代一些职业并改造我们的社会化分工。我认为有一点是毫无疑问的，这是一个不可避免的智能时代，作为新生产工具的AI，除了在限定技术边界的垂直行业应用领域，各行各业都有机会被AI力收割“lowhangingfruits”来迅速提升各类生产效率，将对人类文明和产业变革产生重大影响。
　　回顾过去，机械设备的出现为人类带来了提升效能的工具，互联网的出现，将效能再次提升，而伴随着AI的出现，效能将进一步大规模提升。不可避免地说，在智能时代，大量重复性工作的人力工种肯定不复存在，还有很多具有结构化知识的经验性工作也会被机器智能所取代，甚至未来是创造性工作，但是更多的是通过为人赋能的方式，减轻社会劳动者和服务业的压力，将会重新进行一轮人类社会化分工。
　　在互联网时代，“连接”是核心关键词，如果C不能满足A和B的完整需求，那互联网有机会让A通过连接，跨过B和C直接找到D，但如果在一些场景和行业内B/C/D是稀缺性资源，那么这个情况在互联网时代就很难得到解决，AI的出现将有机会扭转这种供需关系。举例来说，以前用户看病花在预约和挂号的时间基本占到95%，真正用于医患有效沟通和问诊时间仅为5%。人工智能将代替以往所谓“互联网医疗”盲目且低效的连接，如VUI/CUI初诊问答机器人将患者进行分流，缩短医师护士等在预约和问询过程低效的重复时间，改善供需方的不对等关系。
　　大家都知道过去60年里人工智能经历了两次潮起潮落。现在我把这次AI的兴起，分为新AI时代的头十年和后十年。前十年是AI解决行业问题，比如前面讲的医疗、教育、信贷和金融风控等，通过大数据和机器学习迅速提升效率和准确率；新AI时代的后十年，机器智能将全面升级消费产品和用户生活场景，人工智能必将革新交互方式，进入计算无处不在的时代。下一代人机交互革命就在眼前，这将是一个激动人心的时代，就好比百年前蒸汽机、汽车、飞机等伟大产品的发明一样，如今将会出现大量被重新定义的智能产品，无人驾驶车、智能家居、家用机器人、下一个时代的个人助理等。当马车被汽车替代的时候，人们是措手不及的，同样的，AI时代的创新家们已经蓄势待发准备重新发明和改造今天陈旧的生活方式了。
　　我觉得赋能是人工智能对人类最重要的事情，因为这是人类进化需求的本质。人都渴望被赋能，这是天性。人发明蒸汽机、汽车、飞机、手机、计算机，从运动能力和生产效率等方面突破自身局限。大部分人沉迷于游戏，是因为在游戏中感受到自己被赋予了更大的权利和能力。这些都是顺应人性的事情，我觉得VUI最有价值的场景应用就是在人机交互过程中产生的便利性赋能。
　　无论是从云端到边缘在下一代硬件架构的变化，还是深度学习算法在图像识别和语音识别的单项上逐渐超过人类水平，AI的技术成熟度还在不断提升和进化过程，但是今天语音对话交互技术的发展尚还没有成熟到可以替代鼠标键盘和触摸屏。不过现阶段已经可以应用在一些特定场景下，比如用户双手不便下达快速指令、智能电视或者智能音箱上的跳步检索某一首歌或者某一个电影关键词，又或是实时机器翻译。但可以肯定的是，未来无处不在的
　　AI技术，必将带来交互的革命，颠覆的机会，也将属于那些极少数懂得技术边界、极具场景化思维、勇于革新的创新家们。
　　2016年，我和志同道合的小伙伴们一起创立了“物灵”。在工具化大工业产品思维主导的今天，我们希望去开辟另外一条路径，去创造人机共生的灵性世界。我们认为，人和产品的关系，在这个万物智能的时代，正在发生着巨大革新。我们经历了电器设备旋钮时代、键盘鼠标时代、触屏智能机时代，而现在万物智能时代的到来，很快就会将我们从鼠标键盘和低头点手机平板的触摸屏上解放出来，机器与人的交互会从不平等的单向被动模式转变为逐渐平等双向的多模态主动模式。而语音交互正是这个过程的第一步。我们认为这种互动模式的本质就是“关系”。我们把这种“基于关系的交互方式”称作RelationshipUI。物灵想要做的“智能/关系式交互”产品，不单单是计算机视觉、自然语言理解、深度学习、大数据等这些正在不断突破的AI技术的集合体，更加是一个让用户能体验到生命感，产生依赖，寄托情感的“灵物”。这本书里提到的Jibo机器人，正是RelationshipUI的一个很好的例子。我作为Jibo的董事长，物灵作为Jibo在中国的独家合作伙伴，我们和MIT的CynthiaBreazeal的团队也正在一起努力把这个可爱的小“灵物”带给中国的消费者。
　　当语音交互、智能匹配和个性化推送成为新一代用户的主流交互方式的时候，苹果构筑的那个以一个个各自为阵的App为核心的生态才能再一次瓦解——从移动互联到智能物联的转变，我们将经历ContextualUI取代SelectiveUI的产品形态。
　　而想要真正构建好这种产品和用户之间的“关系”，VUI无疑是最重要也是最自然的交互通道之一。在创业初期，我们的VUI团队一直在摸索如何设计对话内容和逻辑，创造Character，优化体验。不同于传统的GUI，由于缺乏系统性的指导和总结，我和团队做了很多的尝试，也走了很多的弯路。这本书的出现很好地帮助我们理清了VUI相关的基本框架和设计规则，而其中的很多观点，也和团队在实践过程中得到的经验有很好的切合。对每一个想要从事VUI相关领域的UX设计师、语言学家甚至工程师，这本书都能起到启蒙和指南的作用。
　　从我前面提到的AI前后十年的说法来看，当下我们所处的弱AI结合强产品的时代，还是有机会通过产品矩阵来形成现象级产品的，而这时正需要懂AI技术边界的设计师和产品人，来重新思考和设计使用场景。甚至都不是“寻找”应用场景了，而是要去“发明”应用场景的时代。创造出伟大的产品，在工程师把技术基础打造得差不多时，还是需要设计师、心理学家、社会学家等，去创造和拓展用户交互场景的疆界。
　　我们团队的一大常规团队建设内容就是一起重温那些经典的科幻电影，吸收灵感，也感叹原本只存在科幻电影里的人工智能，在这短短的几年就已经走进了我们的生活，甚至我们的现实已经在很多的场景下超越了科幻电影的设定。而我们深知，这短短几年AI爆发的背后，是几十年同行者在不同基础领域的不断积累，是像本书作者CathyPearl这样将近20年专注于VUI的探索和实践并著书立说、开放分享的精神。既然我们正在进入一个不可避免的智能时代，人机交互的下一轮革命就在各位眼前。人机共生的灵性世界不是用机器人来取代人类，而是赋能予人。未来已来，万物有灵，我们选择Allin。
　　顾嘉唯
　　物灵科技CEO，前百度少帅
　　译者序
　　因缘巧合，有幸翻译本书。这于作为设计学徒的我而言实是一种馈赠。
　　在与阿里巴巴国际UED用户体验设计的同事们进行语音交互研究的早期，我们第一时间购买了本书原版并进行了研读。这对于尚在摸索阶段的我们而言，不仅节约了大量的时间，更让我们体会到在当前的技术边界下，设计师在语音交互设计过程中的价值所在。随着项目进程的深入，我们愈发觉得需要有这样一本专业而系统的书，在可以预见的语音智能产品爆发之际，帮助在语音交互和智能硬件道路上探索和学习的伙伴们共同学习、进步。同时，我也希望本书能为每一个正在或有心从事语音设计相关领域的UX设计师或产品设计师，提供一个了解其行业背景、设计思维框架，以及相关技术现状的窗口，从而在日后的工作中能更从容地设计、探索、创造出更好的用户体验。能为行业尽绵薄之力，荣幸之至，不足之处还望海涵。
　　人工智能作为当下热门的细分科技领域，其带来的变革已经被推到了“第四次工业革命”的高度，并正在影响当下信息构成、生产和获取的方式。虽然早在1956年McCarthy就提出了“人工智能”的概念，但时至今日，大众才开始逐渐感受到其真正的价值和影响力。面对新一轮的科技爆炸，设计师需要重新思考，如何运用设计思维和想象力拓展技术的应用场景，探索新的交互方式，并赋予技术人性与人道，从而使新技术更好地赋能于人。
　　在这样的背景下，设计的客体不再只局限于屏幕内的内容，而是逐渐趋近于真实世界的全貌。多通道、全链路、多角色，以及去中心成为了设计的主旋律，这将促使设计师从更多维度进行设计探索。本书作者CathyPearl以其在语音交互设计领域17年的洞察为主线，深入挖掘了语音交互设计过程中每一个关键节点，及其对应的设计原则，并探讨了技术与体验的平衡。行文中还融入大量有代表性的行业真实案例，为我们带来了这本极富启发意义的语音交互设计指南。这在当今的时代背景下，有着特殊的价值。原作者CathyPearl在书中提醒读者“不要为了使用语音交互而使用语音交互”，这一点使我深受启发。相对于科技来说，人的生物属性决定了很多客观存在的限制。例如，对于大多数人而言，眼和口分别做两件不相关的事往往会使效率大打折扣。在设计多通道交互的时候也是这样。当你使用语音作为主要通道进行交互，线性传输的音频信息通过耳和口传递于人机之间时，很难排除来自视觉通道信息的干扰。此时我们可以通过视觉和语音的强关联性来强化语音交互（例如带屏幕的EchoShow），抑或是给用户的视线设计一个落点，减少其他的视觉干扰。视觉、听觉、味觉、
　　嗅觉、触觉，以某一个近似恒定的频次和信息比例与外界进行交互，体现了知觉恒常性。也是我在过往的IoT项目中，坚持遵循的原则之一。
　　设计是一门研究“人”的学科，重在理解人，而基于技术与数据的设计方法只是理解人的手段之一。基于人类自身行为特征的设计思维在新的设计背景下得以继承，而基于技术的设计方法在新技术的驱动下得以发展，两者相辅相成。CathyPearl以其近20年的从业经历，以立体和动态的视角梳理了语音智能体验设计的全流程，处理不同时代背景下用户体验和技术的制约与平衡，同时也为我们展现了设计在新技术背景下所面临的全新挑战，以及被赋予的全新意义。书中丰富的案例分析更为我们展现了一位成熟设计师面对当下复杂多样的生态系统，所展现出的极具包容性的思考框架。相信这将会成为未来多通道、全链路设计师的必备素养之一。
　　作为一本立足过去、面向未来的设计指南，原作者CathyPearl在有限的篇幅内，不仅探讨了人工智能背景下的情感化、游戏化设计，更在探讨中引入了图形学、语言学，乃至戏剧领域里的专业术语。这不仅使我们切实感受到作者广博的知识储备，更让我们看到设计领域存在的更多可能性，并时刻提醒我们：设计不应仅局限在已有的设计范畴内，更不应成为商业和技术的附加品，而是应该不断向外突破，与技术和商业互相驱动，共同进步。
　　于我而言，翻译本书的过程不仅是对新领域的探索，也是一次对设计方法系统的梳理。整本书所使用的设计框架对于新领域的探索极具价值，而单单只摘录对当前有用的部分，不足以体现这种价值。这也是我决定要将全书进行翻译出版的初衷。希望无论是体验设计师还是产品设计师，在面对新技术和新变化时，可以不再迷茫，并建立属于自己的设计思维框架。
　　在翻译的过程中，我也时常反思这几年学习和工作中面对设计时的思考，是否被既定的方法和流程限制了更多的可能性？是否过分注重屏幕而轻视了屏幕外的真实世界？如何在解决用户问题的同时，超出他们的心理预期以达成更大的满足？在万物AI化，信息横向拉平的未来，我们如何通过更多元的通道重塑自己的品牌？复合体验在给人们带来便利的同时，也在逐步瓦解单一介质（如印刷品、屏幕、声音）带来的感官刺激。产品以及背后的服务在失去传统营销抓手后，如何在AI生态中建立新的营销机制？有太多新的问题等待我们去发现，去解决。
　　最后，感谢我的家人在翻译过程中给予了我最坚实的支持；感谢王爽、洁君、夕圆、单卉等伙伴帮忙校对，使本书得以更好、更快地与各位见面；感谢阿里巴巴国际UED的同事们和天猫精灵团队，在项目初期能克服万难，坚定不移地在语音交互和消费级智能终端领域开疆辟土。感谢傅立民老师（Paul）、力丹老师、孙效华老师和嘉唯哥的信任，并在百忙之中抽空为本书作序。感谢出版社的孙老师，正是她独具慧眼的选题使得本书的中文版得以出版发行；感谢阿里巴巴的Paul和毛潇笑，让我有机会接触语音交互这个新领域。最后感谢所有能读到这本书的读者，由于译者才疏学浅，翻译中难免会出现一些问题或疏漏，请各位同行和专家不吝赐教，予以批评和指正。我非常欢迎来自各位的意见和反馈，并会基于此做出正与改进。谢谢。那么，就请开始阅读吧。
　　王一行
　　阿里巴巴高级交互设计师

《聆听未来：打造直观、高效的语音交互新体验》我们正身处一个由声音驱动的时代。从清晨的智能音箱播报天气，到车载导航系统的语音指令，再到各类应用程序中便捷的语音助手，声音已经成为我们与数字世界互动越来越重要的桥梁。然而，要真正实现流畅、愉悦且富有成效的语音交互，绝非易事。这其中蕴含着深邃的设计哲学与精妙的实践技巧。《聆听未来：打造直观、高效的语音交互新体验》正是为探索这一前沿领域而生，它旨在揭示如何通过精心设计的语音用户界面（VUI），为用户创造出前所未有的智能、便捷和人性化的数字体验。本书并非一本技术手册，更非对现有语音技术的简单罗列。相反，它致力于深入剖析语音交互设计的核心——用户体验。我们相信，最成功的语音界面，是那些能够“听懂”用户意图、理解用户情绪、并以最自然、最符合人类沟通习惯的方式做出回应的界面。这意味着我们需要超越单纯的命令与执行，去理解对话的本质，去感知上下文的细微之处，去预测用户的下一步需求。一、洞察人声的魔力：理解语音交互的本质语音交互之所以迷人，在于它模拟了人类最古老、最直观的沟通方式。从婴儿咿呀学语到成年人间的复杂对话，声音承载着信息、情感和意图。本书将从这一基本原理出发，带领读者深入理解语音交互的独特魅力与挑战。声音作为信息载体：声音不仅仅是声波，它包含了音调、语速、停顿、甚至语气中的细微变化。这些元素共同构建了信息的丰富层次。我们将探讨如何识别和利用这些声学特征，来传递更清晰、更具表现力的信息。对话的艺术：人类对话是动态的、有上下文的、且充满互动的过程。与传统的图形用户界面（GUI）不同，语音交互需要模拟这种自然的对话流程。本书将深入分析对话的结构、逻辑以及常见的对话模式，帮助读者理解如何设计出听起来“像人话”的交互。上下文的重要性：在一次持续的对话中，前一次的发言往往会影响下一次的回应。语音界面需要具备强大的上下文理解能力，才能避免重复提问或给出不相关的答案。我们将探讨如何捕捉和管理对话的上下文信息，构建连贯的交流体验。用户心理的考量：人们在与语音助手互动时，会有不同的心理预期和行为模式。有些人期待精准的指令执行，有些人则希望得到更具同理心的回应。本书将分析用户的心理模型，以及如何设计出能够满足不同用户需求的声音界面。二、倾听用户心声：从用户需求出发的设计优秀的设计始于对用户的深刻理解。在语音交互领域，这一点尤为关键。我们不仅要理解用户“说什么”，更要理解用户“为什么这么说”，以及他们“想要什么”。用户研究的维度：本书将强调用户研究在语音设计中的核心地位。我们将探讨如何通过用户访谈、情境观察、用户画像等方法，深入挖掘用户的真实需求、痛点和期望。特别是在语音交互场景下，用户的使用环境（如嘈杂的户外、安静的家中）和使用目的（如快速获取信息、进行复杂操作）将成为关键的考量因素。定义清晰的用户场景：语音界面并非万能，也不是适用于所有场景。识别并聚焦于最能发挥语音优势的核心用户场景至关重要。本书将指导读者如何为语音产品定义明确的用户场景，并据此进行有针对性的设计。例如，为驾驶员设计的车载语音系统，其设计原则将与为居家老人设计的智能家居语音助手截然不同。角色与个性的塑造：语音助手是否应该拥有“个性”？它应该是什么样的声音？这本书将引导读者思考语音助手的角色定位，以及如何通过声音设计（如语速、音调、用词风格）来塑造一个符合品牌形象和用户期望的虚拟助手。这种“人设”的建立，是提升用户情感连接和信任感的重要途径。包容性与可访问性：语音交互的优势之一在于其天然的包容性，可以帮助那些难以使用传统界面的用户。本书将深入探讨如何设计出能够适应不同口音、语速、甚至有发音障碍用户的语音界面，确保技术的普惠性。三、构建对话的桥梁：设计原则与实践策略在理解了语音交互的本质和用户需求后，本书将进入核心的设计环节。我们将提炼出一系列行之有效的语音用户界面设计原则，并辅以具体的实践策略，帮助读者将理念转化为可操作的设计方案。清晰与简洁：语音信息的传递要求极高的清晰度和简洁性。用户无法像操作GUI那样反复查看，一次失误就可能导致整个交互流程中断。我们将详细阐述如何设计出易于理解的提示语、准确识别用户意图的听取策略，以及避免冗余的表达方式。意图识别与歧义处理：语音识别的准确性虽然日益提高，但用户表达的歧义仍然是设计的挑战。本书将探讨各种意图识别技术（如关键词识别、自然语言理解）的应用，以及在识别不确定时，如何通过巧妙的追问和确认来解决歧义，引导用户走向正确的路径。反馈与确认机制：用户需要知道他们的指令是否被正确理解，系统是否正在执行。有效的反馈和确认机制是建立用户信任的关键。我们将介绍多种反馈形式（如语音提示、视觉提示、声音提示）的设计，以及何时使用何种反馈方式更为恰当。错误处理与恢复：任何交互都可能出错。如何设计出能够优雅处理错误、并帮助用户快速恢复的机制，是衡量语音界面成熟度的重要标准。本书将提供一套系统性的错误处理设计方法，让用户在遇到问题时，能够感受到被理解和被引导。引导与探索：对于初次使用的用户，或者当他们不确定如何操作时，提供有效的引导和探索机制至关重要。本书将探讨如何设计出引导性的对话流程，让用户在与系统互动中逐步熟悉和掌握其功能。多模态交互的融合：语音交互并非孤立存在，它常常与视觉、触觉等其他交互方式相结合，形成更丰富、更强大的多模态体验。本书将深入探讨如何在语音界面中融合图形界面、触摸操作等，实现“声画联动”或“声触联动”，从而提升用户体验的维度。例如，在回答复杂问题时，语音可以提供概要，而屏幕则可以展示详细图表。性能与响应速度：用户对语音交互的响应速度有很高的期望。漫长的等待会极大地损害用户体验。本书将强调在设计中考虑性能优化，以及如何通过设计策略来管理用户对等待时间的感知。用户旅程的优化：语音交互的成功在于其能否顺畅地融入用户的生活或工作流程。我们将引导读者从用户的完整旅程出发，审视语音界面在整个用户旅程中的定位和作用，确保其真正成为提升效率、简化流程的有力工具。四、聆听未来，创造价值《聆听未来：打造直观、高效的语音交互新体验》不仅是一本关于设计方法的书，更是一份对未来人机交互趋势的深刻洞察。随着人工智能技术的飞速发展，语音交互的应用场景将日益广泛，其重要性也将愈发凸显。本书旨在为设计师、产品经理、开发者以及任何对未来交互充满好奇的人提供一套系统性的思维框架和实用的设计工具。通过学习本书，您将能够：深刻理解语音交互设计的核心理念。掌握从用户需求出发进行语音界面设计的方法。掌握一系列行之有效的语音对话设计原则和策略。识别和规避常见的语音交互设计陷阱。为您的产品或服务设计出更具吸引力和竞争力的语音交互体验。预见并拥抱语音驱动的未来。让我们一起，用声音连接世界，用设计创造更美好的未来。

用户评价

评分☆☆☆☆☆

刚拿到这本书，就觉得它封面设计很特别，不是那种常见的科技蓝或银色，而是用了一种比较柔和的绿色，搭配一些抽象的波浪纹和圆点，营造出一种“对话”和“流动”的感觉。这与“语音用户界面设计”这个主题非常契合，仿佛在暗示着一种轻松、自然的交互方式。书的副标题“对话式体验设计原则”让我觉得它很有针对性。我之前接触过一些关于UI/UX设计的书籍，但专门针对“对话式”体验的还不多。在智能化的浪潮下，我们越来越依赖于语音和文字进行信息获取和任务完成，如何让这些交互过程更符合人类的交流习惯，是当下非常关键的课题。我注意到这本书的前言部分，作者花了很大的篇幅来阐述“以用户为中心”的设计理念。这让我感觉作者不仅仅是技术导向，而是真正站在用户的角度去思考问题。它会探讨如何理解用户的需求、用户的习惯，以及用户在与语音界面互动时可能遇到的痛点，并给出相应的解决方案。我个人对书中可能包含的“设计原则”非常感兴趣。比如，在设计一个对话流程时，我们应该遵循哪些基本原则？如何确保用户能够清晰地理解系统的意图，并有效地表达自己的需求？是否会涉及一些心理学原理，例如认知负荷、记忆规律等，来指导设计？这些都是我在实际工作中经常思考的问题，希望这本书能给我带来启发。我还在考虑，这本书是否会分享一些“黄金法则”或者“银弹”来解决语音设计中的常见难题。例如，如何处理用户的跑题、如何进行错误纠正、如何提供帮助和引导等等。如果书中能提供一些切实可行的方法和最佳实践，那将极大地提高其实用性。整体而言，这本书给人的感觉非常贴近实际应用，并且具有前瞻性。它不仅是在介绍一种新的设计领域，更是在引领一种新的交互方式的思考方向，值得深入阅读。

评分☆☆☆☆☆

这本书的封面设计相当简洁，但信息量却很足。深蓝色的背景配以一行行白色和浅灰色的文字，营造出一种科技感和专业感，很容易让人联想到“语音”和“界面”这两个核心概念。封面上“语音用户界面设计”几个大字非常醒目，下面的副标题“对话式体验设计原则”则进一步明确了本书的侧重点，让人能直观地感受到它所探讨的内容是关于如何让人们与机器进行更自然、更流畅的交互。我注意到作者在书的介绍部分，强调了“对话式体验”的重要性。在如今智能音箱、语音助手遍地开花的时代，用户对语音交互的期待也越来越高。过去那种生硬、机械的指令式交互方式已经难以满足需求，取而代之的是一种更贴近人际对话的模式。这本书似乎就抓住了这个痛点，深入探讨了如何通过设计，让语音交互不仅仅是“听懂”用户，更能“理解”用户，并以一种富有同理心、富有情感的方式回应。从书名和副标题来看，这本书很可能不仅仅是关于技术实现，更侧重于“设计原则”。这意味着它会从用户体验的角度出发，探讨如何在设计中融入人性化的考量，如何让用户在与语音界面交互时感受到舒适、便捷甚至愉悦。这对于正在从事产品设计、交互设计，或者对人工智能交互感兴趣的读者来说，无疑是一本非常有价值的参考书。我对书中关于“对话式体验”的具体原则非常好奇。例如，它会如何解释“自然语言理解”在设计中的应用？如何设计出能够处理复杂语境、用户意图模糊，甚至是带有情感色彩的对话？书中是否会提供实际案例分析，展示一些优秀语音交互设计的成功之处，以及可能遇到的挑战和解决方案？这些都是我非常期待在书中找到答案的问题。总而言之，这本书的出现，恰逢其时。随着语音技术的发展，语音用户界面设计已经成为一个日益重要的领域。我希望这本书能为读者提供一套系统性的设计方法论，帮助我们更好地理解和构建下一代的智能交互体验，让科技真正地融入我们的生活，带来更美好的体验。

评分☆☆☆☆☆

不得不说，这本书的书名非常抓人眼球，“语音用户界面设计”本身就代表着未来趋势，而“对话式体验设计原则”则精准地指出了其核心价值。在当前人工智能技术飞速发展的背景下，语音交互已经不再是遥不可及的概念，而是逐渐融入我们生活的方方面面，从智能手机的语音助手到家中的智能音箱，再到汽车的车载系统。我特别好奇书中对于“对话式体验”的定义和具体阐述。在我的理解中，这不仅仅是让机器能够听懂我们说的话，更重要的是能够“理解”我们的话，并以一种符合人类交流习惯的方式进行回应。这本书是否会深入探讨如何设计出富有同理心、能够理解用户情绪、甚至带有一定个性的语音界面？这涉及到更深层次的人机情感交互，是当前设计领域一个非常值得探索的方向。我也非常期待书中关于“设计原则”的详细介绍。例如，在设计一个对话时，如何平衡信息的传递效率和用户体验的流畅性？如何设计出清晰的指令和反馈机制？如何处理用户可能出现的各种意想不到的输入？这些都需要一套系统性的设计方法论来指导。我希望书中能够提供一些具体的设计模式、框架，甚至是启发式的思考方式，来帮助读者更好地应对这些挑战。另外，这本书的作者似乎在试图连接技术和人文。在封面上，除了科技感十足的文字，还有一些柔和的线条和色块，给人一种亲切感。这可能预示着书中不仅仅会涉及技术性的设计指南，还会包含对人类行为、心理学以及社交互动模式的深刻理解，并将这些元素巧妙地融入到语音界面的设计中。我隐约感觉到，这本书不仅仅是为技术开发者准备的，更是为产品经理、交互设计师、内容创作者，甚至是对人工智能交互感兴趣的普通读者提供的。它应该能够帮助我们更清晰地认识到语音交互的潜力和局限性，并为我们提供设计未来智能生活所需的核心知识。

评分☆☆☆☆☆

这本书的装帧很厚实，拿在手里很有分量，这通常意味着内容会比较充实。我翻阅了一下目录，看到了一些我非常感兴趣的章节标题，比如“意图识别与槽填充”、“对话流程设计”、“多轮对话管理”，还有“情感化设计在语音交互中的应用”。这些标题都直接指向了语音交互的核心技术和设计难点，让我对书中内容的深度和广度有了初步的期待。我特别关注“多轮对话管理”这一部分。在实际使用语音助手时，经常会遇到这样的情况：我提出了一个问题，它回答了，但我需要根据它的回答继续提问，这时候如果它无法记住之前的对话上下文，就会让人非常沮丧。这本书如果能提供有效的策略和方法来解决这个问题，那将是非常有价值的。它是否会介绍一些先进的模型或算法？或者提供一套实用的设计模式？此外，“情感化设计”这个概念也让我眼前一亮。我们期望与智能设备交互，不仅仅是得到冰冷的指令性回应，而是能感受到一些温度。这本书是否会探讨如何通过语音语调、回应的语速、甚至是一些拟人化的表达方式，来提升用户的体验？这需要对用户心理和情感的深刻洞察，我很好奇作者是如何将其融入到设计原则中的。我粗略浏览了其中几页，发现书中用了很多图示和流程图来解释复杂的概念，这对于理解抽象的设计原则非常有帮助。例如，在解释“对话流程设计”时，作者似乎用了一个树状图来展示不同的用户意图和对应的系统反应，清晰明了。这种可视化呈现方式，让原本可能晦涩难懂的理论变得更加易于接受。总的来说，这本书给我的第一印象是非常专业且有深度。它不仅仅停留在对语音技术本身的介绍，而是将重点放在了如何运用设计来创造出令人满意的“对话式体验”。这对于想要在这个领域深耕的从业者来说，无疑是一本不可多得的宝藏。

评分☆☆☆☆☆

看到这本书的封面，第一眼就感觉到了它扑面而来的专业感和前沿性。“语音用户界面设计”这个主题，本身就代表着当前科技发展的一个重要方向。而“对话式体验设计原则”更是直击痛点，我们现在越来越习惯于通过语音来与设备进行交流，但很多时候的体验并不尽如人意，所以这本书的出现，恰好满足了市场和读者的需求。我之所以对这本书充满期待，是因为“对话式体验”这个概念本身就蕴含着巨大的想象空间。它不仅仅是简单的指令与反馈，更关乎人与机器之间能否建立起一种自然、流畅、甚至是有温度的交流。这本书是否会深入探讨如何设计出能够理解用户意图、预测用户需求，并且能够在复杂语境下进行有效沟通的语音界面？这涉及到很多深层次的认知和情感设计。而且，书中提及的“设计原则”让我非常好奇。在设计语音交互时，有哪些是必须遵循的“黄金法则”？如何避免那些让用户感到沮丧的“反模式”？是否会分享一些经过验证的、可复用的设计模式和方法论？例如，如何设计一个清晰的欢迎语？如何优雅地处理用户的错误输入？如何引导用户完成任务？这些都是我在实际工作中经常会遇到的问题。我特别想知道，这本书是否会提供一些实际的案例分析。通过分析一些优秀的语音交互设计，或者一些失败的案例，来印证其设计原则的有效性。例如，某个智能音箱的语音助手是如何通过巧妙的设计，提升了用户的使用体验？或者，某个APP的语音交互为何让用户望而却步？这些实实在在的例子，往往比空泛的理论更有说服力。总而言之，这本书给人的感觉是既有理论深度，又有实践指导意义。它不仅是对语音用户界面设计这一新兴领域的系统梳理，更是对未来人机交互方式的一次深刻探索，我相信它能够为读者提供宝贵的启示和实用的工具。

评分☆☆☆☆☆

工作上要用的，希望能有帮助，京东活动很给力，每次都买好多

评分☆☆☆☆☆

不错，是正品

评分☆☆☆☆☆

非常实用的书籍，可以避免需求方不懂设计上如何处理

评分☆☆☆☆☆

发货很快，京东购物就是方便，支持

评分☆☆☆☆☆

应该说是语音交互设计的，必读的一本书啦，很有参考价值

评分☆☆☆☆☆

东方大厦大烦死哒阿萨德发