内容简介
《汉语语音合成:原理和技术》介绍语音合成的原理和针对汉语的各项合成技术,以及应用的范例,全书分基础篇和专题篇两大部分.基础篇介绍语音合成技术的发展历程和作为语音合成技术基础的声学语音学知识,尤其是作者获得的相关研究成果(填补了汉语语音学知识中的某些空白),并对各种合成器的工作原理和基本结构进行系统的阐述.专题篇结合近十年来国内外技术发展的热点和方向,讨论韵律分析与建模、数据驱动的语音合成方法、语音合成数据库的构建技术、文语转换系统的评估方法、语音合成技术的应用等。
《汉语语音合成:原理和技术》面向从事语言声学、语音通信技术,特别是语音合成的科学工作者、工程技术人员、大学教师、研究生和高年级的大学生,可作为他们研究、开发、进修的参考书。
作者简介
吕士楠,1937年生,浙江新昌籍人氏.1960年大学毕业.1962年任中国科学院声学研究所实习研究员,1994年晋升为研究员,直至1999年退休,在语言声学研究方面曾获中国科学院自然科学一等奖和国家自然科学三等奖各一项.主攻汉语语音合成领域,曾承担国家自然科学基金、“863”项目和中国科学院重大项目,发表论文百余篇,现为中国声学学会会员、第五届声学学会常务理事、言语声学分会主任。
初敏,1995年于中国科学院声学研究所获博士学位,后在中国科学院声学研究所、英特尔和微软中国研究中心任职,在语音合成方面有突出贡献,在国内外核心期刊、会议上发表数十篇学术论文,成功申请国内外专利二十多项.2009年加入阿里云计算团队,任研究员、数据应用部门总监,负责大规模数据采集、处理和挖掘等工作。
许洁萍,1999年于中国科学院声学研究所获博士学位.曾任中国科学院计算机语言信息工程研究中心副主任、华建机器翻译有限公司副总经理,从事计算机口语翻译,特别是口语输出的研究,主持或承担国家自然科学基金项目两项,获省部级科技进步二等奖两项,发表论文四十余篇.现任中国人民大学信息学院副教授,从事音乐检索、言语节奏及其合成方面的研究。
贺琳,1992年大学毕业,自1993年以来一直在中国科学院声学研究所从事语言声学研究,特别是言语数据的收集和数据库的建立,十多年来在此领域积累了丰富经验,成功地为国内外语音技术研究和开发提供了多语种、多用途数据库数百个,已在国际上享有一定声望。现任中国声学学会语言、音乐和听觉分会委员,中文语言资源联盟委员会委员。
内页插图
目录
序一
序二
前言
基础篇
第1章 语音合成技术史的叙述
1.1 机械式语音合成器
1.1.1 Kempelen的讲话机
1.1.2 Euphonia讲话机
1.2 电子式语音合成器
1.2.1 VODER
1.2.2 模式播放器
1.2.3 共振峰合成器
1.3 基于计算机的语音合成
1.3.1 数字式共振峰语音合成技术
1.3.2 波形拼接合成技术
1.4 汉语语音合成的发展
1.4.1 汉语合成研究的先驱
1.4.2 国内汉语合成技术的研究
1.5 总结
参考文献
附录 合成语音样品
第2章 声学语音学
2.1 声学基础
2.1.1 空气中的声波
2.1.2 波动方程
2.1.3 声音在管予中的传播
2.2 言语交际过程
2.2.1 语音的产生
2.2.2 语音的感知
2.3 语音的声学特征
2.3.1 语音的时间维及频率维表示
2.3.2 频谱分析
2.3.3 语图和语音的频谱分析方法
2,3.4 元音的频谱
2.3.5 辅音的频谱
2.3.6 音轨
2.4 汉语普通话的音位系统
2.4.1 汉语普通话的辅音系统
2.4.2 汉语普通话的元音系统
2.4.3 汉语传统的声韵调系统
2.5 总结
参考文献
第3章 韵律
3.1 语调模型
3.1.1 “调核”理论和INTSINT语调模型
3.1.2 Pierrehumbert有限状态网络模型
3.1.3 Tilt语调模型
3.1.4 FLjisaki模型
3.1.5 PENTA模型
3.2 汉语普通话韵律的基本单元
3.2.1 词调
3.2.2 短语语调
3.3 句调和篇章韵律
3.3.1 语篇语调
3.3.2 朗读风格的影响
3.4 总结
参考文献
第4章 汉语文语转换系统
4.1 合成语音自然度的研究
4.1.1 合成语音自然度实验
4.1.2 音联对自然度的影响
4.1.3 汉语语句重音的声学表现
4.2 汉语共振峰合成系统
……
专题篇
后记
前言/序言
汉语语音合成:原理和技术 下载 mobi epub pdf txt 电子书 格式