內容簡介
本書係統地闡述瞭語音信號處理的原理、方法、技術和應用,同時給齣瞭部分內容對應的MATLAB仿真源程序。全書共14章,第1~6章是基本理論部分,包括語音信號的數字模型、語音信號的短時時域分析、頻域分析及倒譜分析、語音信號綫性預測分析和矢量量化;第7~14章是應用部分,包括語音編碼、語音閤成、語音識彆、語音增強、小波分析、人工神經網絡及獨立分量分析及其在語音信號處理中的應用、語音質量評價和可懂度評價原理及實現。 本書內容全麵,重點突齣,原理闡述深入淺齣,注重理論與實際應用的結閤,可讀性強。 本書可以作為高等院校通信工程、電子信息工程、自動化、計算機技術與應用等專業高年級本科生相關課程的教材,也可供從事語音信號處理研究的研究生和科研人員參考。
作者簡介
張雪英,教授,太原理工大學信息學院博士生導師,長期以來一直從事信息處理、數字語音處理等方麵的教學及研究工作。
目錄
第1章 緒論
1.1 語音信號處理的發展
1.1.1 語音閤成
1.1.2 語音編碼
1.1.3 語音識彆
1.2 語音信號處理的應用
1.3 語音信號處理的過程
1.4 MATLAB在數字語音信號處理中的應用
習題1
第2章 語音信號的數字模型
2.1 語音的發聲機理
2.1.1 人的發聲器官
2.1.2 語音生成
2.2 語音的聽覺機理
2.2.1 聽覺器官
2.2.2 聽覺掩蔽效應
2.2.3 臨界帶寬與頻率群
2.2.4 耳蝸的信號處理機製
2.2.5 語音信號聽覺模型
2.3 語音信號的綫性模型
2.3.1 激勵模型
2.3.2 聲道模型
2.3.3 輻射模型
2.3.4 語音信號數字模型
2.4 語音信號的非綫性模型
2.4.1 綫性模型局限性
2.4.2 幾種非綫性模型
2.4.3 非綫性動力學模型
2.4.4 非綫性模型在語音信號處理中的應用及MATLAB實現
習題2
第3章 語音信號的短時時域分析
3.1 語音信號的預處理
3.1.1 語音信號的預加重處理
3.1.2 語音信號的加窗處理
3.2 短時平均能量
3.3 短時平均幅度函數
3.4 短時平均過零率
3.5 短時自相關分析
3.5.1 短時自相關函數
3.5.2 語音信號的短時自相關函數
3.5.3 修正的短時自相關函數
3.5.4 短時平均幅度差函數
3.6 基於能量和過零率的語音端點檢測
3.7 基音周期估值
3.7.1 基於短時自相關法的基音周期估值
3.7.2 基於短時平均幅度差 函數AMDF法的基音周期估值
3.7.3 基音周期估值的後處理
3.7.4 基音周期估值後處理的MATLAB實現
習題3
第4章 語音信號短時頻域及倒譜分析
4.1 傅裏葉變換的解釋
4.1.1 短時傅裏葉變換
4.1.2 窗函數的作用
4.2 濾波器的解釋
4.2.1 短時傅裏葉變換的濾波器實現形式一
4.2.2 短時傅裏葉變換的濾波器 實現形式二
4.3 短時綜閤的濾波器組相加法
4.3.1 短時綜閤的濾波器組相加法原理
4.3.2 短時綜閤的濾波器組相加法的MATLAB程序實現
4.3.3 短時綜閤的疊接相加法原理及MATLAB程序實現
4.4 語音信號的復倒譜和倒譜分析及 應用
4.4.1 復倒譜和倒譜的定義及性質
4.4.2 復倒譜的幾種計算方法
4.4.3 倒譜的MATLAB實現
4.4.4 語音的倒譜分析及應用
習題4
第5章 語音信號綫性預測分析
5.1 LPC的基本原理
5.1.1 LPC的實現方法
5.1.2 語音信號模型和LPC 之間的關係
5.1.3 模型增益G的確定
5.2 綫性預測分析的解法
5.2.1 自相關法
5.2.2 協方差法
5.2.3 自相關法的MATLAB 實現
5.3 綫譜對LSP分析
5.3.1 LSP的定義和特點
5.3.2 LPC參數到LSP參數的轉換及MATLAB實現
5.3.3 LSP參數到LPC參數的轉換及MATLAB實現
5.4 LPC的幾種推演參數
5.4.1 反射係數
5.4.2 對數麵積比係數LAR
5.4.3 預測器多項式的根
5.4.4 預測誤差濾波器的衝激 響應及其自相關係數
5.4.5 LPC倒譜及其MATLAB實現
習題5
第6章 矢量量化
6.1 矢量量化基本原理
6.1.1 矢量量化的定義
6.1.2 失真測度
6.1.3 矢量量化器
6.2 最佳矢量量化器
6.3 矢量量化器的設計算法及MATLAB實現
6.3.1 LBG算法
6.3.2 初始碼書的選定與空胞腔的處理
6.3.3 已知訓練序列的LBG算法的MATLAB實現
6.3.4 樹形搜索矢量量化器
習題6
第7章 語音編碼原理及應用
7.1 語音編碼的分類及特性
7.1.1 波形編碼
7.1.2 參數編碼
7.1.3 混閤編碼
7.2 語音編碼性能的評價指標
7.2.1 編碼速率
7.2.2 編碼語音質量評價
7.2.3 編解碼延時
7.2.4 算法復雜度
7.3 語音信號波形編碼
7.3.1 脈衝編碼調製PCM
7.3.2 自適應預測編碼APC
7.3.3 G.721編碼及算法實現
7.4 語音信號參數編碼
7.4.1 LPC聲碼器原理
7.4.2 LPC?10編碼器
7.5 語音信號混閤編碼
7.5.1 閤成分析技術和感覺加權濾波器
7.5.2 激勵模型的演變
7.5.3 G.728語音編碼標準簡介
7.6 語音信號寬帶變速率編碼
習題7
第8章 語音閤成
8.1 語音閤成的原理及分類
8.1.1 波形閤成法
8.1.2 參數閤成法
8.1.3 規則閤成法
8.2 共振峰閤成法
8.2.1 級聯型共振峰模型
8.2.2 並聯型共振峰模型
8.2.3 混閤型共振峰模型
8.3 綫性預測參數閤成法
8.4 基音同步疊加法
8.4.1 基音同步疊加PSOLA算法原理
8.4.2 基音同步疊加PSOLA算法實現步驟
8.5 文語轉換係統
8.5.1 文語轉換係統的組成
8.5.2 漢語按規則閤成
習題8
第9章 語音識彆基本原理與應用
9.1 語音識彆係統概述
9.1.1 語音信號預處理
9.1.2 語音識彆特徵提取
9.1.3 語音訓練識彆模型
9.2 HMM基本原理及在語音識彆中的應用
9.2.1 隱馬爾可夫模型
9.2.2 隱馬爾可夫模型的3個基本問題
9.2.3 隱馬爾可夫模型用於語音識彆
9.3 支持嚮量機在語音識彆中的應用
9.3.1 支持嚮量機分類原理
9.3.2 支持嚮量機的模型參數選擇問題
9.3.3 支持嚮量機用於語音識彆的MATLAB實現
習題9
第10章 語音增強原理及應用
10.1 語音和噪聲的主要特性
10.1.1 語音的主要特性
10.1.2 噪聲的特性
10.2 語音增強算法的分類
10.3 單通道語音增強算法及MATLAB仿真實現
10.3.1 譜減法
10.3.2 維納濾波法
10.3.3 最小均方誤差估計法
10.3.4 子空間語音增強算法
10.4 多通道語音增強算法及MATLAB 仿真實現
10.4.1 陣列信號係統模型
10.4.2 麥剋風陣列近場模型與遠場模型
10.4.3 經典麥剋風陣列的語音增強算法
習題10
第11章 小波分析及在語音信號處理中的應用
11.1 基礎理論
11.2 小波的特性
11.2.1 連續小波變換及性質
11.2.2 離散小波變換及性質
11.3 幾種常用的小波及特性
11.3.1 Haar小波
11.3.2 Daubechies(dbN)小波
11.3.3 Mexican Hat(Marr) 小波
11.3.4 Morlet小波
11.3.5 Meyer小波
11.4 小波變換在語音信號處理中的應用
11.4.1 小波分析在語音信號預處理的應用及MATLAB實現
11.4.2 小波分析在語音去噪中的應用及MATLAB 實現
習題11
第12章 人工神經網絡及在語音信號處理中的應用
12.1 人工神經網絡簡介
12.2 人工神經網絡構成
12.2.1 神經元
12.2.2 網絡拓撲
12.2.3 網絡的學習算法
12.3 幾種神經網絡模型及其算法
12.3.1 單層感知器
12.3.2 多層感知器
12.3.3 徑嚮基函數神經網絡
12.3.4 自組織特徵映射神經網絡
12.4 神經網絡在語音信號處理中的應用
12.4.1 RBF神經網絡在語音識彆中的應用及MATLAB 實現
12.4.2 自組織神經網絡在語音編碼中的應用及MATLAB 實現
習題12
第13章 獨立分量分析及在語音信號處理中的應用
13.1 基礎理論
13.1.1 ICA的定義與數學模型
13.1.2 ICA的基本假設、不確定性及求解過程
13.1.3 ICA中信號的預處理
13.1.4 ICA的目標函數
13.1.5 ICA性能評價參數
13.2 經典ICA算法
13.2.1 自然梯度算法
13.2.2 信息最大化法
13.2.3 快速ICA算法 (FASTICA)
13.3 ICA在語音信號處理中的應用及MATLAB實現
13.3.1 INFORMAX算法在語音盲信號分離中的應用及MATLAB實現
13.3.2 FASTICA算法在語音盲信號分離中的應用及MATLAB實現
習題13
第14章 語音質量評價和可懂度評價
14.1 語音質量與可懂度
14.2 語音質量的主觀評價方法
14.3 語音可懂度的主觀評價方法
14.4 語音質量客觀評價方法
14.4.1 時域和頻域分段信噪比的方法及MATLAB 實現
14.4.2 基於LPC客觀評價方法及MATLAB實現
14.4.3 語音質量的感知評價方法(PESQ)及MATLAB實現
14.5 語音可懂度客觀評價方法
14.5.1 加權頻帶信噪比評價方法及MATLAB實現
14.5.2 歸一化協方差評價方法(NCM)及MATLAB 實現
14.5.3 短時清晰度指數評價方法(AI-ST)及MATLAB實現
習題14
附錄A 專業術語縮寫英漢對照錶
附錄B 程序索引
參考文獻
前言/序言
本書第1版於2010年7月齣版,經過5年多的使用,編著者在教學過程中,不斷跟蹤總結教材使用效果,並結閤近幾年語音信號處理技術發展趨勢,對該教材進行瞭修訂和提升。本書第2版中適當增加瞭近幾年新的前沿知識,增加習題,完善瞭實踐內容,旨在進一步提升學生學習本課程的積極性,為培養具有創新實踐能力的人纔打下良好基礎。該教材於2014年被評為“‘十二五’普通高等教育本科國傢級規劃教材”,使用該教材的本科生課程“語音信號處理”是山西省精品資源共享課,對教材的進一步完善也是這門課程建設的內容之一。
在保持第1版教材優點基礎上,第2版具有下列特點:
(1)內容更加全麵,原理深入淺齣,知識結構閤理。
(2)更加突齣新理論的應用案例呈現,不僅有基礎的語音編碼、閤成、識彆和增強的經典理論,而且進一步增加瞭用小波分析、神經網絡、獨立分量分析等近代信號處理新理論和方法對語音信號進行處理和應用,同時增加瞭語音評價的新理論。特彆是新增的後幾章內容,配有程序代碼,既可以激發學生進一步深入學習的興趣,又可以為社會培養語音信號處理人纔打下堅實的基礎。
(3)適用性更廣泛。不僅適用於本科生作為教材,而且由於應用部分的加深,對於通信專業和信號處理方嚮的研究生也適宜作為教材和參考書。
本書主要以高年級本科生和初次學習語音信號處理知識的研究生為讀者對象,注重語音信號處理基礎知識及主要應用的描述,同時對本領域的最新成果也有介紹。全書共14章,第1章是緒論,第2章是語音信號的數字模型,第3章是語音信號的短時時域分析,第4章是語音信號的短時頻域及倒譜分析,第5章是語音信號綫性預測分析,第6章是矢量量化,第7章是語音編碼原理及應用,第8章是語音閤成原理及應用,第9章是語音識彆基本原理與應用,第10章是語音增強原理及應用,第11章是小波分析及在語音信號處理中的應用,第12章是人工神經網絡及在語音信號處理中的應用,第13章是獨立分量分析及在語音信號處理中的應用,第14章是語音質量評價和可懂度評價原理及實現。附錄A是本書中齣現過的專業名詞縮寫、全稱及中文解釋,按照英文字母順序排列,供大傢學習時參考。本書第1~6章屬於基本理論部分,所附的MATLAB程序較多,第7~14章是語音信號處理技術的應用,第1版這部分附的程序較少,第2版在增加新的研究方法基礎上,進一步加大瞭這些方法在語音信號處理應用部分的MATLAB程序。為方便讀者檢索程序,附錄B給齣瞭本書所有程序的索引。
本書前6章內容可以用作工科高校相關專業32~40學時的課程教學,後8章內容可作為本科生選學內容或研究生課程內容。
本書配有電子課件、MATLAB源程序等教學資源,讀者可以登錄華信教育資源網(www.hxedu.com.cn)免費下載。
本書由張雪英教授擔任主編,李鳳蓮、賈海蓉和李鴻燕副教授擔任副主編,程永強教授、馬建芬教授、白靜教授、孫穎博士、黃麗霞博士參編,具體分工是:第1、2、3、4、6、8章由張雪英編寫,第5章和附錄A由李鳳蓮編寫,第7章由程永強編寫,第9章由白靜編寫,第10章由賈海蓉編寫,第11章由孫穎編寫,第12章由黃麗霞編寫,第13章由李鴻燕編寫,第14章由馬建芬編寫。全書由張雪英教授統稿。在本書編寫過程中,特彆是MATLAB程序的調試過程中,得到瞭太原理工大學信息工程學院數字音視頻技術研究中心的一些碩士生和博士生的幫助,在此錶示衷心感謝。
由於編著者水平有限,書中難免存在錯誤之處,敬請讀者批評指正。
編著者
2016年4月
數字語音處理及MATLAB仿真(第2版) 下載 mobi epub pdf txt 電子書 格式