內容簡介
《聲學事件檢測理論與方法》係統地介紹聲學事件檢測的相關理論與方法,以及新研究進展。內容包括聲學事件檢測的基本原理、一般數據規模下的聲學事件檢測、大數據規模下的聲學事件檢測。在一般數據規模下的檢測中,重點介紹基於長時特徵的檢測理論與方法,包括基於基頻段特徵的檢測、基於混閤模型的檢測、基於稀疏低秩特徵的檢測,以及基於鬆弛邊際與並行在綫的模型訓練方法。在大數據規模下的檢測中,重點介紹適閤大數據的快速和在綫式模型訓練方法,包括基於支持嚮量機的加速訓練、基於深度模型的加速訓練、通用型在綫及隨機梯度下降算法,以及牛頓型隨機梯度下降算法等。最後介紹兩個典型應用:行車周邊聲音環境的感知以及音頻場景識彆。
《聲學事件檢測理論與方法》可作為高等院校計算機應用、信號與信息處理、通信與電子係統等專業及學科的研究生教材,也可供該領域的科研及工程技術人員參考。
內頁插圖
目錄
前言
第1章 緒論
1.1 聲學事件檢測技術的發展
1.1.1 聲學事件檢測的起源與發展脈絡
1.1.2 基於特徵的聲學事件檢測
1.1.3 基於模型的聲學事件檢測
1.2 聲學事件檢測技術的應用
1.3 聲學事件檢測係統的結構
1.4 本書的結構
第2章 聲學事件檢測中的常用特徵和模型
2.1 聲學事件檢測中的常用特徵
2.1.1 聲音信號的數字化
2.1.2 聲音信號的時域特徵
2.1.3 聲音信號的頻域特徵
2.1.4 聲音信號的時頻域特徵
2.1.5 特徵降維與選擇
2.2 聲學事件檢測中的常用模型
2.2.1 淺層模型
2.2.2 深度模型
2.3 本章小結
第3章 基於基頻段特徵的聲學事件檢測
3.1 引言
3.2 長時特徵提取
3.2.1 長時統計特徵提取
3.2.2 基於基頻段的特徵提取
3.3 基於長時統計特徵的聲學事件檢測
3.3.1 基於單分類器和多分類器融閤的聲學事件檢測
3.3.2 基於類內細分聚類的聲學事件檢測
3.3.3 基於拒識和確認的聲學事件檢測
3.4 實驗和結果
3.4.1 實驗設置
3.4.2 實驗結果與分析
3.5 本章小結
第4章 基於混閤模型的聲學事件檢測
4.1 引言
4.2 僞高斯混閤模型
4.2.1 僞高斯混閤模型的構建
4.2.2 僞高斯混閤模型參數估計的EM算法.
4.3 異質混閤模型
4.3.1 多變量Logistic混閤模型的可辨識性
4.3.2 異質混閤模型的構建
4.3.3 異質混閤模型的參數估計
4.4 實驗和結果
4.4.1 基於僞高斯混閤模型的聲學事件檢測
4.4.2 基於異質混閤模型的聲學事件檢測
4.5 本章小結
第5章 基於稀疏低秩特徵的聲學事件檢測
5.1 引言
5.2 基於稀疏錶示特徵的聲學事件檢測
5.3 基於低秩矩陣錶示特徵的聲學事件檢測
5.3.1 低秩矩陣錶示特徵提取
5.3.2 低秩矩陣分類的問題描述.
5.3.3 基於加速近似梯度方法的矩陣分類學習
5.4 基於低秩張量錶示特徵的聲學事件檢測
5.4.1 張量計算相關記號.
5.4.2 低秩張量錶示特徵提取
5.4.3 基於加速近似梯度方法的張量分類學習
5.5 實驗和結果
5.5.1 基於稀疏錶示特徵的聲學事件檢測
5.5.2 基於低秩矩陣錶示特徵的聲學事件檢測
5.5.3 基於低秩張量錶示特徵的聲學事件檢測
5.6 本章小結
第6章 基於鬆弛邊際下模型訓練的聲學事件檢測
6.1 引言
6.2 基於跡範限製下的最大邊際矩陣分類
6.2.1 基於跡範限製與鬆弛邊際的矩陣分類問題描述
6.2.2 基於交替搜索方式的矩陣分類學習算法
6.3 基於跡範限製下的最大邊際張量分類
6.3.1 基於跡範限製與鬆弛邊際的張量分類問題描述
6.3.2 基於交替搜索方式的張量分類學習算法
6.4 實驗和結果
6.5 本章小結
第7章 基於在綫並行模型訓練的聲學事件檢測
7.1 引言
7.2 在綫並行的矩陣數據分類學習方法
7.2.1 基於加速近似梯度方法的矩陣分類在綫學習
7.2.2 基於逼近加速近似梯度方法的在綫學習
7.2.3 基於小批量更新的在綫學習
7.2.4 基於並行計算加速的矩陣分類學習
7.3 在綫並行的張量數據分類學習方法
7.4 實驗和結果
7.4.1 基於在綫並行學習的低秩矩陣特徵分類
7.4.2 基於在綫並行學習的低秩張量特徵分類
7.5 本章小結
第8章 基於錨空間的聲學事件檢測
8.1 引言
8.2 錨模型簡介
8.3 基於狀態變化統計量的錨空間聲學事件檢測
8.3.1 基於狀態變化統計量的錨空間生成方法
8.3.2 實驗與討論
8.4 基於高斯混閤模型錨空間的聲學事件檢測
8.4.1 基於高斯混閤模型錨空間的目標與集外錨模闆的生成
8.4.2 基於高斯混閤模型的聲學事件檢測機製
8.5 基於稀疏分解錨空間的聲學事件檢測
8.5.1 基於稀疏分解錨空間的目標與集外錨模闆的生成
8.5.2 基於稀疏分解的聲學事件檢測機製
85.3 實驗與討論
8.6 本章小結
第9章 麵嚮大數據環境下聲學事件檢測的凸優化理論
9.1 引言
9.2 與聲學事件檢測相關的凸優化理論
9.2.1 早期凸優化
9.2.2 凸優化基礎
9.2.3 一階方法的動機
9.3 光滑與非光滑的凸優化一階方法
9.3.1 光滑目標
9.3.2 復閤優化目標函數
9.3.3 近端目標
9.4 隨機化技術
9.5 並行和分布式計算
9.6 本章小結
第10章 麵嚮大數據處理的支持嚮量機模型的加速算法
10.1 隨機對偶坐標上升法
10.1.1 問題描述及相關工作
10.1.2 基於對偶間隙邊界的SDCA收斂性分析
10.2 加速近端隨機對偶坐標上升法
10.2.1 問題描述及相關工作
10.2.2 基於對偶間隙邊界的Prox-SDCA收斂性分析
10.3 本章小結
第11章 麵嚮大數據處理的深度模型的加速算法
11.1 引言
11.2 全梯度與隨機梯度下降算法
11.3 加速梯度算法
11.4 指數型收斂的隨機梯度下降算法
11.4.1 隨機平均梯度法.
11.4.2 隨機方差減梯度方法
11.5 坐標梯度下降算法
11.6 本章小結
第12章 麵嚮大數據的通用型在綫及隨機梯度下降算法
12.1 引言
12.2 通用在綫梯度法
12.2.1 通用的在綫原始梯度方法
12.2.2 通用的在綫對偶梯度方法
12.2.3 通用的在綫快速梯度方法
12.3 通用隨機梯度法
12.3.1 算法描述
12.3.2 收斂性分析
12.4 數值實驗
12.4.1 LASSO問題
12.4.2 施泰納問題
12.5 本章小結
第13章 麵嚮大數據的牛頓型隨機梯度下降算法
13.1 引言
13.2 近端牛頓型隨機梯度法
13.2.1 正則化的二次模型
13.2.2 Hessian矩陣的近似
13.3 算法的收斂性分析
13.4 數值實驗
13.5 本章小結
第14章 基於聲學事件檢測的行車周邊聲音環境感知
14.1 引言
14.2 實驗環境與基綫係統
14.3 基於徑嚮基函數神經網絡噪聲建模的聲學事件檢測
14.4 基於等響度麯綫的聲學事件檢測
14.5 基於基頻軌跡特徵的聲學事件檢測
14.6 本章小結
第15章 音頻場景識彆
15.1 引言
15.2 基於高斯直方圖特徵的音頻場景識彆
15.2.1 高斯直方圖特徵
15.2.2 分類模型
15.3 基於遷移學習的音頻場景識彆
15.3.1 遷移學習概述
15.3.2 基於樣本平衡化的音頻場景識彆
15.3.3 基於改進樣本平衡化的音頻場景識彆
15.4 實驗和結果
15.5 本章小結
參考文獻
前言/序言
人類生活在一個充滿聲音的世界中,各種活動、事件無不伴隨著豐富多彩的聲音。對聲音的感知與理解是人類認知世界的最重要途徑之一。隨著信息技術的迅猛發展,開展機器模仿人類對聲音認知能力的相關研究越來越受到重視。
聲音感知與理解的目標是使計算機能感知入耳聽覺所能關注和理解的聲音。聲音的類型大體可分為語音和非語音,對不同的聲音類型,所應采取的處理方法也不盡相同。有關語音感知與理解方麵的研究已較為豐富,如語音識彆、說話人識彆等。近年來,針對非語音感知與理解的研究已逐漸成為學術界的研究熱點。研究者普遍認為非語音的聲音也能傳遞有用的信息,通過對這些聲音的分析和處理,能夠為智能決策提供重要的信息。非語音感知和理解的核心技術之一正是本書所要討論的問題——聲學事件檢測。
聲學事件檢測是指對連續聲音信號流中一段具有明確語義的片段進行分析,並標定其語義類彆的過程。聲學事件檢測是機器對環境聲音場景進行感知和語義理解的重要基礎,其在未來類人機器人聲音環境的語義理解、無人車行車周邊環境的聲音感知等方麵將發揮重要的作用。
聲學事件檢測的研究經過十幾年的發展已經取得瞭長足的進步。從其發展過程看,經曆瞭從簡單事件類型到復雜事件類型的檢測,從孤立片段的事件檢測到連續聲音流中的事件檢測,從實驗室模擬的聲學事件到現實生活中的聲學事件檢測的過程。多年來在語音識彆和音樂處理方麵的研究工作,為聲學事件檢測提供瞭數字信號處理與機器學習層麵的技術積纍;而機器的環境感知以及基於語義的多媒體信息檢索對聲學事件檢測的強烈需求,牽引和驅動瞭聲學事件檢測的發展。近年來,數字信號處理與機器學習中,如稀疏錶示與壓縮感知、深度學習等方麵的突破,為聲學事件檢測研究提供瞭更有效的理論方法和技術手段。
全書共15章,分彆介紹聲學事件檢測中的特徵提取和常用模型、一般數據規模下的聲學事件檢測、大數據規模下的聲學事件檢測,以及聲學事件檢測的典型應用。其目的不僅讓讀者對聲學事件檢測理論和方法有一個係統的瞭解,而且努力將本領域的新動態介紹給讀者,希望讀者能在學術思想上受到啓發。
經典文學巨著:探尋人性的幽微與時代的洪流 《寂靜的河流:一個時代的挽歌》 本書並非聚焦於技術性的探討,而是深入文學的腹地,描繪瞭一個特定曆史時期內,個體命運在宏大社會結構下的掙紮、選擇與最終的沉寂。這是一部關於記憶、失落與身份重塑的長篇敘事,以細膩入微的筆觸,勾勒齣二十世紀中葉,一個偏遠小鎮上發生的關於愛、背叛與永恒追尋的故事。 第一部:初生的漣漪 故事始於一個被群山環抱,幾乎與世隔絕的村落——青石鎮。這裏的節奏緩慢而古老,生活被季節的更替和傳統的儀式嚴格限定。主角林遠,一個充滿理想主義色彩的年輕教師,帶著從大城市學到的新思想迴到故土。他試圖用知識的火種點燃沉睡的心靈,卻發現古老的習俗和根深蒂固的觀念如同堅硬的岩石,難以撼動。 作者以近乎博物學的嚴謹,描繪瞭青石鎮的社會生態:手工作坊的凋零、傢族勢力的微妙平衡、民間信仰與新思潮之間的暗流湧動。林遠的生活圍繞著他所教授的少數學生,以及他與本地望族之女蘇婉之間的復雜關係展開。蘇婉美麗而壓抑,她的內心世界是傳統束縛與自我覺醒的戰場。他們的愛情,從最初的相互吸引,逐漸演變為對自由與體製的共同隱秘的渴望與試探。 本部分著重於“構建”——構建人物性格的初始維度,構建故事發生地的物理與精神圖景。敘事節奏緩慢,充滿對日常細節的捕捉,例如,清晨薄霧中彌漫的炊煙氣味、夏日午後石闆路上慵懶的貓、以及鼕日裏圍坐在火塘邊聽老人講述的那些半真半假的神話傳說。這些看似無關緊要的描寫,實則為後續的悲劇埋下瞭堅實的現實基礎,使人物的行為邏輯具有無可辯駁的說服力。 第二部:時代的風暴眼 隨著時代的列車加速駛入,青石鎮也無法置身事外。政治運動的浪潮席捲而來,一切舊有的秩序和人與人之間的關係在頃刻間被重新定義。本書的敘事視角從側重個體內心的掙紮,轉嚮瞭外部壓力如何撕裂個體內部的道德羅盤。 林遠的理想主義受到瞭最殘酷的檢驗。他必須在維護真理與保護所愛之人之間做齣抉擇。他目睹瞭曾經的摯友因恐懼而變得麵目全非,也目睹瞭善良的鄰人如何被無意的言語推嚮深淵。作者在這裏展現瞭高超的心理刻畫技巧,不直接評判對錯,而是冷靜地記錄下人在極端壓力下,人性光輝與卑微並存的復雜狀態。 蘇婉的命運則與傢族的興衰緊密相連。她被迫捲入權力鬥爭的漩渦,她的智慧和美貌不再是她個人的財富,而是被他人利用的籌碼。她與林遠的感情綫索也因此中斷、扭麯,從純粹的愛情升華為一種共同承受痛苦的、近乎殉道式的同盟。 這一部分的高潮是“審判之夜”。通過多重視角切換,讀者得以窺見事件發生時的混亂與恐懼。作者運用大量的內心獨白和閃迴片段,揭示瞭許多被曆史塵封的真相。敘事技巧上,此處運用瞭非綫性敘事,信息碎片被精心布局,引導讀者自行拼湊齣事件的全貌,增強瞭閱讀過程中的智力參與感和情感衝擊力。 第三部:遺落的印記與重生的土壤 風暴過後,留下瞭滿目瘡痍的景象。青石鎮的人們開始小心翼翼地重建生活,但那場動蕩留下的心理創傷,遠比物質廢墟更難以愈閤。 第三部聚焦於“後遺癥”。林遠選擇瞭沉默與隱忍,他不再是那個試圖喚醒世界的青年,而是一個背負著沉重記憶的旁觀者。他選擇瞭一種與過去保持距離,卻又無法完全割裂的生活方式。他開始關注那些被主流敘事遺忘的邊緣人物——那些在風暴中失去瞭言語能力的幸存者,以及那些默默承擔起傢庭重擔的女性。 蘇婉最終選擇瞭離開青石鎮,她繼承瞭傢族的産業,卻將其改造為一個旨在接納和庇護那些“無傢可歸的靈魂”的機構。她的名字不再與愛情相關,而是與堅韌和慈悲聯係在一起。 本書的結局是開放而充滿詩意的。河流依然在流淌,但河床已經改變瞭形狀。作者沒有提供一個簡單的主題總結,而是通過對時間流逝的描繪——例如,林遠偶然間看到一個孩子在廢棄的學校操場上玩耍的情景——暗示著生命的韌性與希望的微光。《寂靜的河流》的價值,在於它對特定曆史語境下復雜人性的深度挖掘,對個體尊嚴在權力麵前的堅守與失守的深刻反思,以及對記憶如何塑造未來的哲學探討。它是一麯對逝去時光的深情挽歌,同時也是一首關於如何在廢墟上重建意義的贊美詩。 本書語言風格凝練,意象豐富,充滿強烈的地域色彩和曆史厚重感,是研究二十世紀中國社會變遷與人道主義文學思潮的不可多得的經典範本。它要求讀者放慢腳步,用心去感受文字背後那份沉甸甸的、關於“人之所以為人”的永恒追問。