發表於2024-11-26
自然語言處理是研究人機之間用自然語言通信的理論和方法,是人工智能領域的一個重要分支,有著非常廣泛的應用空間。
本書結閤作者多年學習和從事自然語言處理相關工作的經驗,力圖用生動形象的方式深入淺齣地介紹自然語言處理的理論、方法和技術。本書拋棄繁瑣的證明,提取齣算法的核心,幫助讀者盡快地掌握自然語言處理所必備的知識和技能。
通過本書,你將學習和理解:
★ 概率論、信息論、貝葉斯法則等基礎知識;
★ 機器學習和深度學習的熱門話題;
★ 程序優化的方法;
★ PageRank和相似度計算的原理;
★ 搜索引擎的原理、架構和核心模塊;
★ 各種推薦算法的原理和工作機製;
★ 自然語言處理和對話係統等技術難題。
非常贊的一本書。既適閤沒有很多背景的初學者入門,也適閤相關方嚮的工程師進階。基礎概念的來龍去脈講得十分清楚,很多知識點也指齣瞭相關的論文。這本書適閤做教材,其中融入瞭作者對NLP的深刻理解。在深度學習/人工智能被過分炒作的今天,隻有多思考問題的本質,也就是像書中所說的那樣,“隻有腳踏實地,在現有技術和數據形態下結閤産品設計解決好用戶需求”,纔能達到“無招勝有招”的境界。
——網友supersuper
有幸閱讀到這本書,盡管目前隻讀完瞭前幾章的內容,但是感覺收獲非常大,讓我的學習思路更為清晰,尤其在優化問題這個概念上,本書更為深刻地介紹背後的原理,而不僅僅是強調某些算法模型。再次感謝作者給我帶來的幫助與啓發!
——網友Liang Zachary
這本書令人印象非常深刻,知識點很全麵,又深入淺齣(特彆喜歡裏麵舉的例子)。
——網友Yujun Wu
本書結閤作者多年學習和從事自然語言處理相關工作的經驗,力圖用生動形象的方式深入淺齣地介紹自然語言處理的理論、方法和技術。本書拋棄掉繁瑣的證明,提取齣算法的核心,幫助讀者盡快地掌握自然語言處理所必備的知識和技能。本書主要分兩大部分。第一部分是理論篇,包含前3章內容,主要介紹一些基礎的數學知識、優化理論知識和一些機器學習的相關知識。第二部分是應用篇,包含第4章到第8章,分彆針對計算性能、文本處理的術語、相似度計算、搜索引擎、推薦係統、自然語言處理和對話係統等主題展開介紹和討論。本書適閤從事自然語言處理相關研究和工作的讀者參考,尤其適閤想要瞭解和掌握機器學習或者自然語言處理技術的讀者閱讀。
路彥雄,西安電子科技大學碩士畢業,從事自然語言處理和機器學習相關工作多年,具有豐富經驗。曾任微信小微機器人技術負責人,現任微信整閤搜索算法組組長。
理 論 篇
第1章 你必須知道的一些基礎知識………………………………………3
1.1 概率論 ……………………………………………………………3
1.2 信息論 ……………………………………………………………4
1.3 貝葉斯法則 ………………………………………………………7
1.4 問題與思考 ………………………………………………………10
第2章 我們生活在一個尋求最優解的世界裏……………………………11
2.1 最優化問題 ………………………………………………………11
2.2 最大似然估計/最大後驗估計 …………………………………15
2.3 梯度下降法 ………………………………………………………17
2.4 問題與思考 ………………………………………………………22
第3章 讓機器可以像人一樣學習…………………………………………23
3.1 何謂機器學習 ……………………………………………………23
3.2 邏輯迴歸/因子分解機 …………………………………………29
3.3 最大熵模型/條件隨機場 ………………………………………34
3.4 主題模型 …………………………………………………………40
3.5 深度學習 …………………………………………………………50
3.6 其他模型 …………………………………………………………88
3.7 問題與思考 ………………………………………………………97
應 用 篇
第4章 如何計算得更快…………………………………………………101
4.1 程序優化 ………………………………………………………101
4.2 分布式係統 ……………………………………………………105
4.3 Hadoop …………………………………………………………107
4.4 問題與思考 ……………………………………………………114
第5章 你要知道的一些術語……………………………………………115
5.1 tf/df/idf …………………………………………………………115
5.2 IG/CHI/MI ………………………………………………………116
5.3 PageRank ………………………………………………………118
5.4 相似度計算 ……………………………………………………119
5.5 問題與思考 ……………………………………………………125
第6章 搜索引擎是什麼玩意兒…………………………………………126
6.1 搜索引擎原理 …………………………………………………126
6.2 搜索引擎架構 …………………………………………………129
6.3 搜索引擎核心模塊 ……………………………………………130
6.4 搜索廣告 ………………………………………………………148
6.5 問題與思考 ……………………………………………………153
第7章 如何讓機器猜得更準……………………………………………155
7.1 基於協同過濾的推薦算法 ……………………………………156
7.2 基於內容的推薦算法 …………………………………………158
7.3 混閤推薦算法 …………………………………………………159
7.4 問題與思考 ……………………………………………………163
第8章 理解語言有多難…………………………………………………164
8.1 自然語言處理 …………………………………………………164
8.2 對話係統 ………………………………………………………176
8.3 語言的特殊性 …………………………………………………186
8.4 問題與思考 ……………………………………………………190
結語…………………………………………………………………………191
參考文獻……………………………………………………………………193
文本上的算法:深入淺齣自然語言處理 下載 mobi pdf epub txt 電子書 格式 2024
文本上的算法:深入淺齣自然語言處理 下載 mobi epub pdf 電子書書多人不怪,多讀書,讀好書
評分趁大促買瞭幾本一直想買的書,希望能有所收獲。
評分618活動超值,囤瞭很多書,慢慢看吧,但願一年之後能看完
評分大傢評價說不錯,剛看瞭開頭,很燒腦。
評分大傢評價說不錯,剛看瞭開頭,很燒腦。
評分睡前可以看看幫助睡眠
評分商品很不錯,下次還會買,會嚮大傢推薦購買
評分比6.18晚瞭幾天,價格貴瞭這麼多。買瞭快兩韆的書,也沒啥優惠。
評分很好,質量沒問題,以後還會來。
文本上的算法:深入淺齣自然語言處理 mobi epub pdf txt 電子書 格式下載 2024