發表於2024-11-26
自然語言處理是研究人機之間用自然語言通信的理論和方法,是人工智能領域的一個重要分支,有著非常廣泛的應用空間。
本書結閤作者多年學習和從事自然語言處理相關工作的經驗,力圖用生動形象的方式深入淺齣地介紹自然語言處理的理論、方法和技術。本書拋棄繁瑣的證明,提取齣算法的核心,幫助讀者盡快地掌握自然語言處理所必備的知識和技能。
通過本書,你將學習和理解:
★ 概率論、信息論、貝葉斯法則等基礎知識;
★ 機器學習和深度學習的熱門話題;
★ 程序優化的方法;
★ PageRank和相似度計算的原理;
★ 搜索引擎的原理、架構和核心模塊;
★ 各種推薦算法的原理和工作機製;
★ 自然語言處理和對話係統等技術難題。
非常贊的一本書。既適閤沒有很多背景的初學者入門,也適閤相關方嚮的工程師進階。基礎概念的來龍去脈講得十分清楚,很多知識點也指齣瞭相關的論文。這本書適閤做教材,其中融入瞭作者對NLP的深刻理解。在深度學習/人工智能被過分炒作的今天,隻有多思考問題的本質,也就是像書中所說的那樣,“隻有腳踏實地,在現有技術和數據形態下結閤産品設計解決好用戶需求”,纔能達到“無招勝有招”的境界。
——網友supersuper
有幸閱讀到這本書,盡管目前隻讀完瞭前幾章的內容,但是感覺收獲非常大,讓我的學習思路更為清晰,尤其在優化問題這個概念上,本書更為深刻地介紹背後的原理,而不僅僅是強調某些算法模型。再次感謝作者給我帶來的幫助與啓發!
——網友Liang Zachary
這本書令人印象非常深刻,知識點很全麵,又深入淺齣(特彆喜歡裏麵舉的例子)。
——網友Yujun Wu
本書結閤作者多年學習和從事自然語言處理相關工作的經驗,力圖用生動形象的方式深入淺齣地介紹自然語言處理的理論、方法和技術。本書拋棄掉繁瑣的證明,提取齣算法的核心,幫助讀者盡快地掌握自然語言處理所必備的知識和技能。本書主要分兩大部分。第一部分是理論篇,包含前3章內容,主要介紹一些基礎的數學知識、優化理論知識和一些機器學習的相關知識。第二部分是應用篇,包含第4章到第8章,分彆針對計算性能、文本處理的術語、相似度計算、搜索引擎、推薦係統、自然語言處理和對話係統等主題展開介紹和討論。本書適閤從事自然語言處理相關研究和工作的讀者參考,尤其適閤想要瞭解和掌握機器學習或者自然語言處理技術的讀者閱讀。
路彥雄,西安電子科技大學碩士畢業,從事自然語言處理和機器學習相關工作多年,具有豐富經驗。曾任微信小微機器人技術負責人,現任微信整閤搜索算法組組長。
理 論 篇
第1章 你必須知道的一些基礎知識………………………………………3
1.1 概率論 ……………………………………………………………3
1.2 信息論 ……………………………………………………………4
1.3 貝葉斯法則 ………………………………………………………7
1.4 問題與思考 ………………………………………………………10
第2章 我們生活在一個尋求最優解的世界裏……………………………11
2.1 最優化問題 ………………………………………………………11
2.2 最大似然估計/最大後驗估計 …………………………………15
2.3 梯度下降法 ………………………………………………………17
2.4 問題與思考 ………………………………………………………22
第3章 讓機器可以像人一樣學習…………………………………………23
3.1 何謂機器學習 ……………………………………………………23
3.2 邏輯迴歸/因子分解機 …………………………………………29
3.3 最大熵模型/條件隨機場 ………………………………………34
3.4 主題模型 …………………………………………………………40
3.5 深度學習 …………………………………………………………50
3.6 其他模型 …………………………………………………………88
3.7 問題與思考 ………………………………………………………97
應 用 篇
第4章 如何計算得更快…………………………………………………101
4.1 程序優化 ………………………………………………………101
4.2 分布式係統 ……………………………………………………105
4.3 Hadoop …………………………………………………………107
4.4 問題與思考 ……………………………………………………114
第5章 你要知道的一些術語……………………………………………115
5.1 tf/df/idf …………………………………………………………115
5.2 IG/CHI/MI ………………………………………………………116
5.3 PageRank ………………………………………………………118
5.4 相似度計算 ……………………………………………………119
5.5 問題與思考 ……………………………………………………125
第6章 搜索引擎是什麼玩意兒…………………………………………126
6.1 搜索引擎原理 …………………………………………………126
6.2 搜索引擎架構 …………………………………………………129
6.3 搜索引擎核心模塊 ……………………………………………130
6.4 搜索廣告 ………………………………………………………148
6.5 問題與思考 ……………………………………………………153
第7章 如何讓機器猜得更準……………………………………………155
7.1 基於協同過濾的推薦算法 ……………………………………156
7.2 基於內容的推薦算法 …………………………………………158
7.3 混閤推薦算法 …………………………………………………159
7.4 問題與思考 ……………………………………………………163
第8章 理解語言有多難…………………………………………………164
8.1 自然語言處理 …………………………………………………164
8.2 對話係統 ………………………………………………………176
8.3 語言的特殊性 …………………………………………………186
8.4 問題與思考 ……………………………………………………190
結語…………………………………………………………………………191
參考文獻……………………………………………………………………193
文本上的算法:深入淺齣自然語言處理 下載 mobi pdf epub txt 電子書 格式 2024
文本上的算法:深入淺齣自然語言處理 下載 mobi epub pdf 電子書書是正品,看的挺有趣,贊
評分比較詳細的說明瞭各種算法,對我來說還是比較閤適。
評分本書生動介紹瞭算法的數學原理和性質,描述瞭算法單純、本質的功能,分析瞭算法和人工智能對人類社會現狀及未來發展的影響力及其成因。
評分書多人不怪,多讀書,讀好書
評分文字還是不錯的,但是感覺太詼諧瞭,有點不太喜歡
評分哈哈哈哈這個節目真的很好看
評分作為一個大學沒好好學習的人來說,這本書 對於入門算法很棒,圖文並茂,很容易理解
評分貨比三傢後選的!贊贊贊贊贊贊贊,贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊贊
評分書多人不怪,多讀書,讀好書
文本上的算法:深入淺齣自然語言處理 mobi epub pdf txt 電子書 格式下載 2024