發表於2025-04-19
機器學習模型不能給齣準確結果的原因有很多。從設計的角度來審視這些係統,我們能夠深入理解其底層算法和可用的優化方法。本書為我們提供瞭機器學習設計過程的堅實基礎,能夠使我們為特定問題建立起定製的機器學習模型。我們可能已經瞭解或使用過一些為解決常見問題的商用機器學習模型,例如垃圾郵件檢測或電影分級,但是要著手於解決更為復雜的問題,則其重點是讓這些模型適用於我們自己特定的需求。
譯者序
前言
第1章 機器學習的思維1
1.1 人機界麵1
1.2 設計原理4
1.2.1 問題的類型6
1.2.2 問題是否正確7
1.2.3 任務8
1.2.4 統一建模語言27
1.3 總結31
第2章 工具和技術32
2.1 Python與機器學習33
2.2 IPython控製颱33
2.3 安裝SciPy棧34
2.4 NumPy35
2.4.1 構造和變換數組38
2.4.2 數學運算39
2.5 Matplotlib41
2.6 Pandas45
2.7 SciPy47
2.8 Scikit-learn50
2.9 總結57
第3章 將數據變為信息58
3.1 什麼是數據58
3.2 大數據59
3.2.1 大數據的挑戰60
3.2.2 數據模型62
3.2.3 數據分布63
3.2.4 來自數據庫的數據67
3.2.5 來自互聯網的數據68
3.2.6 來自自然語言的數據70
3.2.7 來自圖像的數據72
3.2.8 來自應用編程接口的數據72
3.3 信號74
3.4 數據清洗76
3.5 數據可視化78
3.6 總結80
第4章 模型—從信息中學習81
4.1 邏輯模型81
4.1.1 一般性排序83
4.1.2 解釋空間84
4.1.3 覆蓋空間86
4.1.4 PAC學習和計算復雜性87
4.2 樹狀模型88
4.3 規則模型92
4.3.1 有序列錶方法94
4.3.2 基於集閤的規則模型95
4.4 總結98
第5章 綫性模型100
5.1 最小二乘法101
5.1.1 梯度下降102
5.1.2 正規方程法107
5.2 logistic迴歸109
5.3 多分類113
5.4 正則化115
5.5 總結117
第6章 神經網絡119
6.1 神經網絡入門119
6.2 logistic單元121
6.3 代價函數126
6.4 神經網絡的實現128
6.5 梯度檢驗133
6.6 其他神經網絡架構134
6.7 總結135
第7章 特徵—算法眼中的世界136
7.1 特徵的類型137
7.1.1 定量特徵137
7.1.2 有序特徵138
7.1.3 分類特徵138
7.2 運算和統計139
7.3 結構化特徵141
7.4 特徵變換141
7.4.1 離散化143
7.4.2 歸一化144
7.4.3 校準145
7.5 主成分分析149
7.6 總結151
第8章 集成學習152
8.1 集成學習的類型152
8.2 Bagging方法153
8.2.1 隨機森林154
8.2.2 極端隨機樹155
8.3 Boosting方法159
8.3.1 AdaBoost161
8.3.2 梯度Boosting163
8.4 集成學習的策略165
8.5 總結168
第9章 設計策略和案例研究169
9.1 評價模型的錶現169
9.2 模型的選擇174
9.3 學習麯綫176
9.4 現實世界中的案例研究178
9.4.1 建立一個推薦係統178
9.4.2 溫室蟲害探測185
9.5 機器學習一瞥188
9.6 總結190
機器學習是計算世界所見的最大趨勢之一。機器學習係統具有意義深遠且令人興奮的能力,能夠在各種應用領域為人們提供重要的洞察力,從具有開創性的挽救生命的醫學研究到宇宙基礎物理方麵的發現,從為我們提供更健康、更清潔的食物到互聯網分析和建立經濟模型,等等。事實上,就某種意義而言,這項技術在我們的生活中已經無所不在。要想進入機器學習的領域,並且對其具有充分的認知,就必須能夠理解和設計服務於某一項目需要的機器學習係統。
本書的主要內容
第1章從機器學習的基礎知識開始,幫助你用機器學習的範式進行思考。你將學到機器學習的設計原理和相關模型。
第2章講解瞭Python中眾多針對機器學習任務的程序包。本章會讓你初步瞭解一些大型庫,包括NumPy、SciPy、Matplotlib和Scilit-learn等。
第3章講解瞭原始數據可能有多種不同格式,其數量和質量也可能各不相同。有時,我們會被數據淹沒;而有時,我們希望從數據中榨取最後一滴信息。數據要成為信息,需要有意義的結構。本章我們介紹瞭一些寬泛的主題,如大數據、數據屬性、數據源、數據處理和分析等。
第4章在邏輯模型中探索瞭邏輯語言,並創建瞭假設空間映射;在樹狀模型中,我們發現其具有廣泛作用域並易於描述和理解;在規則模型中,我們討論瞭基於有序規則列錶和無序規則集的模型。
第5章介紹瞭綫性模型,它是使用最廣泛的模型之一。綫性模型是眾多高級非綫性技術的基礎,例如,支持嚮量機(SVM)和神經網絡。本章還研究瞭機器學習最常用的技術,創建綫性迴歸和logistic迴歸的假設語句。
第6章介紹瞭機器學習最強大的人工神經網絡算法。我們將看到這些網絡如何成為大腦神經元的簡化模型。
第7章討論瞭特徵的不同類型,即定量特徵、有序特徵和分類特徵。我們還將詳細學習如何結構化和變換特徵。
第8章解釋瞭集成機器學習背後的動機和成因,其來源於清晰的直覺並具有豐富的理論曆史基礎。集成機器學習的類型在於模型本身,以及圍繞著三個主要問題(如何劃分數據、如何選擇模型、如何組閤其結果)的考量。
第9章著眼於一些設計策略,以確保你的機器學習係統最優。我們將學習模型選擇和參數調優技術,並將所學知識應用於一些案例研究之中。
閱讀前的準備工作
你需要有學習機器學習的意願,並需要下載安裝Python3。Python3的下載地址是:https://www.python.org/downloads/。
本書的讀者對象
本書的讀者包括數據學傢、科學傢,或任何好奇的人。你需要具備一些綫性代數和Python編程的基礎,對機器學習的概念有基本瞭解。
機器學習係統設計:Python語言實現 下載 mobi pdf epub txt 電子書 格式 2025
機器學習係統設計:Python語言實現 下載 mobi epub pdf 電子書快,配送員服務態度好,每樣東西都是送貨上門。希望京
評分東發展壯大而加油打氣。為什麼我喜歡京東購物,因為可以
評分一口氣買瞭三本,機器學習方麵的知識學起來!!!
評分題打專屬客服熱綫。客服很贊,一句話的事兒,直接上門取
評分logistics,distribution and so on.Delivery in a
評分題打專屬客服熱綫。客服很贊,一句話的事兒,直接上門取
評分中鞦國慶雙節將至送禮就送“時令新鮮水果~姑姑傢自種天然無公害脆甜鼕棗”�矛鼴門菽�箱包裝+外包紙箱保質保量給傢人親戚朋友帶上健康實惠的禮品50元3斤半箱嘗鮮包郵價90元5斤整箱包郵價迴購客戶購滿一箱更有現金紅包返利哦[紅包][紅包]多買多優惠哦小夥伴們快來訂購吧[勾引][勾引][勾引]微信~均可購買
評分看著美觀大氣上檔次。一直信任京東。質量不錯,送貨很快,服務很好! 太漂亮,大氣,檔次高,超喜歡。 貨比三傢,選的也好是辛苦啊?現在除瞭一碗熱氣騰騰的拉麵,在強哥這裏買不到其他的,隻有你想不到沒有買不到? 上午下單,下午到傢速度啊!看著還行 貨品不錯,裝瞭實用。質量可以。是值得購買 不錯不錯不錯!!!!!!用瞭還可以,剛開始用有點澀。很乾淨,質感也不錯,價位適中,性價比一般吧。 不錯 物流一天就到瞭 整體感覺很不錯,收到就用瞭,挺喜歡的,這個用的好,還要買多幾個。 物美價廉,用著看看吧,免去市場購物之勞 ,推薦答案 我為什麼喜歡在京東買東西,因為今天買明天就可以送到。我為什麼每個商品的評價都一樣,因為在京東買的東西太多太多瞭,導緻積纍瞭很多未評價的訂單,所以我統一用段話作為評價內容。京東購物這麼久,有買到很好的産品,也有買到比較坑的産品,如果我用這段話來評價,說明這款産品沒問題,寶貝收到瞭,非常喜歡,質量很好,賣傢熱情,物流給力,非常愉快的一次購物,好評!
評分這本書有點在於對於傳統機器學習的方法用tf實現也有介紹,但是代碼注釋不太詳細,隻有分塊的說明,有一定基礎的人比較適閤看一看。
機器學習係統設計:Python語言實現 mobi epub pdf txt 電子書 格式下載 2025