YL8549 9787121321603 9787115461476 9787121318726
機器學習之路——Caffe、Keras、scikit-learn實戰
機器學習需要一條脫離過高理論門檻的入門之路。
本書《機器學習篇》從小紅帽采蘑菇的故事開篇,介紹瞭基礎的機器學習分類模型的訓練(第1章)。如何評估、調試模型?如何閤理地發掘事物的特徵?如何利用幾個模型共同發揮作用?後續章節一步一步講述瞭如何優化模型,更好地完成分類預測任務(第2章),並且初步嘗試將這些技術運用到金融股票交易中(第3章)。
自然界*好的非綫性模型莫過於人類的大腦。《深度學習篇》從介紹並對比一些常見的深度學習框架開始(第4章),講解瞭DNN模型的直觀原理,嘗試給齣一些簡單的生物學解釋,完成簡單的圖片識彆任務(第5章)。後續章節在此基礎上,完成更為復雜的圖片識彆CNN模型(第6章)。接著,本書展示瞭使用Caffe完成一個完整的圖片識彆項目,從準備數據集,到完成識彆任務(第7章)。後麵簡單描述瞭RNN模型(第8章),接著展示瞭一個將深度學習技術落地到圖片處理領域的項目(第9章)。
1篇 機器學習篇第1 章 初識機器學習 .................................................................................... 21.1 機器學習——賦予機器“學習”的靈魂 ..................................................................... 21.1.1 小紅帽識彆毒蘑菇 ................................................................................................................... 21.1.2 三種機器學習問題 ................................................................................................................... 61.1.3 常用符號 .................................................................................................................................. 61.1.4 迴顧 .......................................................................................................................................... 71.2 KNN——相似的鄰居請投票 ........................................................................................ 71.2.1 模型原理 .................................................................................................................................. 71.2.2 鳶尾花卉數據集(IRIS) ....................................................................................................... 91.2.3 訓練模型 .................................................................................................................................. 91.2.4 評估模型 ................................................................................................................................ 121.2.5 關於KNN ............................................................................................................................... 141.2.6 運用KNN 模型 ...................................................................................................................... 151.2.7 迴顧 ........................................................................................................................................ 161.3 邏輯分類I:綫性分類模型 ........................................................................................ 161.3.1 參數化的模型 ........................................................................................................................ 161.3.2 邏輯分類:預測..................................................................................................................... 181.3.3 邏輯分類:評估..................................................................................................................... 221.3.4 邏輯分類:訓練..................................................................................................................... 231.3.5 迴顧 ........................................................................................................................................ 241.4 邏輯分類II:綫性分類模型 ....................................................................................... 241.4.1 尋找模型的權重..................................................................................................................... 24VI ∣ 機器學習之路——Caffe、Keras、scikit-learn 實戰1.4.2 去均值和歸一化..................................................................................................................... 311.4.3 實現 ........................................................................................................................................ 331.4.4 迴顧 ........................................................................................................................................ 34第2 章 機器學習進階 .................................................................................. 352.1 特徵工程 ...................................................................................................................... 352.1.1 泰坦尼剋號生存預測 ............................................................................................................. 352.1.2 兩類特徵 ................................................................................................................................ 382.1.3 構造非綫性特徵..................................................................................................................... 412.1.4 迴顧 ........................................................................................................................................ 452.2 調試模型 ...................................................................................................................... 462.2.1 模型調試的目標..................................................................................................................... 462.2.2 調試模型 ................................................................................................................................ 492.2.3 迴顧 ........................................................................................................................................ 522.3 分類模型評估指標 ...................................................................................................... 532.3.1 混淆矩陣係指標..................................................................................................................... 532.3.2 評估麯綫 ................................................................................................................................ 582.3.3 迴顧 ........................................................................................................................................ 612.4 迴歸模型 ...................................................................................................................... 612.4.1 迴歸與分類 ............................................................................................................................ 612.4.2 綫性迴歸 ................................................................................................................................ 622.4.3 波士頓房價預測..................................................................................................................... 662.4.4 泰坦尼剋號生存預測:迴歸預測特徵年齡Age .................................................................. 692.4.5 綫性模型與非綫性模型 ......................................................................................................... 722.4.6 迴顧 ........................................................................................................................................ 732.5 決策樹模型 .................................................................................................................. 732.5.1 信息與編碼 ............................................................................................................................ 742.5.2 決策樹 .................................................................................................................................... 762.5.3 對比綫性模型和決策樹模型的錶現 ..................................................................................... 772.5.4 迴顧 ........................................................................................................................................ 792.6 模型融閤 ...................................................................................................................... 802.6.1 融**群體(Ensamble) ..................................................................................................... 802.6.2 Bagging:隨機森林(Random Forest) ............................................................................... 82目錄 ∣ VII2.6.3 Boosting:GBDT ................................................................................................................... 832.6.4 Stacking .................................................................................................................................. 862.6.5 泰坦尼剋號生存預測:小結 ................................................................................................. 932.6.6 迴顧 ........................................................................................................................................ 94第3 章 實戰:股票量化 .............................................................................. 953.1 1步:構造童話世界 .............................................................................................. 953.1.1 股票是什麼 ............................................................................................................................ 953.1.2 當機器學習與量化交易走在一起 ......................................................................................... 963.1.3 構造一個童話世界 ................................................................................................................. 963.1.4 迴顧 ...................................................................................................................................... 1003.2 第二步:應用機器學習 ............................................................................................ 1003.2.1 構建特徵數據 ...................................................................................................................... 1003.2.2 迴歸預測股票價格 ............................................................................................................... 1033.2.3 分類預測股票漲跌 ............................................................................................................... 1083.2.4 通過決策樹分類,繪製決策圖 ........................................................................................... 1123.2.5 迴顧 ...................................................................................................................................... 1143.3 第三步:在真實世界應用機器學習 ........................................................................ 1143.3.1 迴測 ...................................................................................................................................... 1153.3.2 基於特徵的交易預測 ........................................................................................................... 1193.3.3 破滅的童話——真實世界的機器學習 ............................................................................... 122第二篇 深度學習篇第4 章 深度學習:背景和工具 ................................................................. 1264.1 背景 ............................................................................................................................ 1264.1.1 人工智能——為機器賦予人的智能 ................................................................................... 1264.1.2 圖靈測試 .............................................................................................................................. 1264.1.3 強人工智能 vs 弱人工智能 ............................................................................................... 1274.1.4 機器學習和深度學習 ........................................................................................................... 1284.1.5 過度的幻想 .......................................................................................................................... 1284.1.6 迴顧 ............................................
深度學習deep learning
《深度學習》由*****的三位專傢Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰寫,是深度學習領域奠基性的**教材。全書的內容包括3個部分:第1部分介紹基本的數學工具和機器學習的概念,它們是深度學習的預備知識;第2部分係統深入地講解現今已成熟的深度學習方法和技術;第3部分討論某些具有前瞻性的方嚮和想法,它們被**為是深度學習未來的研究重點。
《深度學習》適閤各類讀者閱讀,包括相關**的大學生或研究生,以及不具有機器學習或統計背景、但是想要快速補充深度學習知識,以便在實際産品或平颱中應用的軟件工程師。
第 1 章 引言 . . .. . . . . . 1
1.1 本書麵嚮的讀者 . . . . . . . . . . . . . . . . . . . .7
1.2 深度學習的曆史趨勢 . . . . . . . . . . . . . . . 8
1.2.1 神經網絡的眾多名稱和命運變遷 . 8
1.2.2 與日俱增的數據量 . . . . . . . . . . . . . 12
1.2.3 與日俱增的模型規模 . . . . . . . . . . .13
1.2.4 與日俱增的精度、復雜度和對現實世界的衝擊 . . . . . . . . . . . . . 15
第 1 部分 應用數學與機器學習基礎
第 2 章 綫性代數 . . .19
2.1 標量、嚮量、矩陣和張量 . . . . . . . . . . 19
2.2 矩陣和嚮量相乘. . . . . . . . . . . . . . . . . . .21
2.3 單位矩陣和逆矩陣 . . . . . . . . . . . . . . . . 22
2.4 綫性相關和生成子空間 . . . . . . . . . . . 23
2.5 範數. . . . . . . . .24
2.6 特殊類型的矩陣和嚮量 . . . . . . . . . . . 25
2.7 特徵分解 . . . . 26
2.8 奇異值分解 . . . . . . . . . . . . . . . . . . . . . . . 28
2.9 Moore-Penrose 僞逆 . . . . . . . . . . . . . . . 28
2.10 跡運算 . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.11 行列式 . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.12 實例:主成分分析. . . . . . . . . . . . . . . .30
第 3 章 概率與信息論. . .. . . . . . . . . . . . . . . . . .34
3.1 為什麼要使用概率 . . . . . . . . . . . . . . . . 34
3.2 隨機變量 . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.3 概率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3.1 離散型變量和概率質量函數 . . . . 36
3.3.2 連續型變量和概率密度函數 . . . . 36
3.4 邊緣概率 . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.5 條件概率 . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.6 條件概率的鏈式法則 . . . . . . . . . . . . . . 38
3.7 獨立性和條件獨立性 . . . . . . . . . . . . . . 38
3.8 期望、方差和協方差 . . . . . . . . . . . . . . 38
3.9 常用概率分布 . . . . . . . . . . . . . . . . . . . . . 39
3.9.1 Bernoulli 分布 . . . . . . . . . . . . . . . . 40
3.9.2 Multinoulli 分布 . . . . . . . . . . . . . . 40
3.9.3 高斯分布 . . . . . . . . . . . . . . . . . . . . . 40
3.9.4 指數分布和 Laplace 分布 . . . . . . 41
3.9.5 Dirac 分布和經驗分布 . . . . . . . . . 42
3.9.6 分布的混閤 . . . . . . . . . . . . . . . . . . . 42
3.10 常用函數的有用性質. . . . . . . . . . . . .43
3.11 貝葉斯規則 . . . . . . . . . . . . . . . . . . . . . . 45
3.12 連續型變量的技術細節 . . . . . . . . . . 45
3.13 信息論 . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.14 結構化概率模型 . . . . . . . . . . . . . . . . . 49
第 4 章 數值計算 . . .. . . . . . . . . . . . . . . . . . . . . . 52
4.1 上溢和下溢 . . . . . . . . . . . . . . . . . . . . . . . 52
4.2 病態條件 . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3 基於梯度的優化方法 . . . . . . . . . . . . . . 53
4.3.1 梯度之上:Jacobian 和 Hessian 矩陣 . . . . . . . . . . . . . . . . . . . . . 56
4.4 約束優化 . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.5 實例:綫性*小二乘 . . . . . . . . . . . . . . 61
Keras快速上手:基於Python的深度學習實戰
本書係統地講解瞭深度學習的基本知識、建模過程和應用,並以深度學習在推薦係統、圖像識彆、自然語言處理、文字生成和時間序列中的具體應用為案例,詳細介紹瞭從工具準備、數據獲取和處理到針對問題進行建模的整個過程和實踐經驗,是一本非常好的深度學習入門書。
不同於許多講解深度學習的書籍,本書以實用為導嚮,選擇瞭Keras作為編程框架,強調簡單、快速地設計模型,而不去糾纏底層代碼,使得內容相當易於理解。讀者可以在CNTK、TensorFlow和Theano的後颱之間隨意切換,非常靈活,並且能幫助讀者從高度抽象的角度去審視業務問題,達到事半功倍的效果。
第1章準備深度學習的環境1
- 硬件環境的搭建和配置選擇. . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1通用圖形處理單元. . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2你需要什麼樣的GPU加速卡. . . . . . . . . . . . . . . . . . . 6
1.1.3你的GPU需要多少內存. . . . . . . . . . . . . . . . . . . . . . 7
1.1.4是否應該用多塊GPU . . . . . . . . . . . . . . . . . . . . . . . 11
1.2安裝軟件環境. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.1所需軟件列錶. . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.2 CUDA的安裝. . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.3 Python及計算環境的安裝. . . . . . . . . . . . . . . . . . . . . 14
1.2.4深度學習建模環境介紹. . . . . . . . . . . . . . . . . . . . . . . 15
1.2.5安裝CNTK及對應的Keras . . . . . . . . . . . . . . . . . . . 17
1.2.6安裝Theano計算環境. . . . . . . . . . . . . . . . . . . . . . . 24
1.2.7安裝TensorFlow計算環境. . . . . . . . . . . . . . . . . . . . 26
1.2.8安裝cuDNN和CNMeM . . . . . . . . . . . . . . . . . . . . . 28
第2章數據收集與處理29
2.1本章摘要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2網絡爬蟲. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.1網絡爬蟲技術. . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.2構造自己的Scrapy爬蟲. . . . . . . . . . . . . . . . . . . . . . 31
2.2.3構造可接受參數的Scrapy爬蟲. . . . . . . . . . . . . . . . . . 36
2.2.4運行Scrapy爬蟲. . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.5運行Scrapy爬蟲的一些要點. . . . . . . . . . . . . . . . . . . 40
2.3大規模非結構化數據的存儲和分析. . . . . . . . . . . . . . . . . . . . 42
2.3.1 ElasticSearch介紹. . . . . . . . . . . . . . . . . . . . . . . . . 44
2.3.2 ElasticSearch應用實例. . . . . . . . . . . . . . . . . . . . . . 46
第3章深度學習簡介61
3.1概述. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.2深度學習的統計學入門. . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3一些基本概念的解釋. . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.3.1深度學習裏的函數類型. . . . . . . . . . . . . . . . . . . . . . . 66
3.3.2深度學習裏的其他常見概念. . . . . . . . . . . . . . . . . . . . 70
3.4梯度遞減算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.5後嚮傳播算法. . . . . . . . . . . . . . . . . . . . .