具體描述
				
				
					YL8549  9787121321603 9787115461476 9787121318726
機器學習之路——Caffe、Keras、scikit-learn實戰
機器學習需要一條脫離過高理論門檻的入門之路。
本書《機器學習篇》從小紅帽采蘑菇的故事開篇,介紹瞭基礎的機器學習分類模型的訓練(第1章)。如何評估、調試模型?如何閤理地發掘事物的特徵?如何利用幾個模型共同發揮作用?後續章節一步一步講述瞭如何優化模型,更好地完成分類預測任務(第2章),並且初步嘗試將這些技術運用到金融股票交易中(第3章)。
自然界*好的非綫性模型莫過於人類的大腦。《深度學習篇》從介紹並對比一些常見的深度學習框架開始(第4章),講解瞭DNN模型的直觀原理,嘗試給齣一些簡單的生物學解釋,完成簡單的圖片識彆任務(第5章)。後續章節在此基礎上,完成更為復雜的圖片識彆CNN模型(第6章)。接著,本書展示瞭使用Caffe完成一個完整的圖片識彆項目,從準備數據集,到完成識彆任務(第7章)。後麵簡單描述瞭RNN模型(第8章),接著展示瞭一個將深度學習技術落地到圖片處理領域的項目(第9章)。
1篇 機器學習篇第1 章 初識機器學習 .................................................................................... 21.1 機器學習——賦予機器“學習”的靈魂 ..................................................................... 21.1.1 小紅帽識彆毒蘑菇 ................................................................................................................... 21.1.2 三種機器學習問題 ................................................................................................................... 61.1.3 常用符號 .................................................................................................................................. 61.1.4 迴顧 .......................................................................................................................................... 71.2 KNN——相似的鄰居請投票 ........................................................................................ 71.2.1 模型原理 .................................................................................................................................. 71.2.2 鳶尾花卉數據集(IRIS) ....................................................................................................... 91.2.3 訓練模型 .................................................................................................................................. 91.2.4 評估模型 ................................................................................................................................ 121.2.5 關於KNN ............................................................................................................................... 141.2.6 運用KNN 模型 ...................................................................................................................... 151.2.7 迴顧 ........................................................................................................................................ 161.3 邏輯分類I:綫性分類模型 ........................................................................................ 161.3.1 參數化的模型 ........................................................................................................................ 161.3.2 邏輯分類:預測..................................................................................................................... 181.3.3 邏輯分類:評估..................................................................................................................... 221.3.4 邏輯分類:訓練..................................................................................................................... 231.3.5 迴顧 ........................................................................................................................................ 241.4 邏輯分類II:綫性分類模型 ....................................................................................... 241.4.1 尋找模型的權重..................................................................................................................... 24VI ∣ 機器學習之路——Caffe、Keras、scikit-learn 實戰1.4.2 去均值和歸一化..................................................................................................................... 311.4.3 實現 ........................................................................................................................................ 331.4.4 迴顧 ........................................................................................................................................ 34第2 章 機器學習進階 .................................................................................. 352.1 特徵工程 ...................................................................................................................... 352.1.1 泰坦尼剋號生存預測 ............................................................................................................. 352.1.2 兩類特徵 ................................................................................................................................ 382.1.3 構造非綫性特徵..................................................................................................................... 412.1.4 迴顧 ........................................................................................................................................ 452.2 調試模型 ...................................................................................................................... 462.2.1 模型調試的目標..................................................................................................................... 462.2.2 調試模型 ................................................................................................................................ 492.2.3 迴顧 ........................................................................................................................................ 522.3 分類模型評估指標 ...................................................................................................... 532.3.1 混淆矩陣係指標..................................................................................................................... 532.3.2 評估麯綫 ................................................................................................................................ 582.3.3 迴顧 ........................................................................................................................................ 612.4 迴歸模型 ...................................................................................................................... 612.4.1 迴歸與分類 ............................................................................................................................ 612.4.2 綫性迴歸 ................................................................................................................................ 622.4.3 波士頓房價預測..................................................................................................................... 662.4.4 泰坦尼剋號生存預測:迴歸預測特徵年齡Age .................................................................. 692.4.5 綫性模型與非綫性模型 ......................................................................................................... 722.4.6 迴顧 ........................................................................................................................................ 732.5 決策樹模型 .................................................................................................................. 732.5.1 信息與編碼 ............................................................................................................................ 742.5.2 決策樹 .................................................................................................................................... 762.5.3 對比綫性模型和決策樹模型的錶現 ..................................................................................... 772.5.4 迴顧 ........................................................................................................................................ 792.6 模型融閤 ...................................................................................................................... 802.6.1 融**群體(Ensamble) ..................................................................................................... 802.6.2 Bagging:隨機森林(Random Forest) ............................................................................... 82目錄 ∣ VII2.6.3 Boosting:GBDT ................................................................................................................... 832.6.4 Stacking .................................................................................................................................. 862.6.5 泰坦尼剋號生存預測:小結 ................................................................................................. 932.6.6 迴顧 ........................................................................................................................................ 94第3 章 實戰:股票量化 .............................................................................. 953.1 1步:構造童話世界 .............................................................................................. 953.1.1 股票是什麼 ............................................................................................................................ 953.1.2 當機器學習與量化交易走在一起 ......................................................................................... 963.1.3 構造一個童話世界 ................................................................................................................. 963.1.4 迴顧 ...................................................................................................................................... 1003.2 第二步:應用機器學習 ............................................................................................ 1003.2.1 構建特徵數據 ...................................................................................................................... 1003.2.2 迴歸預測股票價格 ............................................................................................................... 1033.2.3 分類預測股票漲跌 ............................................................................................................... 1083.2.4 通過決策樹分類,繪製決策圖 ........................................................................................... 1123.2.5 迴顧 ...................................................................................................................................... 1143.3 第三步:在真實世界應用機器學習 ........................................................................ 1143.3.1 迴測 ...................................................................................................................................... 1153.3.2 基於特徵的交易預測 ........................................................................................................... 1193.3.3 破滅的童話——真實世界的機器學習 ............................................................................... 122第二篇 深度學習篇第4 章 深度學習:背景和工具 ................................................................. 1264.1 背景 ............................................................................................................................ 1264.1.1 人工智能——為機器賦予人的智能 ................................................................................... 1264.1.2 圖靈測試 .............................................................................................................................. 1264.1.3 強人工智能 vs 弱人工智能 ............................................................................................... 1274.1.4 機器學習和深度學習 ........................................................................................................... 1284.1.5 過度的幻想 .......................................................................................................................... 1284.1.6 迴顧 ............................................
深度學習deep learning
《深度學習》由*****的三位專傢Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰寫,是深度學習領域奠基性的**教材。全書的內容包括3個部分:第1部分介紹基本的數學工具和機器學習的概念,它們是深度學習的預備知識;第2部分係統深入地講解現今已成熟的深度學習方法和技術;第3部分討論某些具有前瞻性的方嚮和想法,它們被**為是深度學習未來的研究重點。
《深度學習》適閤各類讀者閱讀,包括相關**的大學生或研究生,以及不具有機器學習或統計背景、但是想要快速補充深度學習知識,以便在實際産品或平颱中應用的軟件工程師。
第 1 章 引言 . . .. . . . . . 1 
1.1 本書麵嚮的讀者 . . . . . . . . . . . . . . . . . . . .7 
1.2 深度學習的曆史趨勢 . . . . . . . . . . . . . . . 8 
1.2.1 神經網絡的眾多名稱和命運變遷 . 8 
1.2.2 與日俱增的數據量 . . . . . . . . . . . . . 12 
1.2.3 與日俱增的模型規模 . . . . . . . . . . .13 
1.2.4 與日俱增的精度、復雜度和對現實世界的衝擊 . . . . . . . . . . . . . 15
第 1 部分 應用數學與機器學習基礎 
第 2 章 綫性代數 . . .19 
2.1 標量、嚮量、矩陣和張量 . . . . . . . . . . 19 
2.2 矩陣和嚮量相乘. . . . . . . . . . . . . . . . . . .21 
2.3 單位矩陣和逆矩陣 . . . . . . . . . . . . . . . . 22 
2.4 綫性相關和生成子空間 . . . . . . . . . . . 23 
2.5 範數. . . . . . . . .24 
2.6 特殊類型的矩陣和嚮量 . . . . . . . . . . . 25 
2.7 特徵分解 . . . . 26 
2.8 奇異值分解 . . . . . . . . . . . . . . . . . . . . . . . 28 
2.9 Moore-Penrose 僞逆 . . . . . . . . . . . . . . . 28 
2.10 跡運算 . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.11 行列式 . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.12 實例:主成分分析. . . . . . . . . . . . . . . .30 
第 3 章 概率與信息論. . .. . . . . . . . . . . . . . . . . .34 
3.1 為什麼要使用概率 . . . . . . . . . . . . . . . . 34 
3.2 隨機變量 . . . . . . . . . . . . . . . . . . . . . . . . . . 35 
3.3 概率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . 36 
3.3.1 離散型變量和概率質量函數 . . . . 36 
3.3.2 連續型變量和概率密度函數 . . . . 36 
3.4 邊緣概率 . . . . . . . . . . . . . . . . . . . . . . . . . . 37 
3.5 條件概率 . . . . . . . . . . . . . . . . . . . . . . . . . . 37 
3.6 條件概率的鏈式法則 . . . . . . . . . . . . . . 38
3.7 獨立性和條件獨立性 . . . . . . . . . . . . . . 38 
3.8 期望、方差和協方差 . . . . . . . . . . . . . . 38 
3.9 常用概率分布 . . . . . . . . . . . . . . . . . . . . . 39 
3.9.1 Bernoulli 分布 . . . . . . . . . . . . . . . . 40 
3.9.2 Multinoulli 分布 . . . . . . . . . . . . . . 40 
3.9.3 高斯分布 . . . . . . . . . . . . . . . . . . . . . 40 
3.9.4 指數分布和 Laplace 分布 . . . . . . 41 
3.9.5 Dirac 分布和經驗分布 . . . . . . . . . 42 
3.9.6 分布的混閤 . . . . . . . . . . . . . . . . . . . 42 
3.10 常用函數的有用性質. . . . . . . . . . . . .43 
3.11 貝葉斯規則 . . . . . . . . . . . . . . . . . . . . . . 45 
3.12 連續型變量的技術細節 . . . . . . . . . . 45 
3.13 信息論 . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.14 結構化概率模型 . . . . . . . . . . . . . . . . . 49 
第 4 章 數值計算 . . .. . . . . . . . . . . . . . . . . . . . . . 52 
4.1 上溢和下溢 . . . . . . . . . . . . . . . . . . . . . . . 52 
4.2 病態條件 . . . . . . . . . . . . . . . . . . . . . . . . . . 53 
4.3 基於梯度的優化方法 . . . . . . . . . . . . . . 53 
4.3.1 梯度之上:Jacobian 和 Hessian 矩陣 . . . . . . . . . . . . . . . . . . . . . 56
4.4 約束優化 . . . . . . . . . . . . . . . . . . . . . . . . . . 60 
4.5 實例:綫性*小二乘 . . . . . . . . . . . . . . 61 
Keras快速上手:基於Python的深度學習實戰
 本書係統地講解瞭深度學習的基本知識、建模過程和應用,並以深度學習在推薦係統、圖像識彆、自然語言處理、文字生成和時間序列中的具體應用為案例,詳細介紹瞭從工具準備、數據獲取和處理到針對問題進行建模的整個過程和實踐經驗,是一本非常好的深度學習入門書。
        不同於許多講解深度學習的書籍,本書以實用為導嚮,選擇瞭Keras作為編程框架,強調簡單、快速地設計模型,而不去糾纏底層代碼,使得內容相當易於理解。讀者可以在CNTK、TensorFlow和Theano的後颱之間隨意切換,非常靈活,並且能幫助讀者從高度抽象的角度去審視業務問題,達到事半功倍的效果。
第1章準備深度學習的環境1
- 硬件環境的搭建和配置選擇. . . . . . . . . . . . . . . . . . . . . . . . 2
 1.1.1通用圖形處理單元. . . . . . . . . . . . . . . . . . . . . . . . . 3
 1.1.2你需要什麼樣的GPU加速卡. . . . . . . . . . . . . . . . . . . 6
 1.1.3你的GPU需要多少內存. . . . . . . . . . . . . . . . . . . . . . 7
 1.1.4是否應該用多塊GPU . . . . . . . . . . . . . . . . . . . . . . . 11
 1.2安裝軟件環境. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
 1.2.1所需軟件列錶. . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
 1.2.2 CUDA的安裝. . . . . . . . . . . . . . . . . . . . . . . . . . . 13
 1.2.3 Python及計算環境的安裝. . . . . . . . . . . . . . . . . . . . . 14
 1.2.4深度學習建模環境介紹. . . . . . . . . . . . . . . . . . . . . . . 15
 1.2.5安裝CNTK及對應的Keras . . . . . . . . . . . . . . . . . . . 17
 1.2.6安裝Theano計算環境. . . . . . . . . . . . . . . . . . . . . . . 24
 1.2.7安裝TensorFlow計算環境. . . . . . . . . . . . . . . . . . . . 26
 1.2.8安裝cuDNN和CNMeM . . . . . . . . . . . . . . . . . . . . . 28
 
 
第2章數據收集與處理29
2.1本章摘要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2網絡爬蟲. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.1網絡爬蟲技術. . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.2構造自己的Scrapy爬蟲. . . . . . . . . . . . . . . . . . . . . . 31
2.2.3構造可接受參數的Scrapy爬蟲. . . . . . . . . . . . . . . . . . 36
2.2.4運行Scrapy爬蟲. . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.5運行Scrapy爬蟲的一些要點. . . . . . . . . . . . . . . . . . . 40
2.3大規模非結構化數據的存儲和分析. . . . . . . . . . . . . . . . . . . . 42
2.3.1 ElasticSearch介紹. . . . . . . . . . . . . . . . . . . . . . . . . 44
2.3.2 ElasticSearch應用實例. . . . . . . . . . . . . . . . . . . . . . 46
 
第3章深度學習簡介61
 
3.1概述. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.2深度學習的統計學入門. . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3一些基本概念的解釋. . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.3.1深度學習裏的函數類型. . . . . . . . . . . . . . . . . . . . . . . 66
3.3.2深度學習裏的其他常見概念. . . . . . . . . . . . . . . . . . . . 70
3.4梯度遞減算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.5後嚮傳播算法. . . . . . . . . . . . . . . . . . . . .
 
				 
				
				
					內容簡介  本書精選瞭三本關於機器學習、Keras快速上手及深度學習的經典著作,旨在為廣大讀者,無論是初學者還是有一定基礎的學習者,提供一條清晰、高效的學習路徑。全書內容涵蓋瞭機器學習的理論基礎、Keras框架的應用實戰,以及深度學習的前沿技術,力求做到深入淺齣,理論與實踐相結閤,幫助讀者掌握構建智能係統的核心技能。  第一部分:機器學習入門與核心概念  機器學習作為人工智能的核心驅動力,其發展日新月異,但萬變不離其宗。本書首先會從機器學習的基本概念講起,例如什麼是機器學習,它與傳統編程有何區彆,以及在現實世界中的廣泛應用場景。我們將深入探討監督學習、無監督學習、半監督學習和強化學習這四大類主要的學習範式,並詳細介紹它們各自的原理、優缺點以及適閤解決的問題類型。  在監督學習方麵,我們會詳細講解迴歸問題和分類問題。對於迴歸問題,將從綫性迴歸開始,逐步引入多項式迴歸、嶺迴歸、Lasso迴歸等,理解特徵工程、正則化等概念如何提升模型的泛化能力。對於分類問題,則會重點介紹邏輯迴歸、支持嚮量機(SVM)、決策樹、隨機森林以及K近鄰(KNN)等經典算法。我們會深入剖析這些算法的數學原理,比如邏輯迴歸中的Sigmoid函數和損失函數,SVM中的核技巧和間隔最大化,決策樹的熵和基尼不純度,以及隨機森林的集成學習思想。  無監督學習方麵,我們將重點關注聚類和降維。聚類算法方麵,會詳細講解K-Means算法,理解其迭代優化的過程,並介紹如何選擇閤適的K值。同時,也會涉及層次聚類和DBSCAN等更復雜的聚類方法。降維方麵,將深入講解主成分分析(PCA)的原理,理解如何通過綫性變換找到數據的主要變化方嚮,以及奇異值分解(SVD)在降維中的作用。此外,我們還會介紹t-SNE等非綫性降維技術,用於可視化高維數據。  此外,本書還將涵蓋模型評估與選擇的關鍵技術。如何衡量一個模型的性能?交叉驗證、精度、召迴率、F1分數、ROC麯綫、AUC值等評估指標將是重點講解的內容。理解過擬閤和欠擬閤是構建魯棒模型的重要一步,我們會深入探討其産生原因,並介紹多種防止過擬閤的方法,如正則化(L1、L2)、Dropout、早停法、數據增強等。  第二部分:Keras快速上手與模型構建  Keras作為一款用戶友好、高度模塊化的深度學習框架,極大地降低瞭深度學習模型的開發門檻。本書的第二部分將帶你快速掌握Keras的使用,從安裝配置到構建你的第一個深度學習模型。  首先,我們會詳細介紹Keras的核心組件,包括模型(Sequential和Model API)、層(Dense, Conv2D, MaxPooling2D, LSTM, GRU等)、激活函數(ReLU, Sigmoid, Tanh等)、優化器(SGD, Adam, RMSprop等)以及損失函數(MSE, CategoricalCrossentropy, BinaryCrossentropy等)。我們將通過實際代碼示例,演示如何使用這些組件來搭建不同類型的神經網絡。  然後,我們會循序漸進地引導讀者構建各種常見的神經網絡模型。從最簡單的單層感知機,到多層前饋神經網絡(MLP),再到捲積神經網絡(CNN),最後是循環神經網絡(RNN)。  對於MLP,我們將重點講解如何構建多層結構,如何選擇閤適的隱藏層數量和神經元數量,以及如何應用激活函數和正則化技術。  對於CNN,本書將深入講解捲積層(Conv2D)的工作原理,如何通過捲積核提取圖像的局部特徵,以及池化層(MaxPooling2D)如何實現特徵的下采樣和減小模型對位置變化的敏感性。我們將通過構建經典的CNN模型,如LeNet-5,以及應用於圖像分類任務的實踐,讓讀者理解CNN在圖像處理領域的強大能力。  對於RNN,本書將重點介紹其處理序列數據的特性,並詳細講解LSTM(長短期記憶網絡)和GRU(門控循環單元)的內部結構和工作機製,理解它們如何解決傳統RNN的梯度消失問題,並應用於文本生成、機器翻譯等序列任務。  此外,本書還將涵蓋模型訓練的各個環節,包括數據預處理(歸一化、one-hot編碼等)、批次訓練(batch training)、模型編譯(compiling model)以及模型評估(evaluating model)。我們會詳細講解如何利用`fit()`方法進行模型訓練,如何監控訓練過程中的損失和準確率,以及如何使用`evaluate()`方法來評估模型的性能。  最後,本書還會介紹模型保存與加載、模型微調(fine-tuning)以及遷移學習(transfer learning)等高級技巧,幫助讀者在實際項目中更高效地利用預訓練模型,加速開發進程。  第三部分:深度學習前沿技術與應用  深度學習是機器學習領域最令人興奮的方嚮之一,它在圖像識彆、語音識彆、自然語言處理等眾多領域取得瞭突破性的進展。本書的第三部分將聚焦深度學習的前沿技術,帶領讀者深入瞭解其背後的原理和應用。  我們將從深度學習的基本概念齣發,解釋神經網絡的層次化特徵學習能力,以及為什麼“深度”能夠帶來如此強大的性能。然後,我們將深入探討各種先進的神經網絡架構:     捲積神經網絡(CNN)的進階應用:除瞭基礎的CNN,我們還將介紹更復雜的CNN架構,如ResNet(殘差網絡)如何通過殘差連接解決深度網絡的訓練難題,Inception(GoogLeNet)如何通過多尺度捲積捕捉不同大小的特徵,以及MobileNet等輕量級CNN如何優化模型以適應移動端部署。    循環神經網絡(RNN)的深入解析:我們將進一步探討RNN在自然語言處理(NLP)中的應用,包括詞嵌入(Word Embeddings)技術(如Word2Vec, GloVe)如何將離散的詞語轉化為連續的嚮量錶示,以及如何構建基於RNN的文本分類、情感分析、命名實體識彆等模型。    注意力機製(Attention Mechanism):注意力機製是近年來深度學習領域的一項革命性技術,它允許模型在處理序列數據時,動態地關注輸入序列的不同部分。我們將詳細講解自注意力(Self-Attention)和多頭注意力(Multi-Head Attention)的工作原理,以及它們如何在Transformer模型中發揮核心作用。    Transformer模型:作為NLP領域的顛覆性模型,Transformer及其變種(如BERT, GPT係列)徹底改變瞭序列建模的麵貌。本書將深入剖析Transformer的Encoder-Decoder架構,理解其如何利用自注意力和位置編碼(Positional Encoding)來並行處理序列,並剋服RNN的順序計算限製。我們將討論Transformer在機器翻譯、文本生成、問答係統等任務中的強大錶現。    生成對抗網絡(GANs):GANs是深度學習在圖像生成領域的一項重要突破。我們將詳細介紹GANs的基本框架,包括生成器(Generator)和判彆器(Discriminator)的對抗訓練過程,以及DCGAN、StyleGAN等變種在生成逼真圖像方麵的應用。    模型部署與優化:除瞭理論和模型構建,本書還將觸及模型部署的實際問題,包括模型壓縮、量化、剪枝等技術,以及如何在不同的平颱(如服務器、移動設備)上高效地部署深度學習模型。  本書的結構設計兼顧瞭理論的嚴謹性和實踐的可操作性。每個章節都配有清晰的代碼示例和詳細的解釋,鼓勵讀者動手實踐,通過解決實際問題來加深理解。無論你是想為你的項目添加智能功能,還是希望在人工智能領域進行更深入的研究,本書都將是你寶貴的參考資料。通過係統學習,你將能夠獨立地設計、實現和優化各種機器學習和深度學習模型,從而在這個日新月異的領域中脫穎而齣。