機器學習與R語言(原書第2版)

機器學習與R語言(原書第2版) 下載 mobi epub pdf 電子書 2024


簡體網頁||繁體網頁
[美] 布雷特·蘭茨(Brett Lantz) 著,李洪成,許金煒,李艦譯 譯

下載链接在页面底部


點擊這裡下載
    

想要找書就要到 新城書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

發表於2024-11-23


圖書介紹


齣版社: 機械工業齣版社
ISBN:9787111553281
版次:1
商品編碼:12054697
品牌:機工齣版
包裝:平裝
叢書名: 數據科學與工程技術叢書
開本:16開
齣版時間:2017-03-01
用紙:膠版紙
頁數:278


類似圖書 點擊查看全場最低價

相關圖書





圖書描述

內容簡介

  本書共12章:第1章介紹機器學習的基本概念和理論,並介紹用於機器學習的R軟件環境的準備;第2章介紹如何應用R來管理數據,進行數據的探索分析和數據可視化;第3~9章介紹典型的機器學習算法,包括k近鄰分類算法、樸素貝葉斯算法、決策樹和規則樹、迴歸預測、黑盒算法——神經網絡和支持嚮量機、關聯分析、k均值聚類,並給齣大量的實際案例和詳細的分析步驟,例如乳腺癌的判斷、垃圾短信的過濾、貸款違約的預測、毒蘑菇的判彆、醫療費用的預測、建築用混凝土強度的預測、光學字符的識彆、超市購物籃關聯分析以及市場細分等;第10章介紹模型性能評價的原理和方法;第11章給齣提高模型性能的幾種常用方法;第12章討論用R進行機器學習時可能遇到的一些高級專題,如特殊形式的數據、大數據集的處理、並行計算和GPU計算等技術。

目錄

推薦序
譯者序
前言
關於審稿人
第1章 機器學習簡介1
1.1 機器學習的起源1
1.2 機器學習的使用與濫用3
1.2.1 機器學習的成功使用3
1.2.2 機器學習的限製4
1.2.3 機器學習的倫理方麵5
1.3 機器如何學習6
1.3.1 數據存儲7
1.3.2 抽象化7
1.3.3 一般化9
1.3.4 評估10
1.4 實踐中的機器學習11
1.4.1 輸入數據的類型11
1.4.2 機器學習算法的類型12
1.4.3 為輸入數據匹配算法14
1.5 使用R進行機器學習15
1.5.1 安裝R添加包15
1.5.2 載入和卸載R添加包16
1.6 總結16
第2章 數據的管理和理解18
2.1 R數據結構18
2.1.1 嚮量18
2.1.2 因子20
2.1.3 列錶21
2.1.4 數據框23
2.1.5 矩陣和數組25
2.2 用R管理數據27
2.2.1 保存、載入和移除R數據結構27
2.2.2 用CSV文件導入和保存數據28
2.3 探索和理解數據29
2.3.1 探索數據的結構29
2.3.2 探索數值變量30
2.3.3 探索分類變量38
2.3.4 探索變量之間的關係40
2.4 總結43
第3章 懶惰學習—使用近鄰分類44
3.1 理解近鄰分類44
3.1.1 kNN算法45
3.1.2 為什麼kNN算法是懶惰的50
3.2 例子—用kNN算法診斷乳腺癌51
3.2.1 第1步—收集數據51
3.2.2 第2步—探索和準備數據52
3.2.3 第3步—基於數據訓練模型55
3.2.4 第4步—評估模型的性能56
3.2.5 第5步—提高模型的性能57
3.3 總結59
第4章 概率學習—樸素貝葉斯分類60
4.1 理解樸素貝葉斯60
4.1.1 貝葉斯方法的基本概念61
4.1.2 樸素貝葉斯算法65
4.2 例子—基於貝葉斯算法的手機垃圾短信過濾69
4.2.1 第1步—收集數據69
4.2.2 第2步—探索和準備數據70
4.2.3 第3步—基於數據訓練模型81
4.2.4 第4步—評估模型的性能82
4.2.5 第5步—提高模型的性能83
4.3 總結84
第5章 分而治之—應用決策樹和規則進行分類85
5.1 理解決策樹85
5.1.1 分而治之86
5.1.2 C5.0決策樹算法89
5.2 例子—使用C5.0決策樹識彆高風險銀行貸款91
5.2.1 第1步—收集數據92
5.2.2 第2步—探索和準備數據92
5.2.3 第3步—基於數據訓練模型94
5.2.4 第4步—評估模型的性能97
5.2.5 第5步—提高模型的性能97
5.3 理解分類規則101
5.3.1 獨立而治之101
5.3.2 1R算法103
5.3.3 RIPPER算法104
5.3.4 來自決策樹的規則105
5.3.5 什麼使決策樹和規則貪婪106
5.4 例子—應用規則學習算法識彆有毒的蘑菇108
5.4.1 第1步—收集數據108
5.4.2 第2步—探索和準備數據108
5.4.3 第3步—基於數據訓練模型109
5.4.4 第4步—評估模型的性能111
5.4.5 第5步—提高模型的性能112
5.5 總結114
第6章 預測數值型數據—迴歸方法115
6.1 理解迴歸115
6.1.1 簡單綫性迴歸117
6.1.2 普通最小二乘估計119
6.1.3 相關性120
6.1.4 多元綫性迴歸121
6.2 例子—應用綫性迴歸預測醫療費用124
6.2.1 第1步—收集數據124
6.2.2 第2步—探索和準備數據125
6.2.3 第3步—基於數據訓練模型129
6.2.4 第4步—評估模型的性能131
6.2.5 第5步—提高模型的性能132
6.3 理解迴歸樹和模型樹134
6.4 例子—用迴歸樹和模型樹估計葡萄酒的質量136
6.4.1 第1步—收集數據137
6.4.2 第2步—探索和準備數據137
6.4.3 第3步—基於數據訓練模型139
6.4.4 第4步—評估模型的性能142
6.4.5 第5步—提高模型的性能143
6.5 總結145
第7章 黑箱方法—神經網絡和支持嚮量機147
7.1理解神經網絡147
7.1.1從生物神經元到人工神經元148
7.1.2激活函數149
7.1.3網絡拓撲151
7.1.4用後嚮傳播訓練神經網絡154
7.2例子—用人工神經網絡對混凝土的強度進行建模155
7.2.1第1步—收集數據155
7.2.2第2步—探索和準備數據156
7.2.3第3步—基於數據訓練模型157
7.2.4第4步—評估模型的性能159
7.2.5第5步—提高模型的性能159
7.3理解支持嚮量機161
7.3.1用超平麵分類161
7.3.2對非綫性空間使用核函數164
7.4例子—用支持嚮量機進行光學字符識彆166
7.4.1第1步—收集數據166
7.4.2第2步—探索和準備數據167
7.4.3第3步—基於數據訓練模型168
7.4.4第4步—評估模型的性能170
7.4.5第5步—提高模型的性能171
7.5總結172
第8章 探尋模式—基於關聯規則的購物籃分析173
8.1理解關聯規則173
8.1.1用於關聯規則學習的Apriori算法174
8.1.2度量規則興趣度—支持度和置信度175
8.1.3用Apriori原則建立規則176
8.2例子—用關聯規則確定經常一起購買的食品雜貨177
8.2.1第1步—收集數據177
8.2.2第2步—探索和準備數據178
8.2.3第3步—基於數據訓練模型183
8.2.4第4步—評估模型的性能185
8.2.5第5步—提高模型的性能187
8.3總結190
第9章 尋找數據的分組—k均值聚類191
9.1理解聚類191
9.1.1聚類—一種機器學習任務192
9.1.2k均值聚類算法193
9.2例子—用k均值聚類探尋青少年市場細分198
9.2.1第1步—收集數據199
9.2.2第2步—探索和準備數據199
9.2.3第3步—基於數據訓練模型203
9.2.4第4步—評估模型的性能205
9.2.5第5步—提高模型的性能207
9.3總結208

前言/序言

  機器學習的核心是將信息轉化為具有可行性的情報的算法。這一事實使得機器學習非常適用於當今的大數據時代。如果沒有機器學習,要跟上海量的信息數據流幾乎是不可能的。
  鑒於R不斷增長的地位(R是一個跨平颱的、零成本的統計編程環境),現在是開始使用機器學習的最好時代。R提供瞭一套功能強大且易於學習的工具,這些工具可以幫助你發現數據背後隱藏的信息。
  通過把實踐案例研究與基本理論(你需要理解這些理論在後颱是如何運行的)相結閤,本書提供瞭將機器學習應用到項目中所需要的全部知識。
  本書涵蓋的內容第1章介紹瞭用來定義和區分機器學習算法的術語和概念,並給齣瞭將學習任務與適當算法相匹配的方法。
  第2章提供瞭一個在R中自己實際動手操作數據的機會,並討論瞭基本的數據結構以及用於載入、探索和理解數據的程序。
  第3章教你如何將一個簡單且功能強大的學習算法應用於你的第一個學習任務:識彆癌癥的惡性樣本。
  第4章揭示瞭用於先進的垃圾郵件過濾係統的概率的基本概念,並且在建立你自己的垃圾郵件過濾器的過程中,你將學習文本挖掘的基本知識。
  第5章探索兩種學習算法,它們的預測不僅精確而且容易解釋。我們將把這兩種算法應用於對透明度要求很高的任務中。
  第6章介紹瞭用於數值預測的機器學習算法。由於這些技術在很大程度上來源於統計領域,所以你還將通過學習必要的基本指標來理解數值之間的關係。
  第7章包括兩個極其復雜但功能強大的機器學習算法。盡管數學可能會讓人望而生畏,但是我們將以簡單的術語,結閤實際例子來說明它們內部的運作原理。
  第8章揭示瞭許多零售商使用的推薦係統的算法。如果你想知道零售商是如何比你自己更瞭解你的購物習慣的,本章將揭示他們的秘密。
  第9章介紹k均值聚類。該算法用來查找相關個體的聚類。我們將使用該算法來確定一個網絡社區內的分布。
  第10章提供瞭度量機器學習項目是否成功的信息,並提供瞭機器學習算法在未來數據上性能的可靠估計。
  第11章揭示瞭在機器學習競賽中排名最靠前的團隊所采用的方法。如果你具有競爭意識,或者僅僅想獲取數據中盡可能多的信息,那麼需要學習這些技術。
  第12章探討瞭機器學習的前沿主題。從使用大數據到使R的運行速度更快,涉及的這些主題將幫助你拓展使用R進行數據挖掘的界限。
  學習本書的知識準備本書中的例子是基於Microsoft Windows和Mac OS X係統的R 3.2.0進行編寫與測試的,當然,對於任意最新的R版本,這些例子基本上都能運行。
  本書讀者對象本書適用於任何希望使用數據來采取行動的人。或許你已經對機器學習有些瞭解但從來沒有使用過R,或許你已經對R有些瞭解但機器學習對於你來說是全新的知識,無論何種情況,本書將讓你快速上手。稍微熟悉一些基本的數學和編程概念將是有幫助的,但先前的經驗並不是必需的,你隻需要有好奇心就行。
  本書約定在本書中,你將發現一些用於區分不同類型信息的文本樣式。下麵是這些樣式的一些例子,以及它們的含義解釋。
  文本中的代碼字、數據庫錶名、文件夾名、文件名、文件擴展名、路徑名、虛擬URL、用戶輸入和Twitter句柄如下所示:“安裝一個添加包的最直接方式是通過install.packages()函數。”
  代碼段如下所示:
  任何命令行輸入或輸齣如下所示:
  新的術語(new term)和重要詞匯(important word)以黑體顯示。你在屏幕上看到的單詞,例如,在菜單或對話框中看到的單詞,像這樣齣現在文本中:“CRAN頁麵左邊的任務視圖鏈接提供添加包的長列錶。”
  警告或者重要注釋。
  提示和技巧。
  緻謝沒有傢人和朋友的支持,編寫本書根本是不可能的。特彆地,我要非常感謝我的妻子Jessica在過去的一年中對我的耐心與鼓勵。在我的兒子Will齣生時第1版的寫作正在進行中,在我的寫作中他分散瞭我較多的精力,在本書齣版後他很快就要成長為一名大男孩。不知道是相關還是因果,仿佛每次我打開本書,我的傢人都會在我的眼前齣現!我把本書獻給我的孩子們,希望有一天他們能從中受到啓發,應對重大的挑戰,並跟隨他們的好奇心,無論他們的好奇心會通嚮哪裏。
  我還要感謝支持本書的很多人。本書的很多想法來源於我與密歇根大學、聖母大學以及中佛羅裏達大學的教育工作者、同事以及閤作者的互動。此外,如果沒有各位研究人員以公開齣版物、課程和源代碼的形式分享他們的專業知識,本書可能根本就不會存在。最後,我要感謝R團隊和所有那些貢獻R添加包的人員的努力,是他們的努力最終為大傢普及瞭機器學習。我真心希望我的研究是機器學習這塊馬賽剋中有價值的一片圖案。
  譯 者 序隨著大數據的概念變得越來越流行,對數據的探索、分析和預測成為大數據分析領域的基本技能之一。作為探索和分析數據的基本理論和工具,機器學習和數據挖掘成為時下熱門的技術。R作為功能強大且免費的數據分析工具,在數據分析領域獲得瞭越來越多用戶的青睞。本書介紹瞭如何使用R來進行現實世界中的機器學習,如何從數據中獲取可以付諸行動的見解。
  本書的作者Brett Lantz在機器學習領域具有十餘年的實踐經驗。本書介紹瞭多種機器學習算法。在給齣相應的機器學習算法的核心理論之後,隨後都給齣瞭一個實際的案例,從對案例數據的探索、整理,到模型的建立和模型的評估,每一步都給齣瞭詳盡的步驟和R代碼。
  本書共分12章。第1章介紹瞭機器學習的基本概念和理論,並介紹瞭用於機器學習的R軟件環境的準備。第2章介紹瞭如何應用R來管理數據,進行數據的探索分析和數據可視化。第3章到第9章介紹瞭典型的機器學習算法和案例,它們分彆是:k近鄰分類算法、樸素貝葉斯算法、決策樹和規則樹、迴歸預測、黑盒算法—神經網絡和支持嚮量機、關聯分析、k均值聚類。伴隨著這些算法的介紹,書中給齣瞭大量的實際案例,並給齣瞭詳細的分析步驟,案例包括乳腺癌的判斷、垃圾短信的過濾、貸款違約的預測、毒蘑菇的判彆、醫療費用的預測、建築用混凝土強度的預測、光學字符的識彆、購物籃關聯分析以及市場細分等。第10章介紹瞭模型性能評價的原理和方法。第11章給齣瞭提高模型性能的幾種常用方法。第12章討論瞭用R進行機器學習時可能遇到的一些高級專題,例如特殊形式的數據、大數據集的處理、並行計算和GPU計算等技術。
  R本身是一款十分優秀的數據分析和數據可視化軟件,現在R中有大量用於機器學習的添加包。本書以機器學習算法為主綫,通過案例學習的形式來組織內容,脈絡清晰,並且各章自成體係。讀者可以從頭逐章學習,也可以找到自己所需要的內容來進行學習。讀者隻需要具有R的一些基本知識即可,不需要具備機器學習的深厚基礎。不管是R初學者,還是熟練的R用戶,都能從書中找到對自己有用的內容。
  譯者曾經應用本書的部分內容進行教學,學生都反映這些內容具有極強的實用價值,許多內容直接或者略加修改就可以應用到他們的實際工作中。我們有幸受機械工業齣版社委托將此書譯成中文,希望中文版的齣版能夠給國內讀者學習R與機器學習帶來方便。
  在本書的翻譯過程中,得到瞭繆傑和王春華兩位編輯的大力支持和幫助,本書的編輯盛思源老師具有豐富的經驗,為本書的齣版付齣瞭大量的勞動,這裏對他們的支持和幫助錶示衷心的感謝。本書的翻譯工作由李洪成、許金煒和李艦共同完成,潘文捷參與瞭本書的部分工作,全書由李洪成統一定稿。
  由於時間和水平所限,難免會有不當之處,希望同行和讀者多加指正。
  李洪成


機器學習與R語言(原書第2版) 下載 mobi epub pdf txt 電子書 格式

機器學習與R語言(原書第2版) mobi 下載 pdf 下載 pub 下載 txt 電子書 下載 2024

機器學習與R語言(原書第2版) 下載 mobi pdf epub txt 電子書 格式 2024

機器學習與R語言(原書第2版) 下載 mobi epub pdf 電子書
想要找書就要到 新城書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

不錯不錯不錯不錯不錯不錯

評分

還沒看,包裝感覺一般!

評分

還沒看,包裝感覺一般!

評分

不錯又快又好的京東,一直買的,信賴。

評分

不錯,活動價格比較實惠的。

評分

不錯,很滿意,一次滿意的購物

評分

東西不錯 很有用 再接再厲 東西不錯 很有用 再接再厲東西不錯 很有用 再接再厲 東西不錯 很有用 再接再厲東西不錯 很有用 再接再厲 東西不錯 很有用 再接再厲東西不錯 很有用 再接再厲 東西不錯 很有用 再接再厲

評分

不錯,很滿意,一次滿意的購物

評分

很多算法及原理都講得很清晰

類似圖書 點擊查看全場最低價

機器學習與R語言(原書第2版) mobi epub pdf txt 電子書 格式下載 2024


分享鏈接




相關圖書


本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 book.cndgn.com All Rights Reserved. 新城書站 版权所有