編輯推薦
適讀人群 :數據科學相關技術人員 高等院校數據科學相關專業 隻要學會數據思維,數據分析任你擺布
隻要有想法肯動腦,有無基礎皆可學會
隻要懂得指標設計,項目落地信手捏來
內容簡介
在數據為主導的今天,對於一種已經成型的模型,“怎麼用”通常不是問題,用個軟件或者編幾行程序就能得到結果瞭,問題一般都齣在模型“什麼時候用”和“用完瞭,然後呢”。《數據分析師養成寶典》就集中討論後麵兩件事情。
《數據分析師養成寶典》共27章,分為業務理解篇(第1~4章)、指標設計篇(第5~7章)、數據建模篇(第8~16章)、價值展現篇(第17~19章)和實戰進階篇(第20~27章)。業務理解篇的目的是讓讀者建立正確的思維觀,理解數據,熟悉業務;指標設計篇學習把數據轉換為專傢數據的一些技巧;數據建模篇以R語言為計算平颱實施數據分析全過程;價值展現篇主要討論如何撰寫有價值的數據分析報告;實戰進階篇通過對8個經典案例的分析,使讀者能夠把學到的思維方法、實施工具應用到解決實際問題中,把數據變成價值。
本書可供數據科學相關技術人員閱讀,也可作為高等院校數據科學相關專業的教材或培訓教材,以及數據分析愛好者的參考讀物。
目錄
如何使用本書
第0章說在前麵的話
0.1大數據分析案例
0.2數據分析
0.2.1數據分析不同於信息化係統
0.2.2數據分析不同於統計分析
0.2.3數據分析不同於數據挖掘
0.2.4數據分析不同於數據管理
0.2.5數據分析不同於商業智能
0.2.6數據分析的內容
0.3數據分析師
0.3.1什麼是數據分析師
0.3.2基本要求
0.4數據分析過程
0.4.1業務理解
0.4.2指標設計
0.4.3數據建模
0.4.4分析報告
業務理解篇
第1章正確的思維觀
1.1數據思維
1.2統計思維
1.2.1統計學
1.2.2描述
1.2.3概括
1.2.4分析
1.3邏輯思維
1.3.1上取/下鑽思維
1.3.2求同/求異思維
1.3.3抽離/聯閤思維
1.3.4離開/接近思維
1.3.5層次思維
第2章理解數據
2.1數據是什麼
2.2數據所依存的背景
2.3數據維度
2.4數據敏感
2.5數據質量
2.6理解數據要注意的問題
2.6.1不要對完美數據的盲目執著
2.6.2小樣本數據也能做數據分析
第3章理解業務
3.1全局瞭解——業務模型
3.2動態瞭解——流程模型
3.3靜態瞭解——數據模型
3.4動靜結閤——關鍵業務分析
3.5數據業務化
第4章理解用戶
4.1由粗到細,從宏觀到微觀
4.2由少到多,收集不同層次的需求
4.3數據分析師對理解用戶需求的思考
4.3.1如何用需求分析明確産品目標?
4.3.2數據分析師理解用戶需求應該具備的基本素養
4.3.3如何根據用戶行為去驅動産品?
指標設計篇
第5章數據準備
5.1數據探索
5.1.1缺失值分析與處理
5.1.2異常值分析與處理
5.1.3不一緻數據分析
5.2數據整理
5.2.1規範化
5.2.2數據選擇
5.2.3數據歸約
5.2.4數據變換
5.3數據集成
5.3.1通過嚮量化重構數據
5.3.2為數據添加新變量
5.3.3數據透視錶
5.3.4列聯錶
5.3.5數據整閤
5.3.6分組計算
第6章數據指標
6.1指標和維度
6.2特徵工程
6.2.1特徵工程作用
6.2.2特徵設計
6.2.3特徵選擇
6.2.4特徵提取
6.3指標設計基本方法
6.3.1生成用於判彆的變量
6.3.2生成離散變量
6.3.3業務標簽化
6.4典型業務指標設計
6.4.1零售店鋪數據分析指標
6.4.2電商數據分析指標
第7章數據認知
7.1認知數據的平均水平和波動情況
7.2認知數據的分布
7.3利用相關係數理解數據之間的關係
7.4通過對比認知數據
7.5通過多維交叉來深入認知數據
7.6周期性分析
7.7貢獻度分析
7.8因子分析
數據建模篇
第8章神經網絡
8.1模型原理
8.2進階指導
第9章迴歸分析
9.1模型原理
9.2進階指導
第10章聚類分析
10.1模型原理
10.2進階指導
第11章關聯分析
11.1模型原理
11.2進階指導
第12章決策樹
12.1模型原理
12.2進階指導
第13章隨機森林決策樹
13.1模型原理
13.2進階指導
第14章自適應選擇決策樹
14.1模型原理
14.2進階指導
第15章SVM
15.1模型原理
15.2進階指導
第16章建模指導
16.1建模要注意的問題
16.2R語言中建模常用包
16.3數據分析模型的原理和應用場景
價值展現篇
第17章如何寫好數據分析報告
17.1數據的價值
17.1.1收入
17.1.2支齣
17.1.3風險
17.1.4參照係
17.2講故事
17.2.1數據講故事的四大要點
17.2.2阿裏指數能告訴你……
17.3如何寫報告
17.3.1寫作原則
17.3.2報告的類型和分析能力
17.3.3報告的細節
17.4報告的結構
17.4.1標題
17.4.2背景與目標
17.4.3項目說明
17.4.4分析思路
17.4.5分析主體
17.4.6總結與建議
17.5文字錶達
17.5.1突齣關鍵信息
17.5.2避免囉嗦的錶達
17.5.3站在讀者角度
17.5.4不帶主觀臆斷
17.6分析過程
17.6.1樣本選擇
17.6.2方法實施
17.7注意事項
第18章數據可視化
18.1什麼是數據可視化
18.2數據可視化的作用
18.3可視化建議
18.4科學與藝術的結閤
18.5可視化細節
18.6R語言繪圖
18.6.1低水平繪圖命令
18.6.2高水平繪圖命令
18.6.3交互式繪圖命令
18.7圖形適用場景
第19章數據分析報告製作工具
19.1knitr包
19.1.1安裝knitr
19.1.2Markdown語法
19.1.3報告製作
19.2rmarkdown包
19.2.1創建R Markdown
19.2.2R Markdown文本處理
19.2.3插入代碼塊
19.2.4結果的輸齣
實戰進階篇
第20章校園網中推薦者的推薦價值分析
20.1業務理解
20.2指標設計
20.3描述性分析
20.4模型分析
20.5分析報告
第21章上市企業財務報錶分析與ST預測
21.1業務理解
21.2指標設計
21.3描述性分析
21.4模型分析
21.5分析報告
第22章為什麼銷售會減少——驗證性分析
22.1業務理解
22.2指標設計
22.3描述性分析
22.4結論與建議
第23章什麼樣的顧客會選擇離開——探索性分析
23.1業務理解
23.2指標設計
23.3描述性分析
23.4結論與建議
第24章哪種廣告的效果更好——假設檢驗
24.1業務理解
24.2數據建模
24.3模型分析
24.4結論與建議
第25章如何獲得更多的用戶——多元迴歸分析
25.1業務理解
25.2數據建模
25.3模型分析
25.4結論與建議
第26章航空公司顧客價值分析——聚類
26.1業務理解
26.2指標設計
26.3模型構建
26.4模型評價
26.5結論與建議
第27章竊電用戶行為分析——決策樹
27.1業務理解
27.2簡單指標設計
27.3描述性分析
27.4復雜指標設計
前言/序言
隨著大數據時代的到來,企業管理者對數據價值的重視程度越來越高,他們渴望從企業內部數據、外部數據中獲得更多的信息財富,並以此為依據,幫助自己做齣正確的戰略決策。 如今在數據分析師的崗位上,大多數員工都是非統計專業齣身,遠遠達不到專業數據分析要求,如何能夠快速找到突破口,幫助對數據分析有興趣的人員全麵掌握數據分析技巧,基於此,《數據分析師養成寶典旨》在幫助讀者解決如下睏惑:學習前的睏惑學習後將收獲什麼零基礎入門數據分析領域隻要有數據思維,數據分析任你擺布不會編程隻要有想法,R語言幫你搞定對行業業務流程不瞭解項目實際操作從業務思路到落地技能全掌握不會寫數據分析報告掌握瞭前三項技能,寫數據分析報告是小意思
全書分為5篇:業務理解篇、指標設計篇、數據建模篇、價值展現篇和實戰進階篇,從數據到價值的演化如下圖所示。
業務數據化是把數據變為價值的先決條件,目的是建立正確的思維觀,理解數據,熟悉業務;對數據描述、概括和分析是把數據變為價值的核心,是一個數據分析項目的實施過程;數據分析報告是數據價值的最終形態,好的數據分析報告是企業決策的重要依據,專業的數據分析報告能體現你的職場價值。
如果把整個數據分析過程比作開飯店,業務數據化相當於菜譜,雖然是紙上談兵,但也是不可缺少的一環;描述、概括和分析相當於燒菜的廚藝,這是開飯店的先決條件,菜燒得好可以品嘗,不能保證盈利;撰寫數據分析報告相當於開飯店的理由,關鍵是說清楚如何讓飯店盈利?盈利多少?菜譜、廚藝、開飯店理由三者相輔相成,缺少任何一環,盈利的目標都難以達成。
本書的特點如下:
1�甭淶厥滌�
全書分為5篇,共27章,每一章的內容都從實際業務齣發,書中所提供的思維方法、分析框架、數據指標設計與操作步驟都可以直接運用到工作當中。
2�敝氐狼崾�
“術”是數據分析方法和工具,“道”強調瞭如何對數據敏感,如何把數據分析工作融入商業思考,彌補許多人隻懂理論脫離實踐的不足。
3�綳憔嗬虢喲バ幸登把�
本書以R語言為計算平颱,無論你是什麼專業,無論你是否有編程基礎,無論你是否學過統計,要想成為一名數據分析師,本書能幫到你。
4�碧逑低暾�
近年來,數據分析師可謂是大數據時代最熱門的職業,相關的資料五花八門,讓讀者無所適從。從學科體係來看,無非包括三個層次:理論、工具和技巧。但由於數據分析的特殊性,依賴於思維和業務,所以,市場上成體係的書籍並不多見,大多是講理論和工具,本書試圖在數據分析完整的體係上做些探索。
在本書的編寫過程,得到瞭許多人的支持,再次錶示感謝:
感謝南通大學-南通智能信息技術聯閤研究中心給予的資金資助。
感謝矽湖職業技術學院在培訓、實驗方麵所給予的支持。
感謝南通大學教材建設資金資助。
感謝我的學生瀋佳傑、謝璐、鬍海濤、姚澤峰、周春瑜、孫麗麗、楊琴和趙麗敏在資料整理方麵所做的貢獻。
其次,感謝我的妻子和兒女們,正是你們的鼓勵和支持,我纔會走到今天,你們的鼓勵和陪伴永遠是我前進的動力。
最後,特彆要感謝我的母親和已故的父親,感謝你們的養育之恩。僅以此書獻給健在的母親,希望母親健康,健康,更健康。
數據分析領域發展迅猛,對許多問題作者並未做深入研究,一些有價值的新內容也來不及收入本書。加上作者知識水平和實踐經驗有限,書中難免存在不足之處,敬請讀者批評指正。
數據分析師養成寶典 下載 mobi epub pdf txt 電子書 格式