發表於2024-11-23
阿裏巴巴資深數據分析專傢盧輝撰寫,多年數據挖掘應用實踐的經驗結晶
實戰性強,從數據分析師的角度對商業實戰進行瞭總結和歸納,以大量事實和案例展現瞭“以業務為核心,以思路為重點,以挖掘技術為輔佐”的數據挖掘商業實踐
海報:
《數據挖掘與數據化運營實戰 思路、方法、技巧與應用》是目前有關數據挖掘在數據化運營實踐領域比較全麵和係統的著作,也是諸多數據挖掘書籍中為數不多的穿插大量真實的實踐應用案例和場景的著作,更是創造性地針對數據化運營中不同分析挖掘課題類型,推齣一一對應的分析思路集錦和相應的分析技巧集成,為讀者提供“菜單化”實戰錦囊的著作。作者結閤自己數據化運營實踐中大量的項目經驗,用通俗易懂的“非技術”語言和大量活潑生動的案例,圍繞數據分析挖掘中的思路、方法、技巧與應用,全方位整理、總結、分享,幫助讀者深刻領會和掌握“以業務為核心,以思路為重點,以分析技術為輔佐”的數據挖掘實踐應用寶典。
《數據挖掘與數據化運營實戰 思路、方法、技巧與應用》共19章,分為三個部分:基礎篇(第1~4章)係統介紹瞭數據分析挖掘和數據化運營的相關背景、數據化運營中“協調配閤”的核心,以及實踐中常見分析項目類型;實戰篇(第6~13章)主要介紹實踐中常見的分析挖掘技術的實用技巧,並對大量的實踐案例進行瞭全程分享展示;思想意識篇(第5章,第14~19章)主要是有關數據分析師的責任、意識、思維的培養和提升的總結和探索,以及一些有效的項目質控製度和經典的方法論介紹。
盧輝,阿裏巴巴商業智能部數據分析專傢,從事數據庫營銷和數據化運營分析多年,曾在不同行業以商務拓展(BD)經理、項目經理、市場營銷部經理、高級谘詢顧問、數據分析專傢的身份親曆大量的數據庫營銷和互聯網行業數據化運營應用項目。目前在阿裏巴巴主要從事數據化運營的數據挖掘規劃、項目管理、實施,擁有比較豐富的互聯網行業數據化運營項目經驗。關注數據化運營的規劃和數據挖掘項目的管理。
推薦序
前言
第1章 什麼是數據化運營
1.1 現代營銷理論的發展曆程
1.1.1 從4P到4C
1.1.2 從4C到3P3C
1.2 數據化運營的主要內容
1.3 為什麼要數據化運營
1.4 數據化運營的必要條件
1.4.1 企業級海量數據存儲的實現
1.4.2 精細化運營的需求
1.4.3 數據分析和數據挖掘技術的有效應用
1.4.4 企業決策層的倡導與持續支持
1.5 數據化運營的新現象與新發展
1.6 關於互聯網和電子商務的最新數據
第2章 數據挖掘概述
2.1 數據挖掘的發展曆史
2.2 統計分析與數據挖掘的主要區彆
2.3 數據挖掘的主要成熟技術以及在數據化運營中的主要應用
2.3.1 決策樹
2.3.2 神經網絡
2.3.3 迴歸
2.3.4 關聯規則
2.3.5 聚類
2.3.6 貝葉斯分類方法
2.3.7 支持嚮量機
2.3.8 主成分分析
2.3.9 假設檢驗
2.4 互聯網行業數據挖掘應用的特點
第3章 數據化運營中常見的數據分析項目類型
3.1 目標客戶的特徵分析
3.2 目標客戶的預測(響應、分類)模型
3.3 運營群體的活躍度定義
3.4 用戶路徑分析
3.5 交叉銷售模型
3.6 信息質量模型
3.7 服務保障模型
3.8 用戶(買傢、賣傢)分層模型
3.9 賣傢(買傢)交易模型
3.10 信用風險模型
3.11 商品推薦模型
3.11.1 商品推薦介紹
3.11.2 關聯規則
3.11.3 協同過濾算法
3.11.4 商品推薦模型總結
3.12 數據産品
3.13 決策支持
第4章 數據化運營是跨專業、跨團隊的協調與閤作
4.1 數據分析團隊與業務團隊的分工和定位
4.1.1 提齣業務分析需求並且能勝任基本的數據分析
4.1.2 提供業務經驗和參考建議
4.1.3 策劃和執行精細化運營方案
4.1.4 跟蹤運營效果、反饋和總結
4.2 數據化運營是真正的多團隊、多專業的協同作業
4.3 實例示範數據化運營中的跨專業、跨團隊協調閤作
第5章 分析師常見的錯誤觀念和對治的管理策略
5.1 輕視業務論
5.2 技術萬能論
5.3 技術尖端論
5.4 建模與應用兩段論
5.5 機器萬能論
5.6 幸福的傢庭都是相似的,不幸的傢庭各有各的不幸
第6章 數據挖掘項目完整應用案例演示
6.1 項目背景和業務分析需求的提齣
6.2 數據分析師參與需求討論
6.3 製定需求分析框架和分析計劃
6.4 抽取樣本數據、熟悉數據、數據清洗和摸底
6.5 按計劃初步搭建挖掘模型
6.6 與業務方討論模型的初步結論,提齣新的思路和模型優化方案
6.7 按優化方案重新抽取樣本並建模,提煉結論並驗證模型
6.8 完成分析報告和落地應用建議
6.9 製定具體的落地應用方案和評估方案
6.10 業務方實施落地應用方案並跟蹤、評估效果
6.11 落地應用方案在實際效果評估後,不斷修正完善
6.12 不同運營方案的評估、總結和反饋
6.13 項目應用後的總結和反思
第7章 數據挖掘建模的優化和限度
7.1 數據挖掘模型的優化要遵循有效、適度的原則
7.2 如何有效地優化模型
7.2.1 從業務思路上優化
7.2.2 從建模的技術思路上優化
7.2.3 從建模的技術技巧上優化
7.3 如何思考優化的限度
7.4 模型效果評價的主要指標體係
7.4.1 評價模型準確度和精度的係列指標
7.4.2 ROC麯綫
7.4.3 KS值
7.4.4 Lift值
7.4.5 模型穩定性的評估
第8章 常見的數據處理技巧
8.1 數據的抽取要正確反映業務需求
8.2 數據抽樣
8.3 分析數據的規模有哪些具體的要求
8.4 如何處理缺失值和異常值
8.4.1 缺失值的常見處理方法
8.4.2 異常值的判斷和處理
8.5 數據轉換
8.5.1 生成衍生變量
8.5.2 改善變量分布的轉換
8.5.3 分箱轉換
8.5.4 數據的標準化
8.6 篩選有效的輸入變量
8.6.1 為什麼要篩選有效的輸入變量
8.6.2 結閤業務經驗進行先行篩選
8.6.3 用綫性相關性指標進行初步篩選
8.6.4 R平方
8.6.5 卡方檢驗
8.6.6 IV和WOE
8.6.7 部分建模算法自身的篩選功能
8.6.8 降維的方法
8.6.9 最後的準則
8.7 共綫性問題
8.7.1 如何發現共綫性
8.7.2 如何處理共綫性
第9章 聚類分析的典型應用和技術小竅門
9.1 聚類分析的典型應用場景
9.2 主要聚類算法的分類
9.2.1 劃分方法
9.2.2 層次方法
9.2.3 基於密度的方法
9.2.4 基於網格的方法
9.3 聚類分析在實踐應用中的重點注意事項
9.3.1 如何處理數據噪聲和異常值
9.3.2 數據標準化
9.3.3 聚類變量的少而精
9.4 聚類分析的擴展應用
9.4.1 聚類的核心指標與非聚類的業務指標相輔相成
9.4.2 數據的探索和清理工具
9.4.3 個性化推薦的應用
9.5 聚類分析在實際應用中的優勢和缺點
9.6 聚類分析結果的評價體係和評價指標
9.6.1 業務專傢的評估
9.6.2 聚類技術上的評價指標
9.7 一個典型的聚類分析課題的案例分享
9.7.1 案例背景
9.7.2 基本的數據摸底
9.7.3 基於用戶樣本的聚類分析的初步結論
第10章 預測響應(分類)模型的典型應用和技術小竅門
10.1 神經網絡技術的實踐應用和注意事項
10.1.1 神經網絡的原理和核心要素
10.1.2 神經網絡的應用優勢
10.1.3 神經網絡技術的缺點和注意事項
10.2 決策樹技術的實踐應用和注意事項
10.2.1 決策樹的原理和核心要素
10.2.2 CHAID算法
10.2.3 CART算法
10.2.4 ID3算法
10.2.5 決策樹的應用優勢
10.2.6 決策樹的缺點和注意事項
10.3 邏輯迴歸技術的實踐應用和注意事項
10.3.1 邏輯迴歸的原理和核心要素
10.3.2 迴歸中的變量篩選方法
10.3.3 邏輯迴歸的應用優勢
10.3.4 邏輯迴歸應用中的注意事項
10.4 多元綫性迴歸技術的實踐應用和注意事項
10.4.1 綫性迴歸的原理和核心要素
10.4.2 綫性迴歸的應用優勢
10.4.3 綫性迴歸應用中的注意事項
10.5 模型的過擬閤及對策
10.6 一個典型的預測響應模型的案例分享
10.6.1 案例背景
10.6.2 基本的數據摸底
10.6.3 建模數據的抽取和清洗
10.6.4 初步的相關性檢驗和共綫性排查
10.6.5 潛在自變量的分布轉換
10.6.6 自變量的篩選
10.6.7 響應模型的搭建與優化
10.6.8 冠軍模型的確定和主要的分析結論
10.6.9 基於模型和分析結論基礎上的運營方案
10.6.10 模型落地應用效果跟蹤反饋
第11章 用戶特徵分析的典型應用和技術小竅門
11.1 用戶特徵分析所適用的典型業務場景
11.1.1 尋找目標用戶
11.1.2 尋找運營的抓手
11.1.3 用戶群體細分的依據
11.1.4 新品開發的綫索和依據
11.2 用戶特徵分析的典型分析思路和分析技術
11.2.1 3種劃分的區彆
11.2.2 RFM
11.2.3 聚類技術的應用
11.2.4 決策樹技術的應用
11.2.5 預測(響應)模型中的核心自變量
11.2.6 假設檢驗的應用
11.3 特徵提煉後的評價體係
11.4 用戶特徵分析與用戶預測模型的區彆和聯係
11.5 用戶特徵分析案例
第12章 運營效果分析的典型應用和技術小竅門
12.1 為什麼要做運營效果分析
12.2 統計技術在數據化運營中最重要最常見的應用
12.2.1 為什麼要進行假設檢驗
12.2.2 假設檢驗的基本思想
12.2.3 T檢驗概述
12.2.4 兩組獨立樣本T檢驗的假設和檢驗
12.2.5 兩組獨立樣本的非參數檢驗
12.2.6 配對差值的T檢驗
12.2.7 配對差值的非參數檢驗
12.2.8 方差分析概述
12.2.9 單因素方差分析
12.2.10 多個樣本組的非參數檢驗
12.2.11 卡方檢驗
12.2.12 控製變量的方法
12.2.13 AB Test
第13章 漏鬥模型和路徑分析
13.1 網絡日誌和布點
13.1.1 日誌布點
13.1.2 日誌采集
13.1.3 日誌解析
13.1.4 日誌分析
13.2 漏鬥模型與路徑分析的主要區彆和聯係
13.3 漏鬥模型的主要應用場景
13.3.1 運營過程的監控和運營效率的分析與改善
13.3.2 用戶關鍵路徑分析
13.3.3 産品優化
13.4 路徑分析的主要應用場景
13.5 路徑分析的主要算法
13.5.1 社會網絡分析方法
13.5.2 基於序列的關聯分析
13.5.3 最樸素的遍曆方法
13.6 路徑分析案例的分享
13.6.1 案例背景
13.6.2 主要的分析技術介紹
13.6.3 分析所用的數據概況
13.6.4 主要的數據結論和業務解說
13.6.5 主要分析結論的落地應用跟蹤
第14章 數據分析師對業務團隊數據分析能力的培養
14.1 培養業務團隊數據分析意識與能力的重要性
14.2 數據分析師在業務團隊數據分析意識能力培養中的作用
14.3 數據分析師如何培養業務團隊的數據分析意識和能力
14.4 數據分析師培養業務團隊數據分析意識能力的案例分享
14.4.1 案例背景
14.4.2 過程描述
14.4.3 本項目的效果跟蹤
第15章 換位思考
15.1 為什麼要換位思考
15.2 從業務方的角度換位思考數據分析與挖掘
15.3 從同行的角度換位思考數據分析挖掘的經驗教訓
第16章 養成數據分析師的品質和思維模式
16.1 態度決定一切
16.1.1 信念
16.1.2 信心
16.1.3 熱情
16.1.4 敬畏
16.1.5 感恩
16.2 商業意識是核心
16.2.1 為什麼商業意識是核心
16.2.2 如何培養商業意識
16.3 一個基本的方法論
16.4 大膽假設,小心求證
16.5 20/80原理
16.6 結構化思維
16.7 優秀的數據分析師既要客觀,又要主觀
第17章 條條大道通羅馬
17.1 為什麼會條條大道通羅馬
17.2 條條大道有側重
17.3 自覺服從和積極響應
17.3.1 自覺服從
17.3.2 積極響應
17.4 具體示例
第18章 數據挖掘實踐的質量保障流程和製度
18.1 一個有效的質量保障流程製度
18.1.1 業務需求的收集
18.1.2 評估小組評估需求的優先級
18.1.3 課題組的成立及前期摸底
18.1.4 嚮業務方提交正式課題(項目)計劃書
18.1.5 數據分析挖掘的課題展開
18.1.6 嚮業務方提交結論報告及業務落地應用建議
18.1.7 課題(項目)的落地應用和效果監控反饋
18.2 質量保障流程製度的重要性
18.3 如何支持與強化質量保障流程製度
第19章 幾個經典的數據挖掘方法論
19.1 SEMMA方法論
19.1.1 數據取樣
19.1.2 數據探索
19.1.3 數據調整
19.1.4 模式化
19.1.5 評價
19.2 CRISP-DM方法論
19.2.1 業務理解
19.2.2 數據理解
19.2.3 數據準備
19.2.4 模型搭建
19.2.5 模型評估
19.2.6 模型發布
19.3 Tom Khabaza的挖掘9律
所以,除瞭專業的數據分析師之外,業務團隊也需要掌握基本的數據分析技能、培養數據分析的意識,並且這些技能的掌握和意識的培養是多多益善的。企業的數據分析團隊和數據分析師也不應該僅僅局限於單純的數據挖掘技術工作、項目工作,而應肩負起在企業全員中推廣普及數據意識、數據運用技巧的責任,這種責任對於企業而言比單純的一兩個數據挖掘項目更有價值,更能體現
一個數據挖掘團隊或者一個數據挖掘職業人的水準、眼界以及胸懷。隻有能發動人民戰爭的人,纔是真正的英雄,所以隻有讓企業全員都參與並支持你的數據挖掘分析工作,纔能夠真正有效地挖掘企業的數據資源;隻有把自己當成是業務方的一員,真正深入業務實踐中,纔有可能真正體會業務方數據分析能力和意識培養的基礎性和重要性,纔可以有的放矢地幫助業務團隊提升和進步。
口站在業務方的角度進行換位思考,還有更直接的方法,那就是嘗試在一段時間內忘記自己是數據分析師,到業務團隊中從事業務工作,在業務崗位上去體會數據分析人員應該如何支持業務,業務方在哪些方麵急需數據分析的支持。有瞭這段業務經曆,你會用新的眼光看待數據分析工作,會從新的角度完善數據分析工作。
站在業務方的角度思考時可以有不同的方法、不同的方嚮,但是萬變不離其宗,隻要真心投入業務中去,換位思考將會使數據分析師的綜閤能力、工作價值得到提升。所以說,換位思考是數據分析師成長、成熟的好工具。
……
為什麼要寫這本書
自從2002年第一次接觸 “數據挖掘”(Data Mining)這個新名詞以來,轉眼之間我已經在數據挖掘商業應用相關領域度過瞭11年。這11年裏我既見識瞭國外數據挖掘商業應用如火如荼地開展;又經曆瞭從21世紀開始,國內企業在數據挖掘商業應用中的摸索起步,到如今方興未艾的局麵;更有幸在經曆瞭傳統行業的數據挖掘商業應用之後,投身到互聯網行業(當今數據分析商業應用熱火朝天、發展最快,並且對數據和數據挖掘的商業應用依賴性最強的行業)的數據挖掘商業實踐中。這11年是我職業生涯中最為重要的一段時光,從個人生存的角度來說,我找到瞭謀生和養傢糊口的飯碗—數據挖掘工作;從個人歸屬的角度來說,我很幸運地碰到瞭職業與興趣的重閤點。
在國內,“數據挖掘”作為一門復閤型應用學科,其在商業領域的實踐應用及推廣隻有十幾年的時間,在此期間,國內雖然陸續齣版瞭一些相關的書籍,但是絕大多數都是基於理論或者國外經驗來闡述的,少有針對國內企業相關商業實戰的詳細介紹和分享,更缺乏從數據分析師的角度對商業實戰所進行的總結和歸納。因此,從商業應用齣發,基於大量的商業實戰案例而不是基於理論探討的數據挖掘應用書籍成為當今圖書市場和廣大“數據挖掘”學習者的共同需求。
同時,在有幸與數據挖掘商業實踐相伴11年之後,我也想稍微放慢些腳步,正如一段長途跋涉之後需要停下腳步,整理一路經曆的收獲和感悟一樣,我希望將自己一路走來的心得與體會、經驗與教訓、挫摺與成績整理齣來。
基於以上原因,我決定從數據挖掘的商業需求和商業實戰齣發,結閤我10多年來在不同行業(尤其是最近4年在互聯網行業)的大量數據挖掘商業實戰項目,將自己這些年來積纍的經驗和總結分享齣來,希望能夠起到拋磚引玉的作用,為對數據挖掘商業實踐感興趣的朋友、愛好者、數據分析師提供點滴的參考和藉鑒。同時,鑒於“數據化運營”在當今大數據時代已經成為眾多(以後必將越來越多)現代企業的普遍經營戰略,相信本書所分享的大量有關數據化運營的商業實踐項目也可以為企業的管理層、決策層提供一定程度的參考和藉鑒。
我相信,本書總結的心得與體會,可以推動自己今後的工作,會成為我的財富;同時,這些心得與體會對於部分數據分析師來說也可以起到不同程度的參考和藉鑒作用;對於廣大對數據挖掘商業應用感興趣的初學者來說也未嘗不是一種寶貴經驗。
我是從機械製造工藝與設備這個與“數據挖掘”八竿子打不著的專業轉行到數據挖掘商業應用行業的,這與目前國內絕大多數的數據分析挖掘專業人士的背景有較大差彆(國內絕大多數數據分析挖掘專業人士主要來自統
數據挖掘與數據化運營實戰 思路、方法、技巧與應用 下載 mobi epub pdf txt 電子書 格式
數據挖掘與數據化運營實戰 思路、方法、技巧與應用 下載 mobi pdf epub txt 電子書 格式 2024
數據挖掘與數據化運營實戰 思路、方法、技巧與應用 下載 mobi epub pdf 電子書很好 通俗易懂 深入淺齣~印刷質量送貨服務速度很贊
評分買給男朋友看的書 物流超快的 隔天就到瞭 書是正版的 很好
評分剛買就降價瞭,習慣好評吧
評分不錯
評分i,歸西小雞小雞調戲團體操次
評分僅限於電商領域,實體領域對不上
評分感覺挺好的酒感覺挺好的酒感覺挺好的酒
評分很不錯的一本啓濛
評分包裝很好,送貨也很快,昨天下單,今天就到瞭
數據挖掘與數據化運營實戰 思路、方法、技巧與應用 mobi epub pdf txt 電子書 格式下載 2024