發表於2024-11-26
《世界著名計算機教材精選:數據挖掘十大算法》詳細介紹瞭在實際中用途影響十種數據挖掘算法,這十種算法是數據挖掘領域的專傢進行投票篩選的,覆蓋瞭分類、聚類、統計學習、關聯分析和鏈接分析等重要的數據挖掘研究和發展主題。《世界著名計算機教材精選:數據挖掘十大算法》對每一種算法都進行瞭多個角度的深入剖析,包括算法曆史、算法過程、算法特性、軟件實現、前沿發展等,此外,在每章最後還給齣瞭豐富的習題和精挑細選的參考文獻,對於讀者掌握算法基本知識和進一步研究都非常有價值,對數據挖掘、機器學習和人工智能等學科的課程的設計有指導意義。
吳信東(Xindong Wu),教授英國愛丁堡大學人工智能學博士,任美國佛濛特大學計算機科學係主任。吳教授在數據挖掘、知識係統和Web信息開發等研究領域內頗有建樹,在IEEE TKDE、TPAMI、ACMTOIS、DMKD、KAIS、IJCAI、AAAI、ICMI_、KDD、ICDM和WWW等學術會議和期刊上發錶瞭170餘篇學術論文,另外,還齣版瞭18部學術專著和會議文集。他還獲得瞭IEEE ICTAI-2005的論文奬和IEEE ICDM-2007的理論/算法論文奬亞軍。
吳博士是IEEE Transactzons on KnowLedge and Data Engineering(TKDE,由IEEE Computer Society主辦)的主編,IEEE International Con erence on Data Mining (ICDM)的創始人和指導委員會主席,Knowledge and In ormation Systems(KAIS,由Springer發行)的創辦人和榮譽主編,IEEE Computer Society Technical Committee on Intelligent Informatics(TCII)的創始主席(2002-2006),Springer Advanced Information and Knowledge Processing (AI& KP)係列著作的編輯。他還是ICDM'03(the 2003 IEEE International Conference on Data Mining)程序委員會主席和KDD-07(the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining)程序委員會聯閤主席。他獲得瞭2004 ACM SIGKDD服務奬、2006 IEEE ICDM傑齣服務奬,是2005年閤肥科技大學“長江學者奬勵計劃”講座教授。他還是很多學術會議的特邀專傢/專題報告人,如NSF-NGDM'07、PAKDD-07、IEEE EDOC'06、IEEE ICTAI'04、IEEE/WIClACM WI'04lIAT'04、SEKE 2002和PADD-97等。
Vipin Kumar,教授,明尼蘇達大學計算機科學與工程係William Norris講席教授、係主任。他於1977年獲得印度魯爾基理工學院(正式名稱是魯爾基大學)的電子和通信工程學士學位,1979年獲得荷蘭埃因霍溫飛利浦國際學院的電子工程碩士學位,1982年獲得馬裏蘭大學帕剋分校的計算機科學博士學位。Kumar教授的研究興趣主要集中在數據挖掘、生物信息學和高性能計算領域。他提齣瞭評估並行算法可擴展性的恒等效率度量指標,並研發瞭多款稀疏矩陣分解(PSPASES)和圖剖分(METIS,ParMctis, hMetis)的高效並行算法及軟件。他發錶瞭200多篇研究論文,閤編閤著瞭9本學術專著,包括被廣泛使用的教科書Introduction to Parallel Computing和Introduction to Data Mining,者5由Addison-Wesley齣版。Kumar是眾數據挖掘和多並行計算領域的學術會議、專題研討會的主席或共同主席,女口IEEE International Con ference on Data Mining(2002)、International Parallel and Distributed Processing Symposium(2001)和SIAM International Con ference on Data Mining(2001).Kumar是SIAM International Conference on Data Mining指導委員會共同主席,IEEE International Conference on Data Mining和IEEE International Conference on Bioinformatics and Biomedicine指導委員會委員。Kumar是Journal of Statistical Analysis and Data Mining的創始主編之——,IEEE Intelligent In ormatics Bulletin主編和Data Mining and Knowledge Discovery係列圖書(由CRC Press/Chapman Hall齣版)的編輯。Kumar還擔任很多其他學術刊物的編輯,如Data Mining and Kno-wledge Discovery、KnowLedge and Information Systems、IEEE Computational Inteltigence Bulletin、Annual Review of Inteltigent In formatics、Parallel Com puting、Journal of Parallel and Distributed Computing、IEEE Transactions of Data and Kno-wledge Engineering(1993-1997)、IEEE Concurrency(1997-2000)和IEEE ParalleL and Distributed Technology(1995-1997)等。他是ACM會士、IEEE會士、AAAS會士和SIAM會員。Kumar由於在並行算法設計、圖剖分和數據挖掘領域的傑齣貢獻,獲得瞭2005 IEEE Computer Society的技術成就奬。
第1章 C4.5
1.1 引言
1.2 算法描述
1.3 算法特性
1.3.1 決策樹剪枝
1.3.2 連續型屬性
1.3.3 缺失值處理
1.3.4 規則集誘導
1.4 軟件實現
1.5 示例
1.5.1 Golf數據集
1.5.2 Soybean數據集
1.6 高級主題
1.6.1 二級存儲
1.6.2 斜決策樹
1.6.3 特徵選擇
1.6.4 集成方法
1.6.5 分類規則
1.6.6 模型重述
1.7 習題
參考文獻
第2章 k-means
2.1 引言
2.2 算法描述
2.3 可用軟件
2.4 示例
2.5 高級主題
2.6 小結
2.7 習題
參考文獻
第3章 SVM:支持嚮量機
3.1 支持嚮量分類器
3.2 支持嚮量分類器的軟間隔優化
3.3 核技巧
3.4 理論基礎
3.5 支持嚮量迴歸器
3.6 軟件實現
3.7 當前和未來的研究
3.7.1 計算效率
3.7.2 核的選擇
3.7.3 泛化分析
3.7.4 結構化支持嚮量機的學習
3.8 習題
參考文獻
第4章 Apriori
4.1 引言
4.2 算法描述
4.2.1 挖掘頻繁模式和關聯規則
4.2.2 挖掘序列模式
4.2.3 討論
4.3 軟件實現
4.4 示例
4.4.1 可行示例
4.4.2 性能評估
4.5 高級主題
4.5.1 改進Apriori類型的頻繁模式挖掘
4.5.2 無候選的頻繁模式挖掘
4.5.3 增量式方法
4.5.4 稠密錶示:閉閤模式和最大模式
4.5.5 量化的關聯規則
4.5.6 其他的重要性/興趣度度量方法
4.5.7 類彆關聯規則
4.5.8 使用更豐富的形式:序列、樹和圖
4.6 小結
4.7 習題
參考文獻
第5章 EM
5.1 引言
5.2 算法描述
……
第6章 PageRank
第7章 AdaBoost
第8章 kNN!k-最近鄰
第9章 Naive Bayes
第10章 CART:分類和迴歸樹
在香港舉辦的2006年度IEEE數據挖掘國際會議上,與會專傢遴選齣瞭十個最具影響力的數據挖掘算法,也就是本書所列的十個算法:C4.5、k-means、SVM、Apriori、EM、PageRank、AdaBoost、kNN、Naive Bayes和CART。
遴選過程第一步,在2006年9月,我們邀請ACM KDD創新奬得主和IEEE ICDM研究貢獻奬得主每人推薦十個最著名的數據挖掘算法,並提供以下信息:
(a)算法名稱;
(b)算法簡介;
(c)代錶文獻。
我們還要求每個被提名的算法都應被數據挖掘領域的學者廣泛引述和使用,每位推薦人提名的算法集應能代錶數據挖掘的不同領域。除一人外其他所有專傢都給予瞭迴復。
遴選過程第二步,在2006年10月,我們用Google Scholar對每項提名進行瞭驗證,去除瞭引用數低於50的提名,將保留下的所有提名(共18個)分成十個主題:關聯分析、分類、聚類、統計學習、裝袋推舉、序列模式、集成挖掘、粗糙集、鏈接挖掘和圖挖掘。對於某些算法,如k-means,不要求提供發明該算法的原始文獻,但需要提供闡述該算法重要性的近期論文。這些代錶性文獻。
遴選過程第三步,我們動員瞭研究社區的很多人參與,其中包括KDD-06 (the 2006 ACM SIGKDD International Conference on Knowledge Discovery and Data Mining)、ICDM'06 (the 2006 IEEE International Conference on Data Mining)和SDM'06 (the 2006 SIAM International Conference on Data Mining)的程序委員會的全體委員,以及ACM KDD創新奬得主和IEEE ICDM研究貢獻奬得主。請每位參與人員從18個候選算法中選齣不超過10個最知名算法,結果在ICDM'06的“數據挖掘十大算法”專題研討會上公布。
2006年12月21日,在ICDM'06的一個專題討論會上,邀請145名與會專傢對這18個候選算法公開投票,從中選齣十個得票最高的算法,得到和上麵遴選第三步完全一緻的結果。這個3小時的專題研討會是ICDM'06的一個環節,在同一地點並行召開的還有Web Intelligence(WI'06)和Intelligent Agent Technology(IAT'06)的共7個論文展示環節,共吸
引到瞭145名學者參與。
在ICDM'06之後,我們邀請瞭這十大算法的原創作者和專題研討會部分發言人共同撰
寫瞭一篇期刊論文對每個算法的內容、影響進行介紹,對其現狀和未來趨勢加以評述。這篇期刊論文於2008年1月發錶在Knowledge and Information Systems上。本書是該期刊論文的擴展,每章介紹一個算法,內容包括算法描述、可用軟件、示例應用、高級主題和習題等部分。
本書的每一章都邀請兩位獨立審稿人和本書的一位編輯來審核,有的章節在此基礎上要在最終定稿前再重審一遍。
我們希望這十個算法的遴選能有助於在世界範圍推動數據挖掘的應用,激勵更多數據挖掘領域的學者去擴大這些算法的影響,探索新的研究內容。這十個算法覆蓋瞭分類、聚類、統計學習、關聯分析和鏈接分析等重要的數據挖掘研究和發展主題,也對數據挖掘、機器學習和人工智能等學科的課程設計有指導意義。
世界著名計算機教材精選:數據挖掘十大算法 [The Top the Algorithms in Data Mining] 下載 mobi pdf epub txt 電子書 格式 2024
世界著名計算機教材精選:數據挖掘十大算法 [The Top the Algorithms in Data Mining] 下載 mobi epub pdf 電子書幫人買的幫人買的幫人買的幫人買的。。。。
評分一年後再研究,現在在用統計方法。
評分很簡潔明瞭的書 比較適閤復習
評分讓給彆人做瞭個什麼的最新影訊
評分整體來說書還不錯,看瞭完瞭兩個算法,基本上能看懂。書的質量也不錯
評分是個教材,一般真看不懂,哈哈。
評分還不錯,適閤入門級
評分整體來說書還不錯,看瞭完瞭兩個算法,基本上能看懂。書的質量也不錯
評分還沒有看,但是書的內容很不錯,全麵
世界著名計算機教材精選:數據挖掘十大算法 [The Top the Algorithms in Data Mining] mobi epub pdf txt 電子書 格式下載 2024