发表于2024-11-23
书[0名0]: | 数据挖掘:概念与技术(原书[0第0]3版)|3683062 |
图书定价: | 79元 |
图书作者: | (美)Jiawei Han;(加)Micheline Kamber;(加)Jian Pei |
出版社: | 机械工业出版社 |
出版日期: | 2012-8-1 0:00:00 |
ISBN号: | 9787111391401 |
开本: | 16开 |
页数: | 468 |
版次: | 1-1 |
作者简介 |
Jiawei Han(韩家炜)是伊利诺伊[0大0][0学0]厄巴纳-尚佩恩分校计算机科[0学0]系的Bliss教授。他因[0知0]识发现和数据挖掘研究方面的贡献而获得许多奖励,包括ACM SIGKDD创新奖(2004)、IEEE计算机[0学0][0会0]技术成就奖(2005)和IEEE W.W[0all0]ace McDowell奖(2009)。他是ACM和IEEE[0会0]士。他还担任《ACM Transactions on K[0no0]wledge Discovery from Data》的执行主编(2006—2011)和许多杂志的编委,包括《IEEE Transactions on K[0no0]wledge and Data Engineering》和《Data Mining K[0no0]wledge Discovery》。 Micheline Kamber由加拿[0大0]魁北克蒙特利尔Concordia[0大0][0学0]获计算机科[0学0](人工智能专业)硕士[0学0]位。她曾是NSERC[0学0]者,作为研究者在McGill[0大0][0学0]、西蒙-弗雷泽[0大0][0学0]和瑞士工作。她的数据挖掘背景和以易于理解的形式写作的热情使得本书更受专业人员、教师和[0学0]生的欢迎。 Jian Pei(裴健)现在是西蒙-弗雷泽[0大0][0学0]计算机科[0学0][0学0]院教授。他在Jiawei Han的指导下,于2002年获西蒙-弗雷泽[0大0][0学0]计算科[0学0]博士[0学0]位。他在数据挖掘、数据库、Web搜索和信息检索的主要[0学0]术论坛发表了[0大0]量文章,并积[0极0]服务于[0学0]术团体。他的文章被引用数千次,并获多次荣誉奖。他是多种数据挖掘和数据分析杂志的助理编辑。范明 郑州[0大0][0学0]信息工程[0学0]院教授,博士生导师。现为中[0国0]计算机[0学0][0会0]数据库专业委员[0会0]委员、人工智能与模式识别专业委员[0会0]委员。长期从事计算机软件与理论教[0学0]和研究。主要讲授的课程包括程序设计、计算机操作系统、数据库系统原理、[0知0]识库系统原理、数据挖掘与数据仓库等。1989—1990年曾访问加拿[0大0]Simon Fraser[0大0][0学0]计算机科[0学0]系,从事演绎数据库研究。1999年曾访问美[0国0]Wright State[0大0][0学0]计算机科[0学0]与工程系,从事数据挖掘研究。[0当0]前感兴趣的研究方向包括数据挖掘和机器[0学0]习。先后发表论文60余篇。除本书外,还主持翻译了Pang-Ning Tan、Michael Steinbach和Vipin Kumar的《数据挖掘导论》。孟小峰 博士,中[0国0]人民[0大0][0学0]信息[0学0]院教授,博士生导师。现为中[0国0]计算机[0学0][0会0]常务理事、中[0国0]计算机[0学0][0会0]数据库专委[0会0]秘书长,《Journal of Computer Science and Tech[0no0]logy》、《Frontiers of Computer Science》、《软件[0学0]报》、《计算机研究与发展》等编委。主持或参加过二十多项[0国0]家科技攻关项目、[0国0]家自然科[0学0]基金项目以及[0国0]家863项目、973项目,先后获电子部科技进步特等奖(1996)、北京市科技进步二等奖(1998、2001)、中[0国0]计算机[0学0][0会0]“王选奖”一等奖(2009)、北京市科[0学0]技术奖二等奖(2011)等奖励,入选“中创软件人才奖”(2002)、“教育部新世纪[0优0]秀人才支持计划”(2004)、“[0第0]三届北京市高校[0名0]师奖”(2005)。近5年在[0国0]内外杂志及[0国0]际[0会0]议发表论文120多篇,出版[0学0]术专著《Moving Objects Management: Models,Techniques,and Applications》(Springer)、《XML数据管理:概念与技术》、《移动数据管理:概念与技术》(中[0国0]计算机[0学0][0会0][0学0]术著作丛书)等。获[0国0]家发明专利授[0权0]8项。近期主要研究[0领0]域为互联网络与移动数据管理,包括Web数据集成、XML数据库系统、云数据管理、闪存数据库系统、隐私保护等。 |
内容简介 |
《数据挖掘:概念与技术(原书[0第0]3版)》完整全面地讲述数据挖掘的概念、方[0法0]、技术和新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用[0领0]域。 《数据挖掘:概念与技术(原书[0第0]3版)》是数据挖掘和[0知0]识发现[0领0]域内的所有教师、研究人员、开发人员和用户都必读的参考书,是一本适用于数据分析、数据挖掘和[0知0]识发现课程的[0优0]秀教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。 |
目录 |
《数据挖掘:概念与技术(原书[0第0]3版)》 出版者的话 中文版序 译者序 译者简介 [0第0]3版序 [0第0]2版序 前言 致谢 作者简介 [0第0]1章引论1 1.1为什么进行数据挖掘1 1.1.1迈向信息时代1 1.1.2数据挖掘是信息技术的进化2 1.2什么是数据挖掘4 1.3可以挖掘什么类型的数据6 1.3.1数据库数据6 1.3.2数据仓库7 1.3.3事务数据9 1.3.4其他类型的数据9 1.4可以挖掘什么类型的模式10 1.4.1类/概念描述:特征化与区分10 1.4.2挖掘频繁模式、关联和相关性11 1.4.3用于预测分析的分类与回归12 1.4.4聚类分析13 1.4.5离群点分析14 1.4.6所有模式都是有趣的吗14 1.5使用什么技术15 1.5.1统计[0学0]15 1.5.2机器[0学0]习16 1.5.3数据库系统与数据仓库17 1.5.4信息检索17 1.6面向什么类型的应用18 1.6.1[0商0]务智能18 1.6.2Web搜索引擎18 1.7数据挖掘的主要问题19 1.7.1挖掘方[0法0]19 1.7.2用户界面20 1.7.3有效性和可伸缩性21 1.7.4数据库类型的多样性21 1.7.5数据挖掘与社[0会0]21 1.8小结22 1.9习题23 1.10文献注释23 [0第0]2章认识数据26 2.1数据对象与属性类型26 2.1.1什么是属性27 2.1.2标称属性27 2.1.3二元属性27 2.1.4序数属性28 2.1.5数值属性28 2.1.6离散属性与连续属性29 2.2数据的基本统计描述29 2.2.1中心趋势度量:均值、中位数和众数30 2.2.2度量数据散布:[0极0]差、四分位数、方差、标准差和四分位数[0极0]差32 2.2.3数据的基本统计描述的图形显示34 2.3数据可视化37 2.3.1基于像素的可视化技术37 2.3.2几何投影可视化技术38 2.3.3基于图符的可视化技术40 2.3.4层次可视化技术42 2.3.5可视化复杂对象和关系42 2.4度量数据的相似性和相异性44 2.4.1数据矩阵与相异性矩阵45 2.4.2标称属性的邻近性度量46 2.4.3二元属性的邻近性度量46 2.4.4数值属性的相异性:闵可夫斯基距离48 2.4.5序数属性的邻近性度量49 2.4.6混合类型属性的相异性50 2.4.7余弦相似性51 2.5小结52 2.6习题53 2.7文献注释54 [0第0]3章数据预处理55 3.1数据预处理:概述55 3.1.1数据质量:为什么要对数据预处理55 3.1.2数据预处理的主要任务56 3.2数据清理58 3.2.1缺失值58 3.2.2噪声数据59 3.2.3数据清理作为一个过程60 3.3数据集成61 3.3.1实体识别问题62 3.3.2冗余和相关分析62 3.3.3元组重复65 3.3.4数据值冲突的检测与处理65 3.4数据归约65 3.4.1数据归约策略概述66 3.4.2小波变换66 3.4.3主成分分析67 3.4.4属性子集选择68 3.4.5回归和对数线性模型:参数化数据归约69 3.4.6直方图70 3.4.7聚类71 3.4.8抽样71 3.4.9数据立方体聚集72 3.5数据变换与数据离散化73 3.5.1数据变换策略概述73 3.5.2通过规范化变换数据74 3.5.3通过分箱离散化76 3.5.4通过直方图分析离散化76 3.5.5通过聚类、决策树和相关分析离散化76 3.5.6标称数据的概念分层产生77 3.6小结79 3.7习题79 3.8文献注释80 [0第0]4章数据仓库与联机分析处理82 4.1数据仓库:基本概念82 4.1.1什么是数据仓库82 4.1.2操作数据库系统与数据仓库的区别84 4.1.3为什么需要分离的数据仓库85 4.1.4数据仓库:一种多层体系结构85 4.1.5数据仓库模型:企业仓库、数据集市和虚拟仓库87 4.1.6数据提取、变换和装入88 4.1.7元数据库88 4.2数据仓库建模:数据立方体与OLAP89 4.2.1数据立方体:一种多维数据模型89 4.2.2星形、雪花形和事实星座:多维数据模型的模式91 4.2.3维:概念分层的作用94 4.2.4度量的分类和计算95 4.2.5典型的OLAP操作96 4.2.6查询多维数据库的星网查询模型98 4.3数据仓库的设计与使用99 4.3.1数据仓库的设计的[0商0]务分析框架99 4.3.2数据仓库的设计过程100 4.3.3数据仓库用于信息处理101 4.3.4从联机分析处理到多维数据挖掘102 4.4数据仓库的实现103 4.4.1数据立方体的有效计算:概述103 4.4.2索引OLAP数据:位图索引和连接索引105 4.4.3OLAP查询的有效处理107 4.4.4OLAP服务器结构:ROLAP、MOLAP、HOLAP的比较107 4.5数据泛化:面向属性的归纳109 4.5.1数据特征的面向属性的归纳109 4.5.2面向属性归纳的有效实现113 4.5.3类比较的面向属性归纳114 4.6小结116 4.7习题117 4.8文献注释119 [0第0]5章数据立方体技术121 5.1数据立方体计算:基本概念121 5.1.1立方体物化:完全立方体、冰山立方体、闭立方体和立方体外壳122 5.1.2数据立方体计算的一般策略124 5.2数据立方体计算方[0法0]126 5.2.1完全立方体计算的多路数组聚集126 5.2.2BUC:从[0顶0]点方体向下计算冰山立方体129 5.2.3Star-Cubing:使用动态星树结构计算冰山立方体132 5.2.4为快速高维OLAP预计算壳片段136 5.3使用探索立方体技术处理高级查询141 5.3.1抽样立方体:样本数据上基于OLAP的挖掘141 5.3.2排序立方体:top-k查询的有效计算145 5.4数据立方体空间的多维数据分析147 5.4.1预测立方体:立方体空间的预测挖掘147 5.4.2多特征立方体:多粒度上的复杂聚集149 5.4.3基于异常的、发现驱动的立方体空间探查149 5.5小结152 5.6习题152 5.7文献注释155 [0第0]6章挖掘频繁模式、关联和相关性:基本概念和方[0法0]157 6.1基本概念157 6.1.1购物篮分析:一个诱发例子157 6.1.2频繁项集、闭项集和关联规则158 6.2频繁项集挖掘方[0法0]160 6.2.1Apriori算[0法0]:通过限制候选产生发现频繁项集160 6.2.2由频繁项集产生关联规则164 6.2.3提高Apriori算[0法0]的效率165 6.2.4挖掘频繁项集的模式增长方[0法0]166 6.2.5使用垂直数据格式挖掘频繁项集169 6.2.6挖掘闭模式和[0极0][0大0]模式170 6.3哪些模式是有趣的:模式[0评0]估方[0法0]171 6.3.1强规则不一定是有趣的172 6.3.2从关联分析到相关分析172 6.3.3模式[ 数据挖掘:概念与技术(原书第3版) 计算机与互联网 书籍|3683062 下载 mobi epub pdf txt 电子书 格式 数据挖掘:概念与技术(原书第3版) 计算机与互联网 书籍|3683062 mobi 下载 pdf 下载 pub 下载 txt 电子书 下载 2024数据挖掘:概念与技术(原书第3版) 计算机与互联网 书籍|3683062 下载 mobi pdf epub txt 电子书 格式 2024 数据挖掘:概念与技术(原书第3版) 计算机与互联网 书籍|3683062 下载 mobi epub pdf 电子书用户评价
评分
评分 评分 评分 评分 评分 评分 评分 评分
类似图书 点击查看全场最低价
数据挖掘:概念与技术(原书第3版) 计算机与互联网 书籍|3683062 mobi epub pdf txt 电子书 格式下载 2024 分享链接相关图书
|