过去几十年里,Web的迅速发展使其成为世界上规模的公共数据源。Web挖掘的目标是从Web超链接、网页内容和使用日志中探寻有用的信息。
《世界著名计算机教材精选:Web数据挖掘(第2版)》旨在阐述Web数据挖掘的概念及其核心算法,使读者获得相对完整的关于Web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的Web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在Web数据挖掘中却占有非常重要的地位。全书分为两大部分:第一部分包括第2章到第5章,介绍数据挖掘的基础,第二部分包括第6章到第12章,介绍Web相关的挖掘任务。从本书自第1版出版之后,很多领域已经有了重大的进展。新版大部分的章节都已经添加了新的材料来反应这些进展,主要的改动在第11章和第12章中,这两章已经被重新撰写并做了重要的扩展。
《世界著名计算机教材精选:Web数据挖掘(第2版)》不仅可作为本科生的教科书,也是在Web数据挖掘和相关领域研读博士学位的研究生的重要参考用书,同时对Web挖掘研究人员和实践人员获取知识、信息、甚至是创新想法也很有帮助。
第1章 概述
1.1 什么是万维网
1.2 万维网和互联网的历史简述
1.3 Web数据挖掘
1.3.1 什么是数据挖掘
1.3.2 什么是Web数据挖掘
1.4 各章概要
1.5 如何阅读本书
文献评注
参考文献
第1部分 数据挖掘基础
第2章 关联规则和序列模式
2.1 关联规则的基本概念
2.2 Apriori算法
2.2.1 频繁项目集生成
2.2.2 关联规则生成
2.3 关联规则挖掘的数据格式
2.4 多最小支持度的关联规则挖掘
2.4.1 扩展模型
2.4.2 挖掘算法
2.4.3 规则生成
2.5 分类关联规则挖掘
2.5.1 问题描述
2.5.2 挖掘算法
2.5.3 多最小支持度分类关联规则挖掘
2.6 序列模式的基本概念
2.7 基于GSP挖掘序列模式
2.7.1 GSP算法
2.7.2 多最小支持度挖掘
2.8 基于PrefixSpan算法的序列模式挖掘
2.8.1 PrefixSpan算法
2.8.2 多最小支持度挖掘
2.9 从序列模式中产生规则
2.9.1 序列规则
2.9.2 标签序列规则
2.9.3 分类序列规则
文献评注
参考文献
第3章 监督学习
3.1 基本概念
3.2 决策树归纳
3.2.1 学习算法
3.2.2 混杂度函数
3.2.3 处理连续属性
3.2.4 其他一些问题
3.3 评估分类器
3.3.1 评估方法
3.3.2 查准率、查全率、F-score和平衡点(Breakeven Point)
3.3.3 受试者工作特征曲线
3.3.4 提升曲线
3.4 规则归纳
3.4.1 顺序化覆盖
3.4.2 规则学习:Learn-One-Rule函数
3.4.3 讨论
3.5 基于关联规则的分类
3.5.1 使用类关联规则进行分类
3.5.2 使用类关联规则作为分类属性
3.5.3 使用古典的关联规则分类
3.6 朴素贝叶斯分类
3.7 朴素贝叶斯文本分类
3.7.1 概率框架
3.7.2 朴素贝叶斯模型
3.7.3 讨论
3.8 支持向量机
3.8.1 线性支持向量机:可分的情况
3.8.2 线性支持向量机:数据不可分的情况
3.8.3 非线性支持向量机:核方法总结
3.9 A、近邻学习
3.10 分类器的集成
3.10.1 Bagging
3.10.2 Boosting
文献评注
参考文献
第4章 无监督学习
4.1 基本概念
4.2 A-均值聚类
4.2.1 A-均值算法
4.2.2 A-均值算法的硬盘版本
4.2.3 优势和劣势
4.3 聚类的表示
4.3.1 聚类的一般表示方法
4.3.2 任意形状的聚类
4.4 层次聚类
4.4.1 单连结方法
4.4.2 全连结方法
4.4.3 平均连结方法
4.4.4 优势和劣势
4.5 距离函数
4.5.1 数字属性
4.5.2 布尔属性和名词性属性
4.5.3 文本文档
4.6 数据标准化
4.7 混合属性的处理
4.8 采用哪种聚类算法
4.9 聚类的评估
4.10 发现数据区域和数据空洞
文献评注
参考文献
第5章 部分监督学习
5.1 从已标注数据和无标注数据中学习
5.1.1 使用朴素贝叶斯分类器的EM算法
5.1.2 Co-naining
5.1.3 自学习
5.1.4 直推式支持向量机
5.1.5 基于图的方法
5.1.6 讨论
5.2 从正例和无标注数据中学习
5.2.1 PU学习的应用
5.2.2 理论基础
5.2.3 建立分类器:两步方法
5.2.4 建立分类器:偏置SVM
5.2.5 建立分类器:概率估计
5.2.6 讨论
……
第2部分 Web挖掘
养老金拿去炒股了吗?
评分不错
评分根据国际经验,资本市场和社会保障互惠互利、共同促进的效果往往非常显著。一些发达国家养老金中有相当比例投资股票,养老金在股市中发挥着中流砥柱的作用,成为股市的稳定器,推动资本市场的健康发展。
评分评分
挺好的,便宜。。。。啦啦啦
评分叹息过很多,我也感慨过很多。好像这薄薄的纸页已经无法装载这么沉重的情感。
评分好书,经典教材,不许过多评价
评分我喜欢这本书~前天,吃完午饭,趁手头工作不多,便给朋友发了条短信,这次等了半个小时,却依旧没有朋友的回信。我开始坐立不安,记得不久的过去,就算她忙,她总会在半小时内回他的呀!他怀疑难道是自己昨天没发短信给她她生气了?两小时后信息回来,告诉我要到京东帮他买书,如果不买或者两天收不到书就分手!,我靠,没有办法,我就来京东买书了。没有想到书到得真快。书很好是正版的,包装一般,书角有点压坏,还好不影响什么,质量很好,发货速度很快,两天就收到了,书的内容确实很实用,这些天忘记回老家拿书了,家里人帮忙收到这本书,很早就收到了。好了,我现在来说说这本书的观感吧,坐得冷板凳,耐得清寂夜,是为学之根本;独处不寂寞,游走自在乐,是为人之良质。潜心学问,风姿初显。喜爱独处,以窥视内心,反观自我;砥砺思想,磨砺意志。学与诗,文与思;青春之神思飞扬与学问之静寂孤独本是一种应该的、美好的平衡。在中国传统文人那里,诗人性情,学者本分,一脉相承久矣。现在讲究“术业有专攻”,分界逐渐明确,诗与学渐离渐远。此脉悬若一线,惜乎。我青年游历治学,晚年回首成书,记忆清新如初,景物历历如昨。挥发诗人情怀,摹写学者本分,意足矣,足已矣。现在,京东域名正式更换为JDCOM。其中的“JD”是京东汉语拼音(JING DON|G)首字母组合。从此,您不用再特意记忆京东的域名,也无需先搜索再点击,只要在浏览器输入JD.COM,即可方便快捷地访问京东,实现轻松购物。名为“Joy”的京东吉祥物我很喜欢,TA承载着京东对我们的承诺和努力。狗以对主人忠诚而著称,同时也拥有正直的品行,和快捷的奔跑速度。太喜爱京东了。|好了,现在给大家介绍两本好书:一、致我们终将逝去的青春。青春逝去,不必感伤,不必回首。或许他们早该明白,世上已没有了小飞龙,而她奋不顾身爱过的那个清高孤傲的少年,也早已死于从前的青春岁月。现在相对而坐的是郑微和陈孝正,是郑秘书和陈助理是日渐消磨的人间里两个不相干的凡俗男女,犹如一首歌停在了最酣畅的时候,未尝不是好事,而他们太过贪婪固执地以为可以再唱下去才知道后来的曲调是这样不堪。青春就是用来追忆的,所以作者写的故事是来纪念。不是感伤懊悔,而是最好的纪念。道别的何止是最纯真的一段唯美, 而是我曾经无往不胜的天真青春啊。请允许吧,那时的少年,尽情言情。一直言情,不要去打扰他们,他们总有一天会醒来。告别青春,因为青春,终将逝去。陪你梦一场又何妨。二、写不尽的儿女情长,说不完的地老天荒,最恢宏的画卷,最动人的故事,最浩大的恩怨,最纠结的爱恨,尽在桐华《长相思》。推荐1:《长相思》是桐华潜心三年创作的新作,将虐心和争斗写到了极致。全新的人物故事,不变的感动、虐心。推荐2:每个人在爱情中都有或长或短的爱而不得的经历。暗恋是一种爱而不得,失恋是一种爱而不得,正在相恋时,也会爱而不得,有时候,是空间的距离,有时候,却是心灵的距离。纵然两人手拉手,可心若有了距离,依旧是爱而不得。这样的情绪跨越了古今,是一种情感的共鸣。推荐3:唯美装帧,品质超越同类书,超值回馈读者。《长相思》从策划到完成装帧远远领先目前市场上同类书,秉承了桐华一贯出产精品的风格,将唯美精致做到极致,整体装帧精致唯美,绝对值得珍藏。京东有卖。
评分不错,学习。。。。。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有