预测性文本挖掘基础 [Fundamentals of Predictive Text Mining]

预测性文本挖掘基础 [Fundamentals of Predictive Text Mining] 下载 mobi epub pdf 电子书 2024


简体网页||繁体网页
[美] 绍洛姆·韦斯(Weiss S.) 著,赵仲孟,侯迪 译

下载链接在页面底部
点击这里下载
    


想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

发表于2024-11-22

图书介绍


出版社: 西安交通大学出版社
ISBN:9787560544274
版次:1
商品编码:11128979
包装:平装
外文名称:Fundamentals of Predictive Text Mining
开本:16开
出版时间:2012-10-01
用纸:胶版纸
页数:234
字数:247000
正文语种:中文


类似图书 点击查看全场最低价

相关图书





图书描述

编辑推荐

  《预测性文本挖掘基础》主要特点:1.对文本挖掘做出了全面、实用、易于理解的介绍。
  2.每个章节给出了小结、历史和文献评述以及课堂练习。
  3.对书中提到的每个方法都进行了应用和用途介绍,同时给出了针对某个具体问题的优技术方法。
  4.给出了几个描述性案例的研究情况,帮助读者了解现实世界中从问题描述到系统配置的过程。
  5.介绍了可以运行在任何计算机上的企业级增强型文本挖掘软件。
  描述了一些依赖于基本统计技术的方法,这样就顾及到了所有的语言(不仅仅是英语)。
  6.包含了一些可以免费下载的软件的链接,以及一些补充的介绍材料。
  《预测性文本挖掘基础》可作为IT专业人员和管理人员必备的参考资料,也可以作为计算机专业本科高年级和研究生的关键教材使用。

内容简介

电脑普及带来的一个结果是文档以数字形式呈现出来,加之Internet的广泛使用,这些文档就变得唾手可得。文本挖掘,即对非结构化的自然语言文本的分析过程,主要针对的是如何从这些文档中提取信息。
《预测性文本挖掘基础》是一本入门级的教科书,是在修订施普林格已经成功出版的文本挖掘领域的参考书基础上得到的,旨在能够帮助读者了解这个快速发展的领域。同时,该书也整合了包括数据挖掘、机器学习、数据库以及计算语言学方面很多的理论,因此这本的书也提供了一些文本挖掘方面比较实用的建议。书中深层次地讨论了文档分类、信息检索、聚类和组织文档、信息提取、基于web的数据源的预测和评价问题。要学习《预测性文本挖掘基础》,如果读者有数据挖掘方面的知识自然很好,但这并不是必须的。书中有些地方涉及到一些高级概念,这些需要读者有一定的数学功底,当然我们也提供了一些直观上的解释来帮助那些非专业读者。

作者简介

  绍洛姆·韦斯,是美国纽约州约克镇的IBM预测模型小组的研究成员,同时也是美国新泽西州罗格斯大学计算机科学专业的荣誉教授。
  
  霓廷·因杜尔亚,是澳大利亚新南威尔士大学计算机科学工程学院的讲师,同时也是数据挖掘公司Data-Miner有限公司的创始人和总裁。
  
  张潼,在美国斯坦福大学获得计算机科学博士学位,现在是美国新泽西州罗格斯大学统计系的教授。

内页插图

目录

推荐序
译者序
前言

第1章 文本挖掘概述
1.1 文本挖掘有什么特别之处?
1.1.1 结构化或非结构化数据?
1.1.2 文本数据是否不同于数值数据?
1.2 文本挖掘可以解决什么类型的问题?
1.3 文本分类
1.4 信息检索
1.5 文档聚类与组织
1.6 信息提取
1.7 预测与评估
1.8 下章内容
1.9 小结
1.10 历史与文献评述
1.11 问题与练习

第2章 从文本信息到数值向量
2.1 文档收集
2.2 文档标准化
2.3 标记化
2.4 词形转化
2.4.1 词干变形
2.4.2 化词干为词根
2.5 预测向量生成
2.5.1 多词特征
2.5.2 正确答案的标签
2.5.3 通过属性分级选择特征
2.6 语句边界确定
2.7 词性标签化
2.8 词义消歧
2.9 短语识别
2.10 命名实体识别
2.11 语法分析
2.12 特征生成
2.13 小结
2.14 历史与文献评述
2.15 课后练习

第3章 用文本进行预测
3.1 识别文档符合模式
3.2 需要多少文档才可以满足预测需求?
3.3 文档分类
3.4 从文本中学习预测
3.4.1 相似性与最近邻法
3.4.2 文档相似性
3.4.3 决策规则
3.4.4 决策树
3.4.5 概率估计
3.4.6 线性评分方法
3.5 性能评估
3.5.1 当前与未来的性能估计
3.5.2 从学习方法中获取最大收益
3.6 应用
3.7 小结
3.8 历史与文献评述
3.9 问题与练习

第4章 信息检索和文本挖掘
第5章 文档集的结构发现
第6章 在文档中查询信息
第7章 面向预测的数据源:数据库、混杂数据与Web
第8章 实例分析
第9章 新研究方向
附录A 软件说明
参考文献
作者索引
主题索引

精彩书摘

  通过观察性能较差的分类有时能让我们发现新闻本身属性是如何影响性能的,比如新文章似乎不太会进入低频分类。一种可能的解释是新闻主题更倾向于涌现出来,所以某个边缘分类可能不会常出现。这点听起来似乎有理,但还需深入研究加以验证。
  还有一个问题,就是有些主题似乎具有固有的聚合性,好像应该很容易对其建立起高效的分类器,但事实却不尽如人意。举路透社数据中的一个例子:我们观察决策树为宗教主题生成的规则,做分类时出现了40个左右的错误,总结如下:
  1.新闻中通常有这种情形,即大致相同的文章有很多篇。而这些文章中有些仅仅是主题的总结。若其中一篇简略提及了宗教,分类器也许找不到它,但因为出现次数过多,就会形成累积错误。
  2.有些文章中宗教只是作为某个大主题的子类被提及。比如,宗教可能出现在关于中国的人权问题文章中,仅仅因为宗教也是一种权利。那么当这类文章重复出现时,也会导致分类器的错误判断。
  3.还有时候分类器并没有规则提及文章中重复出现某个词的问题。比如,分类器并没有文章中多次出现宗教这个词时的相关规定,而在我们人工看来这非常寻常。显然,很多包含了与宗教相关单词的文章并未分类到宗教主题中。事实上测试集中的宗教字眼只有一半出现在宗教主题的文章中,其他的被分到若干不同的主题中,最常见的有国际关系和国内政治。
  这也说明了要提高基于人的直觉预测分类性能是很难的,最好让数据告诉我们一切。
  在所有这些实验中,有三个值用于评价分类性能:准确率(precision)、查全率(recall)以及F值。F值可以用来做粗略比较,当F值相近时,则比较准确率和查全率。当评价一个包含大量分类器的系统时,通常计算出每个分类器的性能,然后得出它们的微平均值。
  ……

前言/序言


预测性文本挖掘基础 [Fundamentals of Predictive Text Mining] 下载 mobi epub pdf txt 电子书 格式

预测性文本挖掘基础 [Fundamentals of Predictive Text Mining] mobi 下载 pdf 下载 pub 下载 txt 电子书 下载 2024

预测性文本挖掘基础 [Fundamentals of Predictive Text Mining] 下载 mobi pdf epub txt 电子书 格式 2024

预测性文本挖掘基础 [Fundamentals of Predictive Text Mining] 下载 mobi epub pdf 电子书
想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

用户评价

评分

  在这之前,我没有看到在机器学习算法方面缩小思考者和执行者之间差距的书籍。本书的目的就是填补这个空白,同时介绍机器学习算法的使用,使得读者能够构建更成功的应用。

评分

对自己的学习希望有帮助

评分

可以。

评分

很好的书

评分

买来学习学习买来学习学习

评分

文本中存在无限的挖掘价值,因为他们是作者内心真实的反映。

评分

便宜,送货快,还会再买。。。

评分

好书,正版,很实用,值得购买

评分

等读了再来评价,但愿我记得

类似图书 点击查看全场最低价

预测性文本挖掘基础 [Fundamentals of Predictive Text Mining] mobi epub pdf txt 电子书 格式下载 2024


分享链接




相关图书


本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

友情链接

© 2024 book.cndgn.com All Rights Reserved. 新城书站 版权所有