产品特色
编辑推荐
用火的Python语言、通过各种各样的机器学习算法来解决实际问题! 书中介绍的主要问题如下。 - 探索分类分析算法并将其应用于收入等级评估问题 - 使用预测建模并将其应用到实际问题中 - 了解如何使用无监督学习来执行市场细分 - 探索数据可视化技术以多种方式与数据进行交互 - 了解如何构建推荐引擎 - 理解如何与文本数据交互并构建模型来分析它 - 使用隐马尔科夫模型来研究语音数据并识别语音
内容简介
在如今这个处处以数据驱动的世界中,机器学习正变得越来越大众化。它已经被广泛地应用于不同领域,如搜索引擎、机器人、无人驾驶汽车等。本书首先通过实用的案例介绍机器学习的基础知识,然后介绍一些稍微复杂的机器学习算法,例如支持向量机、极-端随机森林、隐马尔可夫模型、条件随机场、深度神经网络,等等。
作者简介
Prateek Joshi 人工智能专家,重点关注基于内容的分析和深度学习,曾在英伟达、微软研究院、高通公司以及硅谷的几家早期创业公司任职。个人博客地址: www.prateekj.com
目录
第1 章 监督学习 ............................................. 1
1.1 简介 ................................................. 1
1.2 数据预处理技术 ....................................... 2
1.2.1 准备工作 ....................................... 2
1.2.2 详细步骤 ....................................... 2
1.3 标记编码方法 ........................................... 4
1.4 创建线性回归器 ....................................... 6
1.4.1 准备工作 ....................................... 6
1.4.2 详细步骤 ....................................... 7
1.5 计算回归准确性 ....................................... 9
1.5.1 准备工作 ....................................... 9
1.5.2 详细步骤 ...................................... 10
1.6 保存模型数据 .......................................... 10
1.7 创建岭回归器 .......................................... 11
1.7.1 准备工作 ...................................... 11
1.7.2 详细步骤 ...................................... 12
1.8 创建多项式回归器 .................................. 13
1.8.1 准备工作 ...................................... 13
1.8.2 详细步骤 ...................................... 14
1.9 估算房屋价格 .......................................... 15
1.9.1 准备工作 ...................................... 15
1.9.2 详细步骤 ...................................... 16
1.10 计算特征的相对重要性 ......................... 17
1.11 评估共享单车的需求分布 ..................... 19
1.11.1 准备工作 .................................. 19
1.11.2 详细步骤 .................................. 19
1.11.3 更多内容 .................................. 21
第2 章 创建分类器 ........................................ 24
2.1 简介 ........................................... 24
2.2 建立简单分类器 ...................................... 25
2.2.1 详细步骤 ...................................... 25
2.2.2 更多内容 ...................................... 27
2.3 建立逻辑回归分类器 .............................. 27
2.4 建立朴素贝叶斯分类器 ........................... 31
2.5 将数据集分割成训练集和测试集 ........... 32
2.6 用交叉验证检验模型准确性 ................... 33
2.6.1 准备工作 ...................................... 34
2.6.2 详细步骤 ...................................... 34
2.7 混淆矩阵可视化 ...................................... 35
2.8 提取性能报告 .......................................... 37
2.9 根据汽车特征评估质量 ........................... 38
2.9.1 准备工作 ...................................... 38
2.9.2 详细步骤 ...................................... 38
2.10 生成验证曲线 ........................................ 40
2.11 生成学习曲线 ........................................ 43
2.12 估算收入阶层 ........................................ 45
第3 章 预测建模 ............................................ 48
3.1 简介 ............................................ 48
3.2 用SVM 建立线性分类器 ........................ 49
3.2.1 准备工作 ...................................... 49
3.2.2 详细步骤 ...................................... 50
3.3 用SVM 建立非线性分类器 .................... 53
3.4 解决类型数量不平衡问题 ....................... 55
3.5 提取置信度 .............................................. 58
3.6 寻找最优超参数 ...................................... 60
3.7 建立事件预测器 ...................................... 62
3.7.1 准备工作 ...................................... 62
3.7.2 详细步骤 ...................................... 62
3.8 估算交通流量 .......................................... 64
3.8.1 准备工作 ...................................... 64
3.8.2 详细步骤 ...................................... 64
第4 章 无监督学习——聚类....................... 67
4.1 简介 ....................................... 67
4.2 用k-means 算法聚类数据 ....................... 67
4.3 用矢量量化压缩图片 .............................. 70
4.4 建立均值漂移聚类模型 ........................... 74
4.5 用凝聚层次聚类进行数据分组 ............... 76
4.6 评价聚类算法的聚类效果 ....................... 79
4.7 用DBSCAN 算法自动估算集群数量 ..... 82
4.8 探索股票数据的模式 .............................. 86
4.9 建立客户细分模型 .................................. 88
第5 章 构建推荐引擎 ................................... 91
5.1 简介 ...................................... 91
5.2 为数据处理构建函数组合 ....................... 92
5.3 构建机器学习流水线 .............................. 93
5.3.1 详细步骤 ...................................... 93
5.3.2 工作原理 ...................................... 95
5.4 寻找最近邻 .............................................. 95
5.5 构建一个KNN 分类器 ............................ 98
5.5.1 详细步骤 ...................................... 98
5.5.2 工作原理 .................................... 102
5.6 构建一个KNN 回归器 .......................... 102
5.6.1 详细步骤 .................................... 102
5.6.2 工作原理 .................................... 104
5.7 计算欧氏距离分数 ................................ 105
5.8 计算皮尔逊相关系数 ............................ 106
5.9 寻找数据集中的相似用户 ..................... 108
5.10 生成电影推荐 ...................................... 109
第6 章 分析文本数据 ................................. 112
6.1 简介 ....................................... 112
6.2 用标记解析的方法预处理数据 ............. 113
6.3 提取文本数据的词干 ............................ 114
6.3.1 详细步骤 .................................... 114
6.3.2 工作原理 .................................... 115
6.4 用词形还原的方法还原文本的基本形式 .................... 116
6.5 用分块的方法划分文本 ........................ 117
6.6 创建词袋模型 ........................................ 118
6.6.1 详细步骤 .................................... 118
6.6.2 工作原理 .................................... 120
6.7 创建文本分类器 .................................... 121
6.7.1 详细步骤 .................................... 121
6.7.2 工作原理 .................................... 123
6.8 识别性别 ............................................. 124
6.9 分析句子的情感 .................................... 125
6.9.1 详细步骤 .................................... 126
6.9.2 工作原理 .................................... 128
6.10 用主题建模识别文本的模式 ............... 128
6.10.1 详细步骤 .................................. 128
6.10.2 工作原理 .................................. 131
第7 章 语音识别 ......................................... 132
7.1 简介 .......................................... 132
7.2 读取和绘制音频数据 ............................ 132
7.3 将音频信号转换为频域 ........................ 134
7.4 自定义参数生成音频信号 ..................... 136
7.5 合成音乐 .......................................... 138
7.6 提取频域特征 ........................................ 140
7.7 创建隐马尔科夫模型 ............................ 142
7.8 创建一个语音识别器 ............................ 143
第8 章 解剖时间序列和时序数据 ............ 147
8.1 简介 ............................................. 147
8.2 将数据转换为时间序列格式 ................. 148
8.3 切分时间序列数据 ................................ 150
8.4 操作时间序列数据 ................................ 152
8.5 从时间序列数据中提取统计数字 ......... 154
8.6 针对序列数据创建隐马尔科夫模型 ..... 157
8.6.1 准备工作 .................................... 158
8.6.2 详细步骤 .................................... 158
8.7 针对序列文本数据创建条件随机场 ..... 161
8.7.1 准备工作 .................................... 161
8.7.2 详细步骤 .................................... 161
8.8 用隐马尔科夫模型分析股票市场数据.......................... 164
第9 章 图像内容分析 ................................. 166
9.1 简介 .............................................. 166
9.2 用OpenCV-Pyhon 操作图像 ................. 167
9.3 检测边 ........................................ 170
9.4 直方图均衡化 ........................................ 174
9.5 检测棱角 .................................. 176
9.6 检测SIFT 特征点 .................................. 178
9.7 创建Star 特征检测器 ............................ 180
9.8 利用视觉码本和向量量化创建特征 ...... 182
9.9 用极端随机森林训练图像分类器 .......... 185
9.10 创建一个对象识别器 ........................... 187
第10 章 人脸识别 ........................................ 189
10.1 简介 ........................................... 189
10.2 从网络摄像头采集和处理视频信息 .... 189
10.3 用Haar 级联创建一个人脸识别器 ...... 191
10.4 创建一个眼睛和鼻子检测器 ............... 193
10.5 做主成分分析 ...................................... 196
10.6 做核主成分分析 .................................. 197
10.7 做盲源分离 .......................................... 201
10.8 用局部二值模式直方图创
Python机器学习经典实例 下载 mobi epub pdf txt 电子书 格式