具体描述
				
				
					YL8549  9787121321603 9787115461476 9787121318726
机器学习之路——Caffe、Keras、scikit-learn实战
机器学习需要一条脱离过高理论门槛的入门之路。
本书《机器学习篇》从小红帽采蘑菇的故事开篇,介绍了基础的机器学习分类模型的训练(第1章)。如何评估、调试模型?如何合理地发掘事物的特征?如何利用几个模型共同发挥作用?后续章节一步一步讲述了如何优化模型,更好地完成分类预测任务(第2章),并且初步尝试将这些技术运用到金融股票交易中(第3章)。
自然界*好的非线性模型莫过于人类的大脑。《深度学习篇》从介绍并对比一些常见的深度学习框架开始(第4章),讲解了DNN模型的直观原理,尝试给出一些简单的生物学解释,完成简单的图片识别任务(第5章)。后续章节在此基础上,完成更为复杂的图片识别CNN模型(第6章)。接着,本书展示了使用Caffe完成一个完整的图片识别项目,从准备数据集,到完成识别任务(第7章)。后面简单描述了RNN模型(第8章),接着展示了一个将深度学习技术落地到图片处理领域的项目(第9章)。
1篇 机器学习篇第1 章 初识机器学习 .................................................................................... 21.1 机器学习——赋予机器“学习”的灵魂 ..................................................................... 21.1.1 小红帽识别毒蘑菇 ................................................................................................................... 21.1.2 三种机器学习问题 ................................................................................................................... 61.1.3 常用符号 .................................................................................................................................. 61.1.4 回顾 .......................................................................................................................................... 71.2 KNN——相似的邻居请投票 ........................................................................................ 71.2.1 模型原理 .................................................................................................................................. 71.2.2 鸢尾花卉数据集(IRIS) ....................................................................................................... 91.2.3 训练模型 .................................................................................................................................. 91.2.4 评估模型 ................................................................................................................................ 121.2.5 关于KNN ............................................................................................................................... 141.2.6 运用KNN 模型 ...................................................................................................................... 151.2.7 回顾 ........................................................................................................................................ 161.3 逻辑分类I:线性分类模型 ........................................................................................ 161.3.1 参数化的模型 ........................................................................................................................ 161.3.2 逻辑分类:预测..................................................................................................................... 181.3.3 逻辑分类:评估..................................................................................................................... 221.3.4 逻辑分类:训练..................................................................................................................... 231.3.5 回顾 ........................................................................................................................................ 241.4 逻辑分类II:线性分类模型 ....................................................................................... 241.4.1 寻找模型的权重..................................................................................................................... 24VI ∣ 机器学习之路——Caffe、Keras、scikit-learn 实战1.4.2 去均值和归一化..................................................................................................................... 311.4.3 实现 ........................................................................................................................................ 331.4.4 回顾 ........................................................................................................................................ 34第2 章 机器学习进阶 .................................................................................. 352.1 特征工程 ...................................................................................................................... 352.1.1 泰坦尼克号生存预测 ............................................................................................................. 352.1.2 两类特征 ................................................................................................................................ 382.1.3 构造非线性特征..................................................................................................................... 412.1.4 回顾 ........................................................................................................................................ 452.2 调试模型 ...................................................................................................................... 462.2.1 模型调试的目标..................................................................................................................... 462.2.2 调试模型 ................................................................................................................................ 492.2.3 回顾 ........................................................................................................................................ 522.3 分类模型评估指标 ...................................................................................................... 532.3.1 混淆矩阵系指标..................................................................................................................... 532.3.2 评估曲线 ................................................................................................................................ 582.3.3 回顾 ........................................................................................................................................ 612.4 回归模型 ...................................................................................................................... 612.4.1 回归与分类 ............................................................................................................................ 612.4.2 线性回归 ................................................................................................................................ 622.4.3 波士顿房价预测..................................................................................................................... 662.4.4 泰坦尼克号生存预测:回归预测特征年龄Age .................................................................. 692.4.5 线性模型与非线性模型 ......................................................................................................... 722.4.6 回顾 ........................................................................................................................................ 732.5 决策树模型 .................................................................................................................. 732.5.1 信息与编码 ............................................................................................................................ 742.5.2 决策树 .................................................................................................................................... 762.5.3 对比线性模型和决策树模型的表现 ..................................................................................... 772.5.4 回顾 ........................................................................................................................................ 792.6 模型融合 ...................................................................................................................... 802.6.1 融**群体(Ensamble) ..................................................................................................... 802.6.2 Bagging:随机森林(Random Forest) ............................................................................... 82目录 ∣ VII2.6.3 Boosting:GBDT ................................................................................................................... 832.6.4 Stacking .................................................................................................................................. 862.6.5 泰坦尼克号生存预测:小结 ................................................................................................. 932.6.6 回顾 ........................................................................................................................................ 94第3 章 实战:股票量化 .............................................................................. 953.1 1步:构造童话世界 .............................................................................................. 953.1.1 股票是什么 ............................................................................................................................ 953.1.2 当机器学习与量化交易走在一起 ......................................................................................... 963.1.3 构造一个童话世界 ................................................................................................................. 963.1.4 回顾 ...................................................................................................................................... 1003.2 第二步:应用机器学习 ............................................................................................ 1003.2.1 构建特征数据 ...................................................................................................................... 1003.2.2 回归预测股票价格 ............................................................................................................... 1033.2.3 分类预测股票涨跌 ............................................................................................................... 1083.2.4 通过决策树分类,绘制决策图 ........................................................................................... 1123.2.5 回顾 ...................................................................................................................................... 1143.3 第三步:在真实世界应用机器学习 ........................................................................ 1143.3.1 回测 ...................................................................................................................................... 1153.3.2 基于特征的交易预测 ........................................................................................................... 1193.3.3 破灭的童话——真实世界的机器学习 ............................................................................... 122第二篇 深度学习篇第4 章 深度学习:背景和工具 ................................................................. 1264.1 背景 ............................................................................................................................ 1264.1.1 人工智能——为机器赋予人的智能 ................................................................................... 1264.1.2 图灵测试 .............................................................................................................................. 1264.1.3 强人工智能 vs 弱人工智能 ............................................................................................... 1274.1.4 机器学习和深度学习 ........................................................................................................... 1284.1.5 过度的幻想 .......................................................................................................................... 1284.1.6 回顾 ............................................
深度学习deep learning
《深度学习》由*****的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是深度学习领域奠基性的**教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是深度学习的预备知识;第2部分系统深入地讲解现今已成熟的深度学习方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被**为是深度学习未来的研究重点。
《深度学习》适合各类读者阅读,包括相关**的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充深度学习知识,以便在实际产品或平台中应用的软件工程师。
第 1 章 引言 . . .. . . . . . 1 
1.1 本书面向的读者 . . . . . . . . . . . . . . . . . . . .7 
1.2 深度学习的历史趋势 . . . . . . . . . . . . . . . 8 
1.2.1 神经网络的众多名称和命运变迁 . 8 
1.2.2 与日俱增的数据量 . . . . . . . . . . . . . 12 
1.2.3 与日俱增的模型规模 . . . . . . . . . . .13 
1.2.4 与日俱增的精度、复杂度和对现实世界的冲击 . . . . . . . . . . . . . 15
第 1 部分 应用数学与机器学习基础 
第 2 章 线性代数 . . .19 
2.1 标量、向量、矩阵和张量 . . . . . . . . . . 19 
2.2 矩阵和向量相乘. . . . . . . . . . . . . . . . . . .21 
2.3 单位矩阵和逆矩阵 . . . . . . . . . . . . . . . . 22 
2.4 线性相关和生成子空间 . . . . . . . . . . . 23 
2.5 范数. . . . . . . . .24 
2.6 特殊类型的矩阵和向量 . . . . . . . . . . . 25 
2.7 特征分解 . . . . 26 
2.8 奇异值分解 . . . . . . . . . . . . . . . . . . . . . . . 28 
2.9 Moore-Penrose 伪逆 . . . . . . . . . . . . . . . 28 
2.10 迹运算 . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.11 行列式 . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.12 实例:主成分分析. . . . . . . . . . . . . . . .30 
第 3 章 概率与信息论. . .. . . . . . . . . . . . . . . . . .34 
3.1 为什么要使用概率 . . . . . . . . . . . . . . . . 34 
3.2 随机变量 . . . . . . . . . . . . . . . . . . . . . . . . . . 35 
3.3 概率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . 36 
3.3.1 离散型变量和概率质量函数 . . . . 36 
3.3.2 连续型变量和概率密度函数 . . . . 36 
3.4 边缘概率 . . . . . . . . . . . . . . . . . . . . . . . . . . 37 
3.5 条件概率 . . . . . . . . . . . . . . . . . . . . . . . . . . 37 
3.6 条件概率的链式法则 . . . . . . . . . . . . . . 38
3.7 独立性和条件独立性 . . . . . . . . . . . . . . 38 
3.8 期望、方差和协方差 . . . . . . . . . . . . . . 38 
3.9 常用概率分布 . . . . . . . . . . . . . . . . . . . . . 39 
3.9.1 Bernoulli 分布 . . . . . . . . . . . . . . . . 40 
3.9.2 Multinoulli 分布 . . . . . . . . . . . . . . 40 
3.9.3 高斯分布 . . . . . . . . . . . . . . . . . . . . . 40 
3.9.4 指数分布和 Laplace 分布 . . . . . . 41 
3.9.5 Dirac 分布和经验分布 . . . . . . . . . 42 
3.9.6 分布的混合 . . . . . . . . . . . . . . . . . . . 42 
3.10 常用函数的有用性质. . . . . . . . . . . . .43 
3.11 贝叶斯规则 . . . . . . . . . . . . . . . . . . . . . . 45 
3.12 连续型变量的技术细节 . . . . . . . . . . 45 
3.13 信息论 . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.14 结构化概率模型 . . . . . . . . . . . . . . . . . 49 
第 4 章 数值计算 . . .. . . . . . . . . . . . . . . . . . . . . . 52 
4.1 上溢和下溢 . . . . . . . . . . . . . . . . . . . . . . . 52 
4.2 病态条件 . . . . . . . . . . . . . . . . . . . . . . . . . . 53 
4.3 基于梯度的优化方法 . . . . . . . . . . . . . . 53 
4.3.1 梯度之上:Jacobian 和 Hessian 矩阵 . . . . . . . . . . . . . . . . . . . . . 56
4.4 约束优化 . . . . . . . . . . . . . . . . . . . . . . . . . . 60 
4.5 实例:线性*小二乘 . . . . . . . . . . . . . . 61 
Keras快速上手:基于Python的深度学习实战
 本书系统地讲解了深度学习的基本知识、建模过程和应用,并以深度学习在推荐系统、图像识别、自然语言处理、文字生成和时间序列中的具体应用为案例,详细介绍了从工具准备、数据获取和处理到针对问题进行建模的整个过程和实践经验,是一本非常好的深度学习入门书。
        不同于许多讲解深度学习的书籍,本书以实用为导向,选择了Keras作为编程框架,强调简单、快速地设计模型,而不去纠缠底层代码,使得内容相当易于理解。读者可以在CNTK、TensorFlow和Theano的后台之间随意切换,非常灵活,并且能帮助读者从高度抽象的角度去审视业务问题,达到事半功倍的效果。
第1章准备深度学习的环境1
- 硬件环境的搭建和配置选择. . . . . . . . . . . . . . . . . . . . . . . . 2
 1.1.1通用图形处理单元. . . . . . . . . . . . . . . . . . . . . . . . . 3
 1.1.2你需要什么样的GPU加速卡. . . . . . . . . . . . . . . . . . . 6
 1.1.3你的GPU需要多少内存. . . . . . . . . . . . . . . . . . . . . . 7
 1.1.4是否应该用多块GPU . . . . . . . . . . . . . . . . . . . . . . . 11
 1.2安装软件环境. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
 1.2.1所需软件列表. . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
 1.2.2 CUDA的安装. . . . . . . . . . . . . . . . . . . . . . . . . . . 13
 1.2.3 Python及计算环境的安装. . . . . . . . . . . . . . . . . . . . . 14
 1.2.4深度学习建模环境介绍. . . . . . . . . . . . . . . . . . . . . . . 15
 1.2.5安装CNTK及对应的Keras . . . . . . . . . . . . . . . . . . . 17
 1.2.6安装Theano计算环境. . . . . . . . . . . . . . . . . . . . . . . 24
 1.2.7安装TensorFlow计算环境. . . . . . . . . . . . . . . . . . . . 26
 1.2.8安装cuDNN和CNMeM . . . . . . . . . . . . . . . . . . . . . 28
 
 
第2章数据收集与处理29
2.1本章摘要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2网络爬虫. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.1网络爬虫技术. . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.2构造自己的Scrapy爬虫. . . . . . . . . . . . . . . . . . . . . . 31
2.2.3构造可接受参数的Scrapy爬虫. . . . . . . . . . . . . . . . . . 36
2.2.4运行Scrapy爬虫. . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.5运行Scrapy爬虫的一些要点. . . . . . . . . . . . . . . . . . . 40
2.3大规模非结构化数据的存储和分析. . . . . . . . . . . . . . . . . . . . 42
2.3.1 ElasticSearch介绍. . . . . . . . . . . . . . . . . . . . . . . . . 44
2.3.2 ElasticSearch应用实例. . . . . . . . . . . . . . . . . . . . . . 46
 
第3章深度学习简介61
 
3.1概述. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.2深度学习的统计学入门. . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3一些基本概念的解释. . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.3.1深度学习里的函数类型. . . . . . . . . . . . . . . . . . . . . . . 66
3.3.2深度学习里的其他常见概念. . . . . . . . . . . . . . . . . . . . 70
3.4梯度递减算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.5后向传播算法. . . . . . . . . . . . . . . . . . . . .
 
				 
				
				
					内容简介  本书精选了三本关于机器学习、Keras快速上手及深度学习的经典著作,旨在为广大读者,无论是初学者还是有一定基础的学习者,提供一条清晰、高效的学习路径。全书内容涵盖了机器学习的理论基础、Keras框架的应用实战,以及深度学习的前沿技术,力求做到深入浅出,理论与实践相结合,帮助读者掌握构建智能系统的核心技能。  第一部分:机器学习入门与核心概念  机器学习作为人工智能的核心驱动力,其发展日新月异,但万变不离其宗。本书首先会从机器学习的基本概念讲起,例如什么是机器学习,它与传统编程有何区别,以及在现实世界中的广泛应用场景。我们将深入探讨监督学习、无监督学习、半监督学习和强化学习这四大类主要的学习范式,并详细介绍它们各自的原理、优缺点以及适合解决的问题类型。  在监督学习方面,我们会详细讲解回归问题和分类问题。对于回归问题,将从线性回归开始,逐步引入多项式回归、岭回归、Lasso回归等,理解特征工程、正则化等概念如何提升模型的泛化能力。对于分类问题,则会重点介绍逻辑回归、支持向量机(SVM)、决策树、随机森林以及K近邻(KNN)等经典算法。我们会深入剖析这些算法的数学原理,比如逻辑回归中的Sigmoid函数和损失函数,SVM中的核技巧和间隔最大化,决策树的熵和基尼不纯度,以及随机森林的集成学习思想。  无监督学习方面,我们将重点关注聚类和降维。聚类算法方面,会详细讲解K-Means算法,理解其迭代优化的过程,并介绍如何选择合适的K值。同时,也会涉及层次聚类和DBSCAN等更复杂的聚类方法。降维方面,将深入讲解主成分分析(PCA)的原理,理解如何通过线性变换找到数据的主要变化方向,以及奇异值分解(SVD)在降维中的作用。此外,我们还会介绍t-SNE等非线性降维技术,用于可视化高维数据。  此外,本书还将涵盖模型评估与选择的关键技术。如何衡量一个模型的性能?交叉验证、精度、召回率、F1分数、ROC曲线、AUC值等评估指标将是重点讲解的内容。理解过拟合和欠拟合是构建鲁棒模型的重要一步,我们会深入探讨其产生原因,并介绍多种防止过拟合的方法,如正则化(L1、L2)、Dropout、早停法、数据增强等。  第二部分:Keras快速上手与模型构建  Keras作为一款用户友好、高度模块化的深度学习框架,极大地降低了深度学习模型的开发门槛。本书的第二部分将带你快速掌握Keras的使用,从安装配置到构建你的第一个深度学习模型。  首先,我们会详细介绍Keras的核心组件,包括模型(Sequential和Model API)、层(Dense, Conv2D, MaxPooling2D, LSTM, GRU等)、激活函数(ReLU, Sigmoid, Tanh等)、优化器(SGD, Adam, RMSprop等)以及损失函数(MSE, CategoricalCrossentropy, BinaryCrossentropy等)。我们将通过实际代码示例,演示如何使用这些组件来搭建不同类型的神经网络。  然后,我们会循序渐进地引导读者构建各种常见的神经网络模型。从最简单的单层感知机,到多层前馈神经网络(MLP),再到卷积神经网络(CNN),最后是循环神经网络(RNN)。  对于MLP,我们将重点讲解如何构建多层结构,如何选择合适的隐藏层数量和神经元数量,以及如何应用激活函数和正则化技术。  对于CNN,本书将深入讲解卷积层(Conv2D)的工作原理,如何通过卷积核提取图像的局部特征,以及池化层(MaxPooling2D)如何实现特征的下采样和减小模型对位置变化的敏感性。我们将通过构建经典的CNN模型,如LeNet-5,以及应用于图像分类任务的实践,让读者理解CNN在图像处理领域的强大能力。  对于RNN,本书将重点介绍其处理序列数据的特性,并详细讲解LSTM(长短期记忆网络)和GRU(门控循环单元)的内部结构和工作机制,理解它们如何解决传统RNN的梯度消失问题,并应用于文本生成、机器翻译等序列任务。  此外,本书还将涵盖模型训练的各个环节,包括数据预处理(归一化、one-hot编码等)、批次训练(batch training)、模型编译(compiling model)以及模型评估(evaluating model)。我们会详细讲解如何利用`fit()`方法进行模型训练,如何监控训练过程中的损失和准确率,以及如何使用`evaluate()`方法来评估模型的性能。  最后,本书还会介绍模型保存与加载、模型微调(fine-tuning)以及迁移学习(transfer learning)等高级技巧,帮助读者在实际项目中更高效地利用预训练模型,加速开发进程。  第三部分:深度学习前沿技术与应用  深度学习是机器学习领域最令人兴奋的方向之一,它在图像识别、语音识别、自然语言处理等众多领域取得了突破性的进展。本书的第三部分将聚焦深度学习的前沿技术,带领读者深入了解其背后的原理和应用。  我们将从深度学习的基本概念出发,解释神经网络的层次化特征学习能力,以及为什么“深度”能够带来如此强大的性能。然后,我们将深入探讨各种先进的神经网络架构:     卷积神经网络(CNN)的进阶应用:除了基础的CNN,我们还将介绍更复杂的CNN架构,如ResNet(残差网络)如何通过残差连接解决深度网络的训练难题,Inception(GoogLeNet)如何通过多尺度卷积捕捉不同大小的特征,以及MobileNet等轻量级CNN如何优化模型以适应移动端部署。    循环神经网络(RNN)的深入解析:我们将进一步探讨RNN在自然语言处理(NLP)中的应用,包括词嵌入(Word Embeddings)技术(如Word2Vec, GloVe)如何将离散的词语转化为连续的向量表示,以及如何构建基于RNN的文本分类、情感分析、命名实体识别等模型。    注意力机制(Attention Mechanism):注意力机制是近年来深度学习领域的一项革命性技术,它允许模型在处理序列数据时,动态地关注输入序列的不同部分。我们将详细讲解自注意力(Self-Attention)和多头注意力(Multi-Head Attention)的工作原理,以及它们如何在Transformer模型中发挥核心作用。    Transformer模型:作为NLP领域的颠覆性模型,Transformer及其变种(如BERT, GPT系列)彻底改变了序列建模的面貌。本书将深入剖析Transformer的Encoder-Decoder架构,理解其如何利用自注意力和位置编码(Positional Encoding)来并行处理序列,并克服RNN的顺序计算限制。我们将讨论Transformer在机器翻译、文本生成、问答系统等任务中的强大表现。    生成对抗网络(GANs):GANs是深度学习在图像生成领域的一项重要突破。我们将详细介绍GANs的基本框架,包括生成器(Generator)和判别器(Discriminator)的对抗训练过程,以及DCGAN、StyleGAN等变种在生成逼真图像方面的应用。    模型部署与优化:除了理论和模型构建,本书还将触及模型部署的实际问题,包括模型压缩、量化、剪枝等技术,以及如何在不同的平台(如服务器、移动设备)上高效地部署深度学习模型。  本书的结构设计兼顾了理论的严谨性和实践的可操作性。每个章节都配有清晰的代码示例和详细的解释,鼓励读者动手实践,通过解决实际问题来加深理解。无论你是想为你的项目添加智能功能,还是希望在人工智能领域进行更深入的研究,本书都将是你宝贵的参考资料。通过系统学习,你将能够独立地设计、实现和优化各种机器学习和深度学习模型,从而在这个日新月异的领域中脱颖而出。