深度学习与计算机视觉+深度学习轻松学 2本 人工智能机器人视觉系统编程教程书

深度学习与计算机视觉+深度学习轻松学 2本 人工智能机器人视觉系统编程教程书 pdf epub mobi txt 电子书 下载 2025

叶韵,冯超 著
图书标签:
  • 深度学习
  • 计算机视觉
  • 人工智能
  • 机器人视觉
  • 图像处理
  • 机器学习
  • 编程教程
  • Python
  • OpenCV
  • 神经网络
想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 旷氏文豪图书专营店
出版社: 机械工业出版社
ISBN:9787111573678
商品编码:14739881119

具体描述

YL8930  9787111573678 9787121317132

深度学习与计算机视觉:算法原理、框架应用与代码实现

全书共13章,分为2篇。第1篇基础知识,介绍了人工智能发展里程、计算机视觉概要、深度学习和计算机视觉中的基础数学知识、神经网络及其相关的机器学习基础、卷积神经网络及其一些常见结构,后对前沿的趋势进行了简单探讨。第2篇实例精讲,介绍了Python基础、OpneCV基础、简单的分类神经网络、图像识别、利用Caffe做回归、迁移学习和模型微调、目标检测、度量学习和图像风格迁移等常见的计算机视觉应用场景。从第5章开始包含了很多有趣和实用的代码示例。从第7章开始的所有实例都基于当前流行的深度学习框架中的Caffe和MXNet。


序言 
前言 
第1篇 基础知识
第1章 引言2
1.1 人工智能的新焦点——深度学习2
1.1.1 人工智能——神话传说到影视漫画2
1.1.2 人工智能的诞生3
1.1.3 神经科学的研究4
1.1.4 人工神经网络的兴起5
1.1.5 神经网络的1次寒冬6
1.1.6 神经网络的1次复兴8
1.1.7 神经网络的第二次寒冬9
1.1.8 2006年——深度学习的起点10
1.1.9 生活中的深度学习11
1.1.10 常见深度学习框架简介12
1.2 给计算机一双眼睛——计算机视觉14
1.2.1 计算机视觉简史14
1.2.2 2012年——计算机视觉的新起点16
1.2.3 计算机视觉的应用17
1.2.4 常见计算机视觉工具包19
1.3 基于深度学习的计算机视觉19
1.3.1 从ImageNet竞赛到AlphaGo战胜李世石——计算机视觉**越人类19
1.3.2 GPU和并行技术——深度学习和计算视觉发展的加速器21
1.3.3 基于卷积神经网络的计算机视觉应用22
第2章 深度学习和计算机视觉中的基础数学知识27
2.1 线性变换和非线性变换27
2.1.1 线性变换的定义27
2.1.2 高中教科书中的小例子28
2.1.3 点积和投影28
2.1.4 矩阵乘法的几何意义(1)30
2.1.5 本征向量和本征值34
2.1.6 矩阵乘法的几何意义(2)37
2.1.7 奇异值分解38
2.1.8 线性可分性和维度39
2.1.9 非线性变换42
2.2 概率论及相关基础知识43
2.2.1 条件概率和独立43
2.2.2 期望值、方差和协方差44
2.2.3 熵45
2.2.4 *大似然估计(Maximum Likelihood Estimation,MLE)47
2.2.5 KL散度(Kullback–Leibler divergence)49
2.2.6 KL散度和MLE的联系49
2.3 维度的诅咒50
2.3.1 采样和维度50
2.3.2 高维空间中的体积51
2.3.3 高维空间中的距离53
2.3.4 中心极限定理和高维样本距离分布的近似54
2.3.5 数据实际的维度56
2.3.6 局部泛化58
2.3.7 函数对实际维度的影响59
2.3.8 PCA——什么是主成分60
2.3.9 PCA——通过本征向量和本征值求主成分60
2.3.10 PCA——通过主成分分析降维61
2.3.11 PCA——归一化和相关性系数63
2.3.12 PCA——什么样的数据适合PCA64
2.3.13 其他降维手段65
2.4 卷积66
2.4.1 点积和卷积66
2.4.2 一维卷积67
2.4.3 卷积和互相关68
2.4.4 二维卷积和图像响应69
2.4.5 卷积的计算70
2.5 数学优化基础71
2.5.1 *小值和梯度下降72
2.5.2 冲量(Momentum)73
2.5.3 牛顿法75
2.5.4 学习率和自适应步长77
2.5.5 学习率衰减(Learning Rate Decay)78
2.5.6 AdaGrad:每个变量有自己的节奏78
2.5.7 AdaDelta的进一步改进79
2.5.8 其他自适应算法80
2.5.9 损失函数81
2.5.10 分类问题和负对数似然82
2.5.11 逻辑回归83
2.5.12 Softmax:将输出转换为概率84
2.5.13 链式求导法则84
第3章 神经网络和机器学习基础87
3.1 感知机87
3.1.1 基本概念87
3.1.2 感知机和线性二分类87
3.1.3 激活函数88
3.2 神经网络基础89
3.2.1 从感知机到神经网络89
3.2.2 *简单的神经网络二分类例子90
3.2.3 隐层神经元数量的作用93
3.2.4 更加复杂的样本和更复杂的神经网络94
3.3 后向传播算法95
3.3.1 求神经网络参数的梯度95
3.3.2 计算图(Computational Graph)95
3.3.3 利用后向传播算法计算一个神经网络参数的梯度97
3.3.4 梯度消失99
3.3.5 修正线性单元(ReLU)100
3.3.6 梯度爆炸101
3.3.7 梯度检查(gradient check)102
3.3.8 从信息传播的角度看后向传播算法103
3.4 随机梯度下降和批量梯度下降104
3.4.1 全量数据(full-batch)梯度下降104
3.4.2 随机梯度下降(SGD)和小批量数据(mini-batch)104
3.4.3 数据均衡和数据增加(data augmentation)106
3.5 数据、训练策略和规范化108
3.5.1 欠拟合和过拟合108
3.5.2 训练误差和测试误差109
3.5.3 奥卡姆剃刀没有**午餐111
3.5.4 数据集划分和提前停止112
3.5.5 病态问题和约束113
3.5.6 L2规范化(L2 Regularization)113
3.5.7 L1规范化(L1 Regularization)114
3.5.8 集成(Ensemble)和随机失活(Dropout)115
3.6 监督学习、非监督学习、半监督学习和强化学习117
3.6.1 监督学习、非监督学习和半监督学习117
3.6.2 强化学习(reinforcement learning)118
第4章 深度卷积神经网络120
4.1 卷积神经网络120
4.1.1 基本概念120
4.1.2 卷积层和特征响应图121
4.1.3 参数共享123
4.1.4 稀疏连接124
4.1.5 多通道卷积125
4.1.6 激活函数125
4.1.7 池化、不变性和感受野126
4.1.8 分布式表征(Distributed Representation)128
4.1.9 分布式表征和局部泛化130
4.1.10 分层表达131
4.1.11 卷积神经网络结构131
4.2 LeNet——1个卷积神经网络132
4.3 新起点——AlexNet133
4.3.1 网络结构133
4.3.2 局部响应归一化(Local Response Normalization,LRN)136
4.4 更深的网络——GoogLeNet136
4.4.1 1×1卷积和Network In Network136
4.4.2 Inception结构138
4.4.3 网络结构138
4.4.4 批规一化(Batch Normalization,BN)140
4.5 更深的网络——ResNet142
4.5.1 困难的深层网络训练:退化问题142
4.5.2 残差单元142
4.5.3 深度残差网络144
4.5.4 从集成的角度看待ResNet144
4.5.5 结构更复杂的网络146
第2篇 实例精讲
第5章 Python基础148
5.1 Python简介148
5.1.1 Python简史148
5.1.2 安装和使用Python149
5.2 Python基本语法150
5.2.1 基本数据类型和运算150
5.2.2 容器153
5.2.3 分支和循环156
5.2.4 函数、生成器和类159
5.2.5 map、reduce和filter162
5.2.6 列表生成(list comprehension)163
5.2.7 字符串163
5.2.8 文件操作和pickle164
5.2.9 异常165
5.2.10 多进程(multiprocessing)165
5.2.11 os模块166
5.3 Python的科学计算包——NumPy167
5.3.1 基本类型(array)167
5.3.2 线性代数模块(linalg)172
5.3.3 随机模块(random)173
5.4 Python的可视化包——matplotlib175
5.4.1 2D图表175
5.4.2 3D图表178
5.4.3 图像显示180
第6章 OpenCV基础182
6.1 OpenCV简介182
6.1.1 OpenCV的结构182
6.1.2 安装和使用OpenCV183
6.2 Python-OpenCV基础184
6.2.1 图像的表示184
6.2.2 基本图像处理185
6.2.3 图像的仿射变换188
6.2.4 基本绘图190
6.2.5 视频功能192
6.3 用OpenCV实现数据增加小工具193
6.3.1 随机裁剪194
6.3.2 随机旋转194
6.3.3 随机颜色和明暗196
6.3.4 多进程调用加速处理196
6.3.5 代码:图片数据增加小工具196
6.4 用OpenCV实现物体标注小工具203
6.4.1 窗口循环203
6.4.2 鼠标和键盘事件205
6.4.3 代码:物体检测标注的小工具206
第7章 Hello World! 212
7.1 用MXNet实现一个神经网络212
7.1.1 基础工具、NVIDIA驱动和CUDA安装212
7.1.2 安装MXNet213
7.1.3 MXNet基本使用214
7.1.4 用MXNet实现一个两层神经网络215
7.2 用Caffe实现一个神经网络219
7.2.1 安装Caffe219
7.2.2 Caffe的基本概念220
7.2.3 用Caffe实现一个两层神经网络221
第8章 *简单的图片分类——手写数字识别227
8.1 准备数据——MNIST227
8.1.1 下载MNIST227
8.1.2 生成MNIST的图片227
8.2 基于Caffe的实现228
8.2.1 制作LMDB数据229
8.2.2 训练LeNet-5230
8.2.3 测试和评估235
8.2.4 识别手写数字239
8.2.5 增加平移和旋转扰动240
8.3 基于MXNet的实现242
8.3.1 制作Image Recordio数据242
8.3.2 用Module模块训练LeNet-5243
8.3.3 测试和评估245
8.3.4 识别手写数字247
第9章 利用Caffe做回归249
9.1 回归的原理249
9.1.1 预测值和标签值的欧式距离249
9.1.2 EuclideanLoss层250
9.2 预测随机噪声的频率250
9.2.1 生成样本:随机噪声250
9.2.2 制作多标签HDF5数据252
9.2.3 网络结构和Solver定义253
9.2.4 训练网络259
9.2.5 批量装载图片并利用GPU预测260
9.2.6 卷积核可视化262
第10章 迁移学习和模型微调264
10.1 吃货**——通过Python采集美食图片264
10.1.1 通过关键词和图片搜索引擎下载图片264
10.1.2 数据预处理——去除无效和不相关图片267
10.1.3 数据预处理——去除重复图片267
10.1.4 生成训练数据269
10.2 美食分类模型271
10.2.1 迁移学习271
10.2.2 模型微调法(Finetune)272
10.2.3 混淆矩阵(Confusion Matrix)276
10.2.4 P-R曲线和ROC曲线278
10.2.5 全局平均池化和激活响应图284
第11章 目标检测288
11.1 目标检测算法简介288
11.1.1 滑窗法288
11.1.2 PASCAL VOC、mAP和IOU简介289
11.1.3 Selective Search和R-CNN简介290
11.1.4 SPP、ROI Pooling和Fast R-CNN简介291
11.1.5 RPN和Faster R-CNN简介293
11.1.6 YOLO和SSD简介294
11.2 基于PASCAL VOC数据集训练SSD模型296
11.2.1 MXNet的SSD实现296
11.2.2 下载PASCAL VOC数据集297
11.2.3 训练SSD模型298
11.2.4 测试和评估模型效果299
11.2.5 物体检测结果可视化299
11.2.6 制作自己的标注数据302
第12章 度量学习304
12.1 距离和度量学习304
12.1.1 欧氏距离和马氏距离304
12.1.2 欧式距离和余弦距离305
12.1.3 非线性度量学习和Siamese网络306
12.1.4 Contrastive Loss:对比损失函数307
12.2 用MNIST训练Siamese网络307
12.2.1 数据准备307
12.2.2 参数共享训练309
12.2.3 结果和可视化314
12.2.4 用τ-SNE可视化高维特征316
第13章 图像风格迁移317
13.1 风格迁移算法简介317
13.1.1 通过梯度下降法进行图像重建317
13.1.2 图像风格重建和Gram矩阵318
13.1.3 图像风格迁移320
13.2 MXNet中的图像风格迁移例子320
13.2.1 MXNet的风格迁移实现321
13.2.2 对图片进行风格迁移326

深度学习轻松学:核心算法与视觉实践

  《深度学习轻松学:核心算法与视觉实践》介绍了深度学习基本算法和视觉领域的应用实例。书中以轻松直白的语言,生动详细地介绍了深层模型相关的基础知识,并深入剖析了算法的原理与本质。同时,书中还配有大量案例与源码,帮助读者切实体会深度学习的核心思想和精妙之处。除此之外,书中还介绍了深度学习在视觉领域的应用,从原理层面揭示其思路思想,帮助读者在此领域中夯实技术基础。
  《深度学习轻松学:核心算法与视觉实践》十分适合对深度学习感兴趣,希望对深层模型有较深入了解的读者阅读。
1 机器学习与深度学习的概念1 
1.1 什么是机器学习 1 
1.1.1 机器学习的形式. 2 
1.1.2 机器学习的几个组成部分. 8 
1.2 深度学习的逆袭 9 
1.3 深层模型在视觉领域的应用. 13 
1.4 本书的主要内容 15 
1.5 总结. 17 
2 数学与机器学习基础18 
2.1 线性代数基础. 18 
2.2 对称矩阵的性质 22 
2.2.1 特征值与特征向量 22 
2.2.2 对称矩阵的特征值和特征向量 23 
2.2.3 对称矩阵的对角化 24 
2.3 概率论. 25 
2.3.1 概率与分布. 25 
2.3.2 *大似然估计 28 
2.4 信息论基础 31 
2.5 KL 散度. 33 
2.6 凸函数及其性质 37 
2.7 机器学习基本概念. 39 
2.8 机器学习的目标函数 42 
2.9 总结. 44 
3 CNN 的基石:全连接层45 
3.1 线性部分. 45 
3.2 非线性部分 48 
3.3 神经网络的模样 50 
3.4 反向传播法 55 
3.4.1 反向传播法的计算方法. 55 
3.4.2 反向传播法在计算上的抽象. 58 
3.4.3 反向传播法在批量数据上的推广. 59 
3.4.4 具体的例子. 63 
3.5 参数初始化 65 
3.6 总结. 68 
4 CNN 的基石:卷积层69 
4.1 卷积操作. 69 
4.1.1 卷积是什么. 69 
4.1.2 卷积层效果展示. 73 
4.1.3 卷积层汇总了什么 76 
4.1.4 卷积的另一种解释 77 
4.2 卷积层的反向传播. 79 
4.2.1 实力派解法. 80 
4.2.2 “偶像派”解法. 84 
4.3 ReLU 88 
4.3.1 梯度消失问题 89 
4.3.2 ReLU 的理论支撑. 92 
4.3.3 ReLU 的线性性质. 93 
4.3.4 ReLU 的不足. 93 
4.4 总结. 94 
4.5 参考文献. 94 
5 Caffe 入门95 
5.1 使用Caffe 进行深度学习训练. 96 
5.1.1 数据预处理. 96 
5.1.2 网络结构与模型训练的配置. 100 
5.1.3 训练与再训练 108 
5.1.4 训练日志分析 110 
5.1.5 预测检验与分析. 112 
5.1.6 性能测试 115 
5.2 模型配置文件介绍. 117 
5.3 Caffe 的整体结构. 122 
5.3.1 SyncedMemory 124 
5.3.2 Blob 125 
5.3.3 Layer 125 
5.3.4 Net 126 
5.3.5 Solver 126 
5.3.6 多GPU 训练. 127 
5.3.7 IO 127 
5.4 Caffe 的Layer 128 
5.4.1 Layer 的创建——LayerRegistry 128 
5.4.2 Layer 的初始化. 130 
5.4.3 Layer 的前向计算. 132 
5.5 Caffe 的Net 组装流程 133 
5.6 Caffe 的Solver 计算流程. 139 
5.6.1 优化流程 140 
5.6.2 多卡优化算法 142 
5.7 Caffe 的Data Layer 145 
5.7.1 Datum 结构. 145 
5.7.2 DataReader Thread 147 
5.7.3 BasePrefetchingDataLayer Thread 148 
5.7.4 Data Layer 149 
5.8 Caffe 的Data Transformer 150 
5.8.1 C++ 中的Data Transformer 150 
5.8.2 Python 中的Data Transformer 153 
5.9 模型层扩展实践——Center Loss Layer 156 
5.9.1 Center Loss 的原理 156 
5.9.2 Center Loss 实现. 160 
5.9.3 实验分析与总结. 164 
5.10 总结. 165 
5.11 参考文献. 165 
6 深层网络的数值问题166 
6.1 ReLU 和参数初始化. 166 
6.1.1 1个ReLU 数值实验. 167 
6.1.2 第二个ReLU 数值实验. 169 
6.1.3 第三个实验——Sigmoid 171 
6.2 Xavier 初始化. 172 
6.3 MSRA 初始化. 178 
6.3.1 前向推导 178 
6.3.2 后向推导 181 
6.4 ZCA 182 
6.5 与数值溢出的战斗. 186 
6.5.1 Softmax Layer 186 
6.5.2 Sigmoid Cross Entropy Loss 189 
6.6 总结. 192 
6.7 参考文献. 192 
7 网络结构193 
7.1 关于网络结构,我们更关心什么 193 
7.2 网络结构的演化 195 
7.2.1 VGG:模型哲学. 195 
7.2.2 GoogLeNet:丰富模型层的内部结构. 196 
7.2.3 ResNet:从乘法模型到加法模型. 197 
7.2.4 全连接层的没落. 198 
7.3 Batch Normalization 199 
7.3.1 Normalization 199 
7.3.2 使用BN 层的实验. 200 
7.3.3 BN 的实现. 201 
7.4 对Dropout 的思考. 204 
7.5 从迁移学习的角度观察网络功能 206 
7.6 ResNet 的深入分析. 210 
7.6.1 DSN 解决梯度消失问题 211 
7.6.2 ResNet 网络的展开结构. 212 
7.6.3 FractalNet 214 
7.6.4 DenseNet 215 
7.7 总结. 217 
7.8 参考文献. 217 
8 优化与训练219 
8.1 梯度下降是一门手艺活儿. 219 
8.1.1 什么是梯度下降法 219 
8.1.2 优雅的步长. 220 
8.2 路遥知马力:动量. 225 
8.3 SGD 的变种算法 232 
8.3.1 非凸函数 232 
8.3.2 **算法的弯道表现. 233 
8.3.3 Adagrad 234 
8.3.4 Rmsprop 235 
8.3.5 AdaDelta 236 
8.3.6 Adam 237 
8.3.7 爬坡赛. 240 
8.3.8 总结. 242 
8.4 L1 正则的效果. 243 
8.4.1 MNIST 的L1 正则实验. 244 
8.4.2 次梯度下降法 246 
8.5 寻找模型的弱点 251 
8.5.1 泛化性实验. 252 
8.5.2 **性实验. 255 
8.6 模型优化路径的可视化. 255 
8.7 模型的过拟合. 260 
8.7.1 过拟合方案. 261 
8.7.2 SGD 与过拟合 263 
8.7.3 对于深层模型泛化的猜想. 264 
8.8 总结. 265 
8.9 参考文献. 265 
9 应用:图像的语意分割267 
9.1 FCN 268 
9.2 CRF 通俗非严谨的入门. 272 
9.2.1 有向图与无向图模型. 272 
9.2.2 Log-Linear Model 278 
9.2.3 条件随机场. 280 
9.3 Dense CRF 281 
9.3.1 Dense CRF 是如何被演化出来的. 281 
9.3.2 Dense CRF 的公式形式. 284 
9.4 Mean Field 对Dense CRF 模型的化简 285 
9.5 Dense CRF 的推断计算公式 288 
9.5.1 Variational Inference 推导 289 
9.5.2 进一步化简. 291 
9.6 完整的模型:CRF as RNN 292 
9.7 总结. 294 
9.8 参考文献. 294 
10 应用:图像生成295 
10.1 VAE 295 
10.1.1 生成式模型. 295 
10.1.2 Variational Lower bound 296 
10.1.3 Reparameterization Trick 298 
10.1.4 Encoder 和Decoder 的计算公式. 299 
10.1.5 实现. 300 
10.1.6 MNIST 生成模型可视化 301 
10.2 GAN 303 
10.2.1 GAN 的概念. 303 
10.2.2 GAN 的训练分析. 305 
10.2.3 GAN 实战. 309 
10.3 Info-GAN 314 
10.3.1 互信息. 315 
10.3.2 InfoGAN 模型 317 
10.4 Wasserstein GAN 320 
10.4.1 分布的重叠度 321 
10.4.2 两种目标函数存在的问题. 323 
10.4.3 Wasserstein 距离. 325 
10.4.4 Wasserstein 距离的优势. 329 
10.4.5 Wasserstein GAN 的实现 331 
10.5 总结. 333 
10.6 参考文献. 334

用户评价

评分

评分

评分

评分

评分

评分

评分

评分

评分

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有