深入浅出深度学习:原理剖析与Python实践

深入浅出深度学习:原理剖析与Python实践 pdf epub mobi txt 电子书 下载 2025

黄安埠 著
图书标签:
  • 深度学习
  • 机器学习
  • Python
  • 神经网络
  • TensorFlow
  • PyTorch
  • 理论
  • 实践
  • 算法
  • 人工智能
想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 电子工业出版社
ISBN:9787121312700
版次:1
商品编码:12195740
品牌:Broadview
包装:平装
开本:16开
出版时间:2017-05-01
用纸:胶版纸
页数:344

具体描述

产品特色

编辑推荐

  

本书的特色在于取舍明确,一切无助于迅速理解深度学习精髓的内容全被摒弃了,并着重阐述了技术上的重点和难点;表达上深入浅出:即便是从未接触过AI知识的人,也能从作者简明清晰的表述中,一窥深度学习。
  对任何一位想成为AI/深度学习领域工程师的读者来说,《深入浅出深度学习:原理剖析与Python实践》能帮你迅速打开AI的大门,并成长为一名合格的AI工程师。
  

内容简介

  

《深入浅出深度学习:原理剖析与Python实践》介绍了深度学习相关的原理与应用,全书共分为三大部分,第一部分主要回顾了深度学习的发展历史,以及Theano的使用;第二部分详细讲解了与深度学习相关的基础知识,包括线性代数、概率论、概率图模型、机器学习和至优化算法;在第三部分中,针对若干核心的深度学习模型,如自编码器、受限玻尔兹曼机、递归神经网络和卷积神经网络等进行详细的原理分析与讲解,并针对不同的模型给出相应的具体应用。
  《深入浅出深度学习:原理剖析与Python实践》适合有一定高等数学、机器学习和Python编程基础的在校学生、高校研究者或在企业中从事深度学习的工程师使用,书中对模型的原理与难点进行了深入分析,在每一章的后面都提供了详细的参考文献,读者可以对相关的细节进行更深入的研究。理论与实践相结合,《深入浅出深度学习:原理剖析与Python实践》针对常用的模型分别给出了相应的应用,读者也可以在Github中下载和查看《深入浅出深度学习:原理剖析与Python实践》的代码(https://github.com/innovation-cat/DeepLearningBook)。
  

作者简介

黄安埠,2012年毕业于清华大学,获硕士学位,在校期间活跃于TopCoder等编程竞赛社区。现为腾讯基础研究高级工程师,研究领域包括个性化推荐、自然语言处理和大规模的相似度优化计算,特别是对于深度学习在推荐系统的应用有深入的研究,并申请了国内十余项相关专利。

目录

第1 部分 概要 1

1 绪论 2

1.1 人工智能、机器学习与深度学习的关系 3

1.1.1 人工智能——机器推理 4

1.1.2 机器学习——数据驱动的科学 5

1.1.3 深度学习——大脑的仿真 8

1.2 深度学习的发展历程 8

1.3 深度学习技术概述 10

1.3.1 从低层到高层的特征抽象 11

1.3.2 让网络变得更深 13

1.3.3 自动特征提取 14

1.4 深度学习框架 15

2 Theano 基础 19

2.1 符号变量 20

2.2 符号计算的抽象——符号计算图模型 23

2.3 函数 26

2.3.1 函数的定义 26

2.3.2 Logistic回归 27

2.3.3 函数的复制 29

2.4 条件表达式 31

2.5 循环 32

2.6 共享变量 39

2.7 配置 39

2.7.1 通过THEANO_FLAGS配置 40

2.7.2 通过. theanorc文件配置 41

2.8 常用的Debug技巧 42

2.9 小结 43

第2 部分 数学与机器学习基础篇 45

3 线性代数基础 46

3.1 标量、向量、矩阵和张量 46

3.2 矩阵初等变换 47

3.3 线性相关与向量空间 48

3.4 范数 49

3.4.1 向量范数 49

3.4.2 矩阵范数 53

3.5 特殊的矩阵与向量 56

3.6 特征值分解 57

3.7 奇异值分解 58

3.8 迹运算 60

3.9 样例:主成分分析 61

4 概率统计基础 64

4.1 样本空间与随机变量 65

4.2 概率分布与分布函数 65

4.3 一维随机变量 66

4.3.1 离散型随机变量和分布律 66

4.3.2 连续型随机变量和概率密度函数 67

4.4 多维随机变量 68

4.4.1 离散型二维随机变量和联合分布律 69

4.4.2 连续型二维随机变量和联合密度函数 69

4.5 边缘分布 70

4.6 条件分布与链式法则 71

4.6.1 条件概率 71

4.6.2 链式法则 73

4.7 多维随机变量的独立性分析 73

4.7.1 边缘独立 74

4.7.2 条件独立 74

4.8 数学期望、方差、协方差 75

4.8.1 数学期望 75

4.8.2 方差 76

4.8.3 协方差 76

4.8.4 协方差矩阵 78

4.9 信息论基础 81

4.9.1 信息熵 81

4.9.2 条件熵 83

4.9.3 互信息 84

4.9.4 相对熵与交叉熵 84

5 概率图模型 87

5.1 生成模型与判别模型 89

5.2 图论基础 90

5.2.1 图的结构 90

5.2.2 子图 91

5.2.3 路径、迹、环与拓扑排序 92

5.3 贝叶斯网络 95

5.3.1 因子分解 96

5.3.2 局部马尔科夫独立性断言 99

5.3.3 I-Map与因子分解 100

5.3.4 有效迹 103

5.3.5 D-分离与全局马尔科夫独立性 108

5.4 马尔科夫网络 108

5.4.1 势函数因子与参数化表示 109

5.4.2 马尔科夫独立性 111

5.5 变量消除 114

5.6 信念传播 116

5.6.1 聚类图 116

5.6.2 团树 120

5.6.3 由变量消除构建团树 123

5.7 MCMC采样原理 126

5.7.1 随机采样 127

5.7.2 随机过程与马尔科夫链 128

5.7.3 MCMC采样 132

5.7.4 Gibbs采样 134

5.8 参数学习 137

5.8.1 最大似然估计 137

5.8.2 期望最大化算法 138

5.9 小结 140

6 机器学习基础 142

6.1 线性模型 143

6.1.1 线性回归 143

6.1.2 Logistic回归 148

6.1.3 广义的线性模型 150

6.2 支持向量机 151

6.2.1 最优间隔分类器 152

6.2.2 对偶问题 155

6.2.3 核函数 156

6.3 朴素贝叶斯 160

6.4 树模型 162

6.4.1 特征选择 163

6.4.2 剪枝策略 165

6.5 聚类 166

6.5.1 距离度量 167

6.5.2 层次聚类 168

6.5.3 K-means聚类 171

6.5.4 谱聚类 172

7 数值计算与最优化 177

7.1 无约束极小值的最优化条件 177

7.2 梯度下降 179

7.2.1 传统更新策略 181

7.2.2 动量更新策略 183

7.2.3 改进的动量更新策略 184

7.2.4 自适应梯度策略 187

7.3 共轭梯度 188

7.4 牛顿法 192

7.5 拟牛顿法 194

7.5.1 拟牛顿条件 194

7.5.2 DFP算法 195

7.5.3 BFGS算法 196

7.5.4 L-BFGS算法 197

7.6 约束最优化条件 200

第3 部分 理论与应用篇 205

8 前馈神经网络 206

8.1 生物神经元结构 207

8.2 人工神经元结构 208

8.3 单层感知机 209

8.4 多层感知机 212

8.5 激活函数 217

8.5.1 激活函数的作用 217

8.5.2 常用的激活函数 219

9 反向传播与梯度消失 225

9.1 经验风险最小化 227

9.2 梯度计算 228

9.2.1 输出层梯度 228

9.2.2 隐藏层梯度 230

9.2.3 参数梯度 234

9.3 反向传播 235

9.4 深度学习训练的难点 237

9.4.1 欠拟合——梯度消失 237

9.4.2 过拟合 240

10 自编码器及其相关模型 243

10.1 自编码器 243

10.2 降噪自编码器 245

10.3 栈式自编码器 247

10.4 稀疏编码器 250

10.5 应用:cifar10图像分类 254

11 玻尔兹曼机及其相关模型 258

11.1 玻尔兹曼机 258

11.2 能量模型 261

11.2.1 能量函数 261

11.2.2 从能量函数到势函数 262

11.2.3 从势函数到概率分布 263

11.3 推断 264

11.3.1 边缘分布 265

11.3.2 条件分布 267

11.4 学习 270

11.4.1 最大似然估计 271

11.4.2 对比散度 274

11.5 应用:个性化推荐 276

11.5.1 个性化推荐概述 276

11.5.2 个性化推荐架构与算法 279

11.5.3 RBM与协同过滤 285

12 递归神经网络 291

12.1 Elman递归神经网络 292

12.2 时间反向传播 295

12.3 长短时记忆网络 299

12.4 结构递归神经网络 302

12.5 应用:语言模型 308

12.5.1 N元统计模型 308

12.5.2 基于LSTM 构建语言模型 312

13 卷积神经网络 318

13.1 卷积运算 319

13.2 网络结构 320

13.3 卷积层 324

13.4 池化层 329

13.5 应用:文本分类 333

前言/序言

推荐序1
介绍深度学习的书籍不少,但是《深入浅出深度学习:原理剖析与Python实践》与其他同类书相比,视角明显不同。如果要给本书写个宣传语,或许可以是“深度学习工程师速成培训教材”。本书对读者的知识结构有两点要求:一是学过高等数学,二是熟悉 Python 编程。换而言之,各个专业的理工科学生,尤其是学过 Python 编程的,都是此书的目标读者。
本书内容全面,但是取舍明确,有重点地深入,尤其对于技术的重点难点解释得很详细,深入浅出。
本书的特色就在于内容取舍的尺度非常明确——着重于原理的解释和动手实践的路径,但是并不拘泥于细枝末节。
胸中有经纬,就不会迷失在细节的汪洋大海。本书刚好侧重于对经纬的梳理。此处的经纬,一类是数学基础知识,另一类是深度学习技术。与深度学习相关的数学知识包括线性代数、概率统计等。因为概率图与深度学习结合较多,本书把“概率图”作为单独的一章重点讲述。深度学习技术包括机器学习的传统技术、用于训练神经网络的梯度下降等算法。本书重点讲述了神经网络的基本算法以及几种常用的深度网络架构。
工程师,重在实践。工欲善其事必先利其器,实践深度学习,离不开深度学习工具。本书介绍了 Theano 工具集的基本用法。其实深度学习工具,一通百通,各种工具的区别,类似于北京口音与东北口音的区别。
认真读完此书,读者应该拥有三项能力:一是读得懂深度学习的论文;二是读得懂深度学习的代码;三是能够自行开发简单的深度学习应用。
总结一下,在深度学习技术异常火爆,深度学习工程师奇缺的当下,如何快速培养深度学习方向的工程师,是一个迫切的问题。此书是难得的好教材。
邓侃博士




《重塑认知:现代思维范式探微》 第一部分:认知边界的拓展 在信息爆炸、技术飞速迭代的时代,我们原有的思维模式正面临前所未有的挑战。传统以线性逻辑、二元对立为基础的认知框架,在应对复杂性、不确定性和涌现性现象时显得力不从心。《重塑认知:现代思维范式探微》旨在带领读者穿越认知的迷雾,探索那些能够帮助我们更深刻理解世界、更有效地解决问题的全新思维范式。本书并非提供一套放之四海而皆准的“正确答案”,而是着力于激发读者对自身认知过程的审视,引导大家构建更加灵活、适应性更强的思维体系。 我们从“系统思维”的视角切入,这是理解现代世界复杂性的基石。本书将详细阐述系统思维的核心概念,如涌现性、反馈回路、延迟、边界等。我们会通过生动有趣的案例,例如生态系统的演变、城市的交通网络、乃至企业组织的运作,来揭示个体元素如何通过相互作用,构成一个超越个体简单叠加的整体。读者将学会识别系统中隐藏的模式,理解看似孤立事件背后的深层联系,从而避免“头痛医头,脚痛医脚”的浅层解决问题方式。我们会探讨如何绘制思维导图、流程图等工具,辅助我们可视化复杂的系统,从而更清晰地把握事物的本质。 接着,我们将深入“非线性思维”的领域。与我们习惯的因果线性关系不同,非线性思维承认许多现象并非简单的“原因A导致结果B”,而是存在着放大效应、阈值效应、多重因果等复杂互动。本书将介绍“蝴蝶效应”的原理,并将其引申到社会、经济、科技等多个领域,展示微小的变化如何可能引发巨大的、难以预测的后果。我们会探讨“临界点”理论,分析事物从一种状态向另一种状态转变的触发机制,这对于理解社会变革、技术突破乃至个人成长的关键时刻至关重要。理解非线性思维,将帮助我们更好地预测风险,抓住机遇,并以更宏观的视角来规划未来。 本书还将重点介绍“概率思维”的重要性。在信息不完全、结果不确定的世界里,我们不可能做到百分之百的准确判断。概率思维并非鼓励我们放弃决策,而是强调要以概率的眼光来评估风险和收益,做出更明智的选择。我们会学习贝叶斯定理在信息更新中的应用,理解如何根据新的证据调整我们对事件发生可能性的判断。通过对“幸存者偏差”、“赌徒谬误”等常见思维陷阱的剖析,读者将学会如何更客观地评估证据,避免被偶然性和直觉误导。本书将通过大量的统计学概念的通俗讲解,让读者在日常生活中也能运用概率思维做出更优决策。 第二部分:跨学科的融合与应用 现代知识的边界日益模糊,跨学科的融合是产生创新和突破的关键。《重塑认知》强调打破学科壁垒,借鉴不同领域的智慧,构建更全面的知识体系。 我们将审视“复杂性科学”的最新进展,并将其与我们对世界的理解相结合。复杂性科学研究的是由大量相互作用的个体组成的系统,这些系统通常表现出非线性和自组织特性。本书将介绍“自组织”的概念,解释在没有中央控制的情况下,系统如何自发地形成有序结构。我们将探讨“网络科学”,分析信息、物质、能量在不同网络中的传播规律,这对于理解社交媒体、金融市场、生物网络等至关重要。通过学习复杂性科学的工具和思想,读者将能够更好地理解涌现现象,并尝试在复杂系统中找到干预和优化的可能性。 本书还将深入探讨“认知偏差”对我们决策和判断的影响。心理学领域的研究表明,人类的思维并非总是理性客观的,存在着各种系统性的偏差。我们将详细解读“确认偏差”、“锚定效应”、“损失厌恶”等常见的认知偏差,并分析它们在日常生活、工作决策中的具体表现。更重要的是,本书将提供一套实用的方法论,帮助读者识别和克服这些认知偏差,从而做出更客观、更理性的判断。我们将介绍“元认知”的重要性,即对自己思维过程的认知和反思能力,这是提升认知水平的关键。 我们还将借鉴“博弈论”的思想,来分析个体之间的互动和决策。在社会、经济、政治等领域,许多问题都可以被视为不同参与者之间在追求各自利益时所进行的策略性博弈。本书将介绍“纳什均衡”、“囚徒困境”等博弈论中的经典模型,并展示它们在理解竞争、合作、谈判等场景中的应用。通过博弈论的学习,读者将能够更深刻地理解人际互动中的策略选择,并学习如何在复杂的博弈环境中做出最优决策。 第三部分:实践与反思:重塑行动力 理论的价值在于实践,《重塑认知》并非止步于概念的介绍,更强调将这些思维范式转化为可行的行动。 本书将提供一系列“思维训练工具”和“实践方法”。我们将介绍如何运用“类比思维”来解决新问题,即通过寻找不同领域相似的结构或模式,将已有的解决方案迁移到新的情境中。我们将探讨“逆向思维”,即从结果出发,反向推导原因和过程,这在创新和解决难题时非常有效。本书还将介绍“可视化思考”的技巧,如绘制思维导图、概念图等,帮助我们整理思路,发现隐藏的联系。 我们将强调“反思性实践”的重要性。在每一次行动之后,留出时间进行反思,审视过程中的得失,总结经验教训,并将这些宝贵的洞察融入下一次的行动中。本书将引导读者建立“反思日志”的习惯,并提供一套系统性的反思框架,帮助大家从实践中学习,不断迭代和优化自己的思维与行为。 最后,《重塑认知》将鼓励读者建立“成长型思维”。这意味着我们相信能力和智慧是可以后天培养的,而不是固定不变的。我们将探讨如何拥抱挑战,从失败中学习,并将努力视为通往精通的路径。本书将引导读者认识到,学习和适应是现代社会生存和发展的核心能力,而重塑认知,正是提升这种能力最根本的途径。 《重塑认知:现代思维范式探微》是一次对我们内心世界的探索,是对我们观察和理解世界方式的一次深刻革新。它旨在成为读者在信息洪流中拨云见日的指南,在复杂迷局中寻找清晰路径的灯塔。通过本书的学习,我们期望读者能够具备更强的分析能力、更敏锐的洞察力、更灵活的应变能力,最终在这个日新月异的世界中,重塑自我,驾驭未来。

用户评价

评分

我是一名有一定编程基础,但对深度学习领域涉足不深的开发者。一直在关注人工智能的发展,深知深度学习的重要性,但又苦于找不到一本既能系统讲解理论,又能指导实践的优质书籍。《深入浅出深度学习:原理剖析与Python实践》这个书名,让我看到了希望。我希望这本书能够从最基础的数学概念讲起,比如线性代数、微积分在深度学习中的应用,并且循序渐进,不要求读者有非常深厚的数学功底。我非常期待它能够清晰地阐述反向传播算法的每一步,以及梯度下降如何优化模型参数。对于“Python实践”部分,我希望能看到完整的代码实现,并且讲解得非常细致,包括代码的每一行作用,以及如何调试和优化代码。我更希望它能介绍一些常用的深度学习框架,比如TensorFlow或者PyTorch,并且展示如何用这些框架来构建和训练各种类型的神经网络,例如用于图像识别的CNN,或者用于自然语言处理的RNN/LSTM。

评分

老实说,我之前尝试过几本深度学习的书,但读起来总觉得有些枯燥,或者信息密度太高,消化起来很困难。这本书的标题《深入浅出深度学习:原理剖析与Python实践》给我一种全新的感觉,它听起来就像是为我这样的初学者量身定制的。我希望这本书的语言风格是轻松活泼的,能够用生动形象的比喻来解释复杂的概念,而不是干巴巴的学术术语。我特别希望它能强调“原理剖析”这一点,让我明白每一个算法、每一个技术背后的逻辑是什么,为什么会这样设计,它解决了什么问题。如果能在讲解过程中穿插一些历史发展的故事,介绍一下关键人物和里程碑式的发现,那我会觉得更有趣。而且,“Python实践”部分,我期待它能提供一些有挑战性但又 solvable 的项目,让我能够真正动手去解决一些实际问题,而不仅仅是跑一些简单的demo。我希望通过这本书,我能够建立起一个完整的深度学习知识体系,能够自信地去探索更广阔的领域。

评分

我是一名软件工程师,对新技术的学习一直保持着高度的热情。最近深度学习的热潮让我跃跃欲试,但又觉得直接上手框架会显得有些盲目。《深入浅出深度学习:原理剖析与Python实践》这本书的标题,让我觉得它能够填补我知识体系中的空白。我非常希望这本书能够以一种清晰、易懂的方式,将复杂的深度学习概念“深入浅出”地呈现出来。我特别期待它能够详细解释神经网络的每一层是如何工作的,权重和偏置是如何更新的,以及激活函数的作用。对于“Python实践”部分,我希望它能够提供高质量、可运行的代码示例,并且能够指导我如何使用Python来加载数据、预处理数据、构建模型、训练模型以及评估模型。我更希望书中能包含一些关于如何理解和解释模型预测结果的内容,这对于实际应用来说非常重要。如果它还能介绍一些在实际项目中常用的技巧和最佳实践,那这本书的价值将会大大提升。

评分

我一直对深度学习的底层原理非常好奇,尤其是那些关于神经网络如何“学习”的细节。市面上有很多介绍深度学习的教程,但大多停留在概念层面,或者直接跳到使用框架,这让我觉得学得不够扎实。这本书的名字《深入浅出深度学习:原理剖析与Python实践》一下子就吸引了我,它承诺要“深入浅出”,这正是我想要的。我希望这本书能够详细地讲解那些抽象的数学概念,比如梯度下降、反向传播等等,而且要用一种易于理解的方式来阐述,避免过于晦涩的公式推导。同时,我非常看重“Python实践”这部分,因为理论学得再好,如果不能上手去实现,就很难真正掌握。我期待这本书能提供清晰的代码示例,能够跟着书中的例子一步步搭建和训练模型,这样我才能将理论与实践结合起来,真正理解深度学习的强大之处。我对书中关于不同神经网络架构的解释也充满期待,比如CNN、RNN,它们各自的优势和适用场景是什么?它们又是如何通过特定的结构来实现特定功能的?这些都是我想要深入了解的。

评分

作为一名对AI技术充满热情的研究生,我一直在寻找一本能够帮助我深入理解深度学习核心机制的书籍。《深入浅出深度学习:原理剖析与Python实践》这个名字,准确地击中了我的需求。我希望这本书不仅仅停留在表面介绍,而是能够挖掘到更深层的原理。比如,在讲解激活函数时,不仅仅是列出几个名字,而是深入分析它们的数学特性、收敛速度以及在不同场景下的优缺点。对于损失函数和优化器,我也希望有更细致的讲解,了解它们是如何指导模型进行学习的。在“Python实践”方面,我期待它能够展示如何从零开始构建一个简单的神经网络,然后逐步加入更复杂的层和技术,从而实现对真实数据集的处理。如果书中能包含一些关于模型评估、调参以及防止过拟合的策略,那将对我非常有帮助。我希望通过阅读这本书,我能够构建起对深度学习模型内部工作原理的直观理解,并且能够独立地设计和实现自己的深度学习解决方案。

评分

第5章讲述了JavaScript的历史、Node.js的原理、程序的链接、命令式和声明式编程的区别,以及作者十多年来使用各种编程语言的感受;

评分

小时候常常长途跋涉一千五百米去超市买东西,现在科技发达了,在京东买了就直接送来了,却有点怀念以前的日记。

评分

没想到这书这么薄,希望对得起价格。

评分

分量很足的IT技术书籍,希望能够从基础学起再逐步深入下去

评分

故事趣味性超级高 总有一种看了越想看的感觉 有助于知识的理解!总之刘大的书真的非常棒

评分

好棒的书,内容充实详尽,以架构师角度解释每个内容

评分

第5章讲述了JavaScript的历史、Node.js的原理、程序的链接、命令式和声明式编程的区别,以及作者十多年来使用各种编程语言的感受;

评分

写的还是很不错的,内容可能有点老了,当然,现在技术发展太快,几个月可能就过时了

评分

关注了作者的公众号,写得很有意思,不过写的不算深入,要想更进一步,还得看专业一点的书

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有