猜你喜欢
深入浅出深度学习:原理剖析与Python实践

深入浅出深度学习:原理剖析与Python实践

书籍作者:黄安埠 ISBN:9787121312700
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:7670
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介
《深入浅出深度学习:原理剖析与Python实践》介绍了深度学习相关的原理与应用,全书共分为三大部分,第一部分主要回顾了深度学习的发展历史,以及Theano的使用;第二部分详细讲解了与深度学习相关的基础知识,包括线性代数、概率论、概率图模型、机器学习和至优化算法;在第三部分中,针对若干核心的深度学习模型,如自编码器、受限玻尔兹曼机、递归神经网络和卷积神经网络等进行详细的原理分析与讲解,并针对不同的模型给出相应的具体应用。
《深入浅出深度学习:原理剖析与Python实践》适合有一定高等数学、机器学习和Python编程基础的在校学生、高校研究者或在企业中从事深度学习的工程师使用,书中对模型的原理与难点进行了深入分析,在每一章的后面都提供了详细的参考文献,读者可以对相关的细节进行更深入的研究。理论与实践相结合,《深入浅出深度学习:原理剖析与Python实践》针对常用的模型分别给出了相应的应用,读者也可以在Github中下载和查看《深入浅出深度学习:原理剖析与Python实践》的代码(https://github.com/innovation-cat/DeepLearningBook)。
作者简介

黄安埠,2012年毕业于清华大学,获硕士学位,在校期间活跃于TopCoder等编程竞赛社区。现为腾讯基础研究高级工程师,研究领域包括个性化推荐、自然语言处理和大规模的相似度优化计算,特别是对于深度学习在推荐系统的应用有深入的研究,并申请了国内十余项相关专利。

编辑推荐
本书的特色在于取舍明确,一切无助于迅速理解深度学习精髓的内容全被摒弃了,并着重阐述了技术上的重点和难点;表达上深入浅出:即便是从未接触过AI知识的人,也能从作者简明清晰的表述中,一窥深度学习的殿堂。
对任何一位想成为AI/深度学习领域工程师的读者来说,《深入浅出深度学习:原理剖析与Python实践》能帮你迅速打开AI的大门,并成长为一名合格的AI工程师。
前言
推荐序1
介绍深度学习的书籍不少,但是《深入浅出深度学习:原理剖析与Python实践》与其他同类书相比,视角明显不同。如果要给本书写个宣传语,或许可以是“深度学习工程师速成培训教材”。本书对读者的知识结构有两点要求:一是学过高等数学,二是熟悉 Python 编程。换而言之,各个专业的理工科学生,尤其是学过 Python 编程的,都是此书的目标读者。
本书内容全面,但是取舍明确,有重点地深入,尤其对于技术的重点难点解释得很详细,深入浅出。
本书的特色就在于内容取舍的尺度非常明确——着重于原理的解释和动手实践的路径,但是并不拘泥于细枝末节。
胸中有经纬,就不会迷失在细节的汪洋大海。本书刚好侧重于对经纬的梳理。此处的经纬,一类是数学基础知识,另一类是深度学习技术。与深度学习相关的数学知识包括线性代数、概率统计等。因为概率图与深度学习结合较多,本书把“概率图”作为单独的一章重点讲述。深度学习技术包括机器学习的传统技术、用于训练神经网络的梯度下降等算法。本书重点讲述了神经网络的基本算法以及几种常用的深度网络架构。
工程师,重在实践。工欲善其事必先利其器,实践深度学习,离不开深度学习工具。本书介绍了 Theano 工具集的基本用法。其实深度学习工具,一通百通,各种工具的区别,类似于北京口音与东北口音的区别。
认真读完此书,读者应该拥有三项能力:一是读得懂深度学习的论文;二是读得懂深度学习的代码;三是能够自行开发简单的深度学习应用。
总结一下,在深度学习技术异常火爆,深度学习工程师奇缺的当下,如何快速培养深度学习方向的工程师,是一个迫切的问题。此书是难得的好教材。
邓侃博士
目录

第1 部分 概要 1

1 绪论 2

1.1 人工智能、机器学习与深度学习的关系 3

1.1.1 人工智能——机器推理 4

1.1.2 机器学习——数据驱动的科学 5

1.1.3 深度学习——大脑的仿真 8

1.2 深度学习的发展历程 8

1.3 深度学习技术概述 10

1.3.1 从低层到高层的特征抽象 11

1.3.2 让网络变得更深 13

1.3.3 自动特征提取 14

1.4 深度学习框架 15

2 Theano 基础 19

2.1 符号变量 20

2.2 符号计算的抽象——符号计算图模型 23

2.3 函数 26

2.3.1 函数的定义 26

2.3.2 Logistic回归 27

2.3.3 函数的复制 29

2.4 条件表达式 31

2.5 循环 32

2.6 共享变量 39

2.7 配置 39

2.7.1 通过THEANO_FLAGS配置 40

2.7.2 通过. theanorc文件配置 41

2.8 常用的Debug技巧 42

2.9 小结 43

第2 部分 数学与机器学习基础篇 45

3 线性代数基础 46

3.1 标量、向量、矩阵和张量 46

3.2 矩阵初等变换 47

3.3 线性相关与向量空间 48

3.4 范数 49

3.4.1 向量范数 49

3.4.2 矩阵范数 53

3.5 特殊的矩阵与向量 56

3.6 特征值分解 57

3.7 奇异值分解 58

3.8 迹运算 60

3.9 样例:主成分分析 61

4 概率统计基础 64

4.1 样本空间与随机变量 65

4.2 概率分布与分布函数 65

4.3 一维随机变量 66

4.3.1 离散型随机变量和分布律 66

4.3.2 连续型随机变量和概率密度函数 67

4.4 多维随机变量 68

4.4.1 离散型二维随机变量和联合分布律 69

4.4.2 连续型二维随机变量和联合密度函数 69

4.5 边缘分布 70

4.6 条件分布与链式法则 71

4.6.1 条件概率 71

4.6.2 链式法则 73

4.7 多维随机变量的独立性分析 73

4.7.1 边缘独立 74

4.7.2 条件独立 74

4.8 数学期望、方差、协方差 75

4.8.1 数学期望 75

4.8.2 方差 76

4.8.3 协方差 76

4.8.4 协方差矩阵 78

4.9 信息论基础 81

4.9.1 信息熵 81

4.9.2 条件熵 83

4.9.3 互信息 84

4.9.4 相对熵与交叉熵 84

5 概率图模型 87

5.1 生成模型与判别模型 89

5.2 图论基础 90

5.2.1 图的结构 90

5.2.2 子图 91

5.2.3 路径、迹、环与拓扑排序 92

5.3 贝叶斯网络 95

5.3.1 因子分解 96

5.3.2 局部马尔科夫独立性断言 99

5.3.3 I-Map与因子分解 100

5.3.4 有效迹 103

5.3.5 D-分离与全局马尔科夫独立性 108

5.4 马尔科夫网络 108

5.4.1 势函数因子与参数化表示 109

5.4.2 马尔科夫独立性 111

5.5 变量消除 114

5.6 信念传播 116

5.6.1 聚类图 116

5.6.2 团树 120

5.6.3 由变量消除构建团树 123

5.7 MCMC采样原理 126

5.7.1 随机采样 127

5.7.2 随机过程与马尔科夫链 128

5.7.3 MCMC采样 132

5.7.4 Gibbs采样 134

5.8 参数学习 137

5.8.1 最大似然估计 137

5.8.2 期望最大化算法 138

5.9 小结 140

6 机器学习基础 142

6.1 线性模型 143

6.1.1 线性回归 143

6.1.2 Logistic回归 148

6.1.3 广义的线性模型 150

6.2 支持向量机 151

6.2.1 最优间隔分类器 152

6.2.2 对偶问题 155

6.2.3 核函数 156

6.3 朴素贝叶斯 160

6.4 树模型 162

6.4.1 特征选择 163

6.4.2 剪枝策略 165

6.5 聚类 166

6.5.1 距离度量 167

6.5.2 层次聚类 168

6.5.3 K-means聚类 171

6.5.4 谱聚类 172

7 数值计算与最优化 177

7.1 无约束极小值的最优化条件 177

7.2 梯度下降 179

7.2.1 传统更新策略 181

7.2.2 动量更新策略 183

7.2.3 改进的动量更新策略 184

7.2.4 自适应梯度策略 187

7.3 共轭梯度 188

7.4 牛顿法 192

7.5 拟牛顿法 194

7.5.1 拟牛顿条件 194

7.5.2 DFP算法 195

7.5.3 BFGS算法 196

7.5.4 L-BFGS算法 197

7.6 约束最优化条件 200

第3 部分 理论与应用篇 205

8 前馈神经网络 206

8.1 生物神经元结构 207

8.2 人工神经元结构 208

8.3 单层感知机 209

8.4 多层感知机 212

8.5 激活函数 217

8.5.1 激活函数的作用 217

8.5.2 常用的激活函数 219

9 反向传播与梯度消失 225

9.1 经验风险最小化 227

9.2 梯度计算 228

9.2.1 输出层梯度 228

9.2.2 隐藏层梯度 230

9.2.3 参数梯度 234

9.3 反向传播 235

9.4 深度学习训练的难点 237

9.4.1 欠拟合——梯度消失 237

9.4.2 过拟合 240

10 自编码器及其相关模型 243

10.1 自编码器 243

10.2 降噪自编码器 245

10.3 栈式自编码器 247

10.4 稀疏编码器 250

10.5 应用:cifar10图像分类 254

11 玻尔兹曼机及其相关模型 258

11.1 玻尔兹曼机 258

11.2 能量模型 261

11.2.1 能量函数 261

11.2.2 从能量函数到势函数 262

11.2.3 从势函数到概率分布 263

11.3 推断 264

11.3.1 边缘分布 265

11.3.2 条件分布 267

11.4 学习 270

11.4.1 最大似然估计 271

11.4.2 对比散度 274

11.5 应用:个性化推荐 276

11.5.1 个性化推荐概述 276

11.5.2 个性化推荐架构与算法 279

11.5.3 RBM与协同过滤 285

12 递归神经网络 291

12.1 Elman递归神经网络 292

12.2 时间反向传播 295

12.3 长短时记忆网络 299

12.4 结构递归神经网络 302

12.5 应用:语言模型 308

12.5.1 N元统计模型 308

12.5.2 基于LSTM 构建语言模型 312

13 卷积神经网络 318

13.1 卷积运算 319

13.2 网络结构 320

13.3 卷积层 324

13.4 池化层 329

13.5 应用:文本分类 333

短评

看了书的介绍和目录,有理论也有应用讲解,特别有比较多的理论深入讲解,这点很难得,现在市面上有关深度学习的书,都是介绍怎样使用开源工具,其实如果真的要学会使用工具的话,看网上的博客和文档就完整足够了,根本没必要写一本书,这本书感觉在理论上讲的比较深入,还有一些简单的应用,希望有时间可以认真读读

2017-05-16

标签
深度学习,Python