猜你喜欢
深度学习技术图像处理入门

深度学习技术图像处理入门

书籍作者:杨培文 ISBN:9787302511021
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:5766
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介
《深度学习技术图像处理入门》从机器学习、图像处理的基本概念入手,逐步阐述深度学习图像处理技术的基本原理以及简单的实现。继而以几个实战案例来介绍如何使用深度学习方法,在数据分析竞赛中取得较高的排名。最后,通过一个实战案例,介绍如何将模型放入iOS程序,制作相应的人工智能手机App。
  《深度学习技术图像处理入门》适用于对深度学习有兴趣、希望入门这一领域的理工科大学生、研究生,以及希望了解该领域基本原理的软件开发人员。此外,《深度学习技术图像处理入门》所有案例均提供了云环境上的代码,便于读者复现结果,并进行深入学习。
前言
回想2017年4月,当清华大学出版社的编辑找到杨培文和我,商量着写一本与深度学习相关的书时,我还是比较缺乏信心的。首先,自己本专业是基因组学,或者说是生物学,机器学习方面的知识都是自学的。其次,我根本就没有写过书,由我参与撰写,可能是班门弄斧,内容有误都是小事,万一写的内容给读者灌输了错误的观念、在大方向上误导了初学阶段的读者,实在是难辞其咎。
  出版社方面同样了解我们的情况,跟我们说出版社这次想出一本面向非数学、计算机相关专业的书,希望语言更加通俗易懂,例子更贴近实际项目,让非专业出身的人看了以后,对机器学习、图像处理以及深度学习三者有一个最基本的认识。这里,我经常向生物、医学专业背景的人解释机器学习模型的原理,而培文则有多次数据分析竞赛名列前茅的经历,因此出版社希望我们两位尝试一下。
  所以接下来编写书籍的过程中,我们的定位就是相比现在市面上主流的相关书籍,前几章写得更加通俗,把入门的门槛再降低一些:然后后面的章节基于参加数据分析竞赛的实战过程,把最终的目标再定高一些;最后我们的配套代码以及环境要让初学者可以很容易地跑起来,把书籍的内容落在实际运用中。
  我们希望这本书可以让非科班出身的读者快速了解深度学习的基本原理,将相关技术举一反三,运用在自己的课题、项目中。以我自己为例,在书籍编写完成后的审阅过程中,我仔细阅读了培文撰写的运用循环神经网络进行验证码识别这一章节(第10章)的内容,后来参加百度AI挑战赛时,最初的模型就是培文整理的配套代码,后来经过调整,最后取得了第二名的成绩。
  最后一点,阅读本书,需要读者具有基本的Python编程基础,以及科学计算相关模块的了解。这部分内容本书并未涉及,但读者可以通过斯坦福大学cs228相关配套入门习题进行简单的了解,我们对此进行了汉化。
  在此感谢景略集智的王文凯、柯希阳在书籍编写过程中提供的帮助。
目录
第1章 搭建指定的开发环境
1.1 为什么要使用指定的开发环境
1.2 硬件准备
1.2.1 在亚马逊租用云GPU服务器
1.2.2 在腾讯云租用GPU服务器
1.2.3 在云服务器中开启搭载开发环境的Docker服务
1.3 软件准备
1.3.1 在Ubuntu 16.04下配置环境
1.3.2 在CentOS 7下配置环境
1.4 参考文献及网页链接

第2章 温故知新——机器学习基础知识
2.1 人工智能、机器学习与深度学习
2.2 训练一个传统的机器学习模型
2.2.1 第一步,观察数据
2.2.2 第二步,预览数据
2.3 数据挖掘与训练模型
2.3.1 第一步,准备数据
2.3.2 第二步,挖掘数据特征
2.3.3 第三步,使用模型
2.3.4 第四步,代码实战
2.4 参考文献及网页链接

第3章 数形结合——图像处理基础知识
3.1 读取图像文件进行基本操作
3.1.1 使用python-opencv读取图片
3.1.2 借助python-opencv进行不同编码格式的转换
3.1.3 借助python-opencv改变图片尺寸
3.2 用简单的矩阵操作处理图像
3.2.1 对图像进行复制与粘贴
3.2.2 把图像当成矩阵进行处理——二维码转换成矩阵
3.3 使用OpenCV“抠图”——基于颜色通道以及形态特征
3.4 基于传统特征的传统图像分类方法
3.4.1 将图片简化为少数区域并计算每个区域轮廓特征的方向
3.4.2 将HOG变换运用在所有正负样本中
3.4.3 训练模型
3.4.4 将训练好的分类器运用在新的图片中
3.5 参考文献及网页链接

第4章 继往开来——使用深度神经网络框架
4.1 从逻辑回归说起
4.2 深度学习框架
4.3 基于反向传播算法的自动求导
4.4 简单的深度神经网络框架实现
4.4.1 数据结构部分
4.4.2 计算图部分
4.4.3 使用方法
4.4.4 训练模型
4.5 参考文献及网页链接

第5章 排列组合——深度神经网络框架的模型元件
5.1 常用层
5.1.1 Dense
5.1.2 Activation
5.1.3 Dropout
5.1.4 Flatten
5.2 卷积层
5.2.1 Conv2D
5.2.2 Cropping2D
5.2.3 ZeroPadding2D
5.3 池化层
5.3.1 MaxPooling2D
5.3.2 AveragePooling2D
5.3.3 GlobalAveragePooling2D
5.4 正则化层与过拟合
5.5 反卷积层
5.6 循环层
5.6.1 SimpleRNN
5.6.2 LSTM
5.6.3 GRU
5.7 参考文献及网页链接

第6章 少量多次——深度神经网络框架的输入处理
6.1 批量生成训练数据
6.2 数据增强
6.3 参考文献及网页链接

第7章 愚公移山——深度神经网络框架的模型训练
7.1 随机梯度下降
7.2 动量法
7.3 自适应学习率算法
7.4 实验案例
7.5 参考文献及网页链接

第8章 小试牛刀——使用深度神经网络进行CIFAR.1 0数据分类
8.1 上游部分——基于生成器的批量生成输入模块
8.2 核心部分——用各种零件搭建深度神经网络
8.3 下游部分——使用凸优化模块训练模型
8.4 参考文献及网页链接

第9章 见多识广——使用迁移学习提升准确率
9.1 猫狗大战1.0——使用卷积神经网络直接进行训练
9.1.1 导入数据
9.1.2 可视化
9.1.3 分割训练集和验证集
9.1.4 搭建模型
9.1.5 模型训练
9.1.6 总结
9.2 猫狗大战2.0——使用ImageNet数据集预训练模型
9.2.1 迁移学习
9.2.2 数据预处理
9.2.3 搭建模型
9.2.4 模型可视化
9.2.5 训练模型
9.2.6 提交到kaggle评估
9.3 猫狗大战3.0——使用多种预训练模型组合提升表现
9.3.1 载入数据集
9.3.2 使用正确的预处理函数
9.3.3 搭建特征提取模型并导出特征
9.3.4 搭建并训练全连接分类器模型
9.3.5 在测试集上预测
9.4 融合模型
9.4.1 获取特征
9.4.2 数据持久化
9.4.3 构建模型
9.4.4 在测试集上预测
9.5 总结
9.6 参考文献及网页链接

第10章 看图识字——使用深度神经网络进行文字识别
10.1 使用卷积神经网络进行端到端学习
10.1.1 编写数据生成器
10.1.2 使用生成器
10.1.3 构建深度卷积神经网络
10.1.4 模型可视化
10.1.5 训练模型
10.1.6 计算模型总体准确率
10.1.7 测试模型
10.1.8 模型总结
10.2 使用循环神经网络改进模型
10.2.1 CTC Loss
10.2.2 模型结构
10.2.3 模型可视化
10.2.4 数据生成器
10.2.5 评估模型
10.2.6 评估回调
10.2.7 训练模型
10.2.8 测试模型
10.2.9 再次评估模型
10.2.1 0总结
10.3 识别四则混合运算验证码(初赛)
10.3.1 问题描述
10.3.2 数据集探索
10.3.3 模型结构
10.3.4 结果可视化
10.3.5 总结
10.4 识别四则混合运算验证码(决赛)
10.4.1 问题描述
10.4.2 数据集探索
10.4.3 数据预处理
10.4.4 模型结构
10.4.5 生成器
10.4.6 模型的训练
10.4.7 预测结果
10.4.8 模型结果融合
10.4.9 其他尝试
10.4.1 0小结
10.5 参考文献及网页链接

第11章 见习医生——使用全卷积神经网络分割病理切片中的癌组织
11.1 任务描述
11.1.1 赛题设置
11.1.2 数据描述
11.1.3 数据标注
11.2 总体思路
11.3 构造模型
11.3.1 准备数据
11.3.2 构建模型
11.3.3 模型优化
11.4 程序执行
11.5 模型结果可视化
11.5.1 加载函数
11.5.2 选择验证集并编写预测函数
11.5.3 根据tensorborad可视化结果选择最好的模型
11.5.4 尝试逐步降低学习率
11.6 观察模型在验证集上的预测表现
11.7 参考文献及网页链接

第12章 知行合一——如何写一个深度学习App
12.1 CAM可视化
12.2 导出分类模型和CAM可视化模型
12.2.1 载入数据集
12.2.2 提取特征
12.2.3 搭建和训练分类器
12.2.4 搭建分类模型和CAM模型
12.2.5 可视化测试
12.2.6 保存模型
12.2.7 导出mlmodel模型文件
12.3 开始编写App
12.3.1 创建工程
12.3.2 配置工程
12.3.3 测试工程
12.3.4 运行程序
12.4 使用深度学习模型
12.4.1 将模型导入到工程中
12.4.2 数据类型转换函数
12.4.3 实施CAM可视化
12.4.4 模型效果
12.5 参考文献及网页链接
短评

也还行,有些实用价值,讲的偏浅,看看就行

2018-11-08 15:11:40

滚滚滚滚滚滚滚滚滚滚滚滚滚的点点滴滴

2018-10-31 14:04:18

此用户未填写评价内容

2018-11-09 10:02:43