书籍作者:朱斌 | ISBN:9787121408304 |
书籍语言:简体中文 | 连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 | 下载次数:4432 |
创建日期:2021-10-07 | 发布日期:2021-10-07 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
本书主要面向OpenCV领域的研究与开发人员,采用原理结合实战的方式,介绍OpenCV 4的机器学习算法模块与深度神经网络模块中的核心算法原理与C++编程实战。全书共10章, 第1~3章, 介绍OpenCV 4的基础知识、基本图像操作和机器学习基础知识;第4~8章,介绍K-means、KNN、决策树、随机森林、Boosting算法和支持向量机等机器学习算法与编程实战;第9~10章,介绍神经网络与深度神经网络的基本原理与编程实战,并提供了不同深度学习模型的部署示例代码。
本书基本聚焦于机器学习在计算机视觉领域的应用,不要求读者具有相应的知识背景,在必要时书中会介绍相关的基本概念。因此,本书既可以作为相关专业学生的实验教材,也可以作为研究人员或工程技术人员的参考资料。
朱斌,博士,国防科技大学副教授。长期从事计算机视觉与机器学习领域的教学与科研工作,主要研究方向为成像侦察与信息处理。主持国家自然科学基金、省自然科学基金各1项,主持或参与其他科研项目多项,其中,2项科研成果列装,并获军队科技进步二等奖2项,授权国家发明专利10余项。
OpenCV(Open Source Computer Vision)是计算机视觉领域最重要的开源函数库,其中不仅包括了众多图像处理和视频分析算法,还包含了经典机器学习算法和深度学习算法库。这些机器学习算法在计算机视觉的图像分类、目标检测、目标跟踪和光学字符检测识别等任务中扮演了关键角色。本书特色如下:
1.注重理论结合实战。力求在理论与实战之间寻找更好的平衡点,为读者拉近机器学习算法原理与C++编程实战之间的距离。通过原理分析与示例代码,提升读者基于C++语言的机器学习算法编程实战能力。
2.兼顾经典与前沿算法。包含新版OpenCV 4的机器学习与深度学习模块内容。不仅有经典的“开箱即用”算法:K均值、K近邻、决策树、随机森林、Boosting、支持向量机和神经网络,还重点介绍了深度神经网络算法的基本原理及其在机器视觉领域的实战应用。
3.应用案例翔实。本书共介绍了7种经典机器学习算法,给出了聚类、分类、回归等任务共30个应用示例代码。在深度学习算法中,通过图像分类、目标检测、实例分割、目标跟踪、场景文本检测和场景文本识别等不同类型的任务,介绍了GoogLeNet、YOLOv4、Mask R-CNN、GOTURN、DB、CRNN等模型部署方法,其中不乏近年出现的高性能模型。
4.学习路线清晰。本书先讲解OpenCV的基础知识与基本图像操作,再讲解机器学习基础知识,最后逐个介绍算法的原理与应用。学习路线清晰,知识点覆盖全面,对重点内容讲解细致。
前言
从事机器学习工作的研究者关注的问题是计算机程序如何随着经验积累自动地提高性能。机器学习算法已成功应用于模式识别、通信、自动化控制、金融、生物信息学和计算机视觉等众多领域。近年来,深度学习技术的进步,更是推动了计算机视觉领域的研究进展并引发了行业应用的巨大变革。
计算机视觉指的是通过分析输入图像或图像序列,生成对被成像物体或场景的描述,用于完成具体的任务,如边缘提取、图像恢复、三维重建、特征匹配、运动估计、目标检测等。OpenCV(Open Source Computer Vision)是计算机视觉领域最重要的开源函数库,其中不仅包括了众多图像处理和视频分析算法,还包含了经典机器学习算法和深度学习算法库。这些机器学习算法在计算机视觉的图像分类、目标检测、目标跟踪和光学字符检测识别等任务中扮演了关键角色。深度机器学习算法库是OpenCV的重要组成部分,其代码使用便捷,非常适合研究与项目开发。
目前,介绍机器学习的图书大致可分为理论与实战两类,且大多数应用类图书中的案例使用Python或MATLAB编程实现。编写本书的初衷是为读者拉近机器学习算法原理与C++编程实战之间的距离。OpenCV的机器学习与深度学习模块在机器学习理论与编程实战之间架设了一座桥梁。读者通过阅读本书,可以在理解算法原理的基础上,通过示例代码提升基于C++语言的机器学习算法编程实战能力。
本书以OpenCV 4为工具,全面介绍了机器学习算法原理、代码实现与应用示例。第1章和第2章介绍OpenCV 4的基础知识与基本图像操作;第3章讲解机器学习基础知识;第4章从最简单的K-means和KNN入手,介绍聚类、分类与回归算法的原理及应用;第5~7章介绍决策树及其改进算法——随机森林和Boosting算法;第8章介绍应用广泛的支持向量机及应用,并涉及一些基本的统计学习理论知识;第9~10章,重点介绍神经网络与深度神经网络,并通过图像分类、目标检测、实例分割、目标跟踪、场景文本检测和场景文本识别等不同类型的任务,介绍GoogLeNet、YOLOv4、Mask R-CNN、GOTURN、DB和CRNN等模型部署方法,其中不乏近年出现的高性能模型。
本书基本聚焦于机器学习在计算机视觉领域的应用,不要求读者具有相应的知识背景,在必要时书中会介绍相关的基本概念。因此,本书既可以作为相关专业学生的实验教材,也可以作为研究人员或工程技术人员的参考资料。
本书利用业余时间编写完成,特别感谢家人给予的支持,感谢电子工业出版社编辑安娜的鼓励与辛勤付出。
由于机器学习与机器视觉领域理论体系庞大、应用领域广阔、技术发展迅速,受作者水平所限,在内容选择、算法原理与代码分析等方面难免存在不足之处,请读者批评指正。
朱斌
第1章 概述 1
1.1 OpenCV简述 1
1.2 OpenCV的功能 1
1.3 OpenCV中的机器学习与深度神经网络模块 2
1.4 基本数据类型 2
1.4.1 数据类型概述 2
1.4.2 cv::Vec类 3
1.4.3 cv::Point类 6
1.4.4 cv::Scalar类 8
1.4.5 cv::Size类 9
1.4.6 cv::Rect类 9
1.4.7 cv::RotatedRect类 13
1.4.8 cv::Mat类 14
1.4.9 基本矩阵运算 19
参考文献 22
第2章 OpenCV在机器学习任务中的基本图像操作 23
2.1 基本图像操作 23
2.1.1 读取、显示和存储图像 23
2.1.2 颜色空间转换 30
2.1.3 图像的几何变换 36
2.1.4 直方图均衡化 49
2.1.5 标注文字和矩形框 57
2.2 基本视频操作 60
2.2.1 读取和播放视频文件 61
2.2.2 处理视频文件 62
2.2.3 存储视频文件 65
参考文献 67
第3章 机器学习的基本原理与OpenCV机器学习模块 69
3.1 机器学习的基本概念 69
3.1.1 机器学习的定义 69
3.1.2 机器学习的分类 70
3.2 机器学习的一般流程 73
3.2.1 机器学习流程 73
3.2.2 数据集 74
3.2.3 偏差与方差 77
3.2.4 评估分类器性能的方法 79
3.3 逻辑回归分类示例 80
3.3.1 图像数据与数据表示 81
3.3.2 逻辑回归模型 82
3.3.3 逻辑回归的损失函数 83
3.4 OpenCV支持的机器学习算法 84
3.4.1 机器学习模块的结构 84
3.4.2 机器学习模块中的算法 85
3.4.3 数据集准备 87
3.4.4 特征选择 88
参考文献 89
第4章 K-means和KNN 90
4.1 算法原理 90
4.1.1 K-means原理 90
4.1.2 KNN原理 92
4.2 OpenCV实现 95
4.2.1 K-means的实现 95
4.2.2 KNN的实现 97
4.3 应用示例 99
4.3.1 K-means聚类示例 99
4.3.2 KNN手写数字识别示例 106
4.3.3 应用提示 112
参考文献 113
第5章 决策树 114
5.1 决策树原理 114
5.1.1 决策树的基本思想 114
5.1.2 决策树的表示方法 114
5.1.3 最佳切分属性的选择 116
5.1.4 停止标准 123
5.1.5 剪枝 123
5.2 OpenCV实现 123
5.2.1 创建决策树 123
5.2.2 训练决策树 126
5.2.3 使用决策树预测 127
5.3 应用示例 129
5.3.1 蘑菇可食性分类 129
5.3.2 预测波士顿房价 135
5.3.3 应用提示 142
参考文献 142
第6章 随机森林 143
6.1 随机森林原理 143
6.1.1 随机森林的基本思想 143
6.1.2 Bagging算法 143
6.2 OpenCV实现 146
6.2.1 OpenCV中的随机森林 146
6.2.2 创建随机森林 147
6.2.3 训练随机森林 148
6.2.4 使用随机森林预测 148
6.3 应用示例 148
6.3.1 蘑菇可食性分类 149
6.3.2 预测波士顿房价 153
6.3.3 应用提示 158
参考文献 158
第7章 Boosting算法 159
7.1 Boosting算法原理 159
7.1.1 Boosting算法的基本思想 159
7.1.2 Boosting算法 159
7.1.3 AdaBoost算法 160
7.2 OpenCV实现 164
7.2.1 创建AdaBoost模型 164
7.2.2 训练AdaBoost模型 166
7.2.3 使用AdaBoost模型预测 166
7.3 应用示例 166
7.3.1 蘑菇可食性分类 167
7.3.2 英文字母分类问题 169
7.3.3 应用提示 174
参考文献 174
第8章 支持向量机 175
8.1 支持向量机原理 175
8.1.1 统计学习理论概述 175
8.1.2 线性SVM算法基本原理 179
8.1.3 非线性SVM算法的基本原理 190
8.1.4 SVM回归算法的基本原理 192
8.1.5 SVM算法执行SRM准则的解释 194
8.2 OpenCV实现 195
8.2.1 OpenCV中的SVM算法 195
8.2.2 创建SVM模型 197
8.2.3 训练SVM模型 199
8.2.4 使用SVM模型预测 202
8.3 应用示例 203
8.3.1 使用HOG特征与SVM算法识别手写数字 203
8.3.2 应用提示 213
参考文献 214
第9章 神经网络 215
9.1 神经网络算法原理 215
9.1.1 神经网络的结构与表示 216
9.1.2 单隐层前馈神经网络 220
9.1.3 多隐层前馈神经网络 222
9.1.4 梯度下降法 225
9.1.5 反向传播算法 229
9.2 OpenCV实现 234
9.2.1 OpenCV中的MLP算法 234
9.2.2 创建MLP模型 235
9.2.3 训练MLP模型 237
9.2.4 使用MLP模型预测 239
9.3 应用示例 239
9.3.1 使用神经网络识别手写数字 239
9.3.2 应用提示 251
参考文献 251
第10章 深度神经网络 252
10.1 卷积神经网络的基本原理 253
10.1.1 卷积神经网络的结构 254
10.1.2 卷积层 255
10.1.3 池化 262
10.1.4 Softmax层 263
10.1.5 CNN特征学习的过程 263
10.1.6 CNN特征学习的原理 266
10.2 OpenCV的DNN模块 268
10.2.1 OpenCV支持的深度学习框架 269
10.2.2 支持的层类型 269
10.2.3 编译支持GPU加速的OpenCV 269
10.2.4 DNN模块的使用 274
10.3 应用示例 286
10.3.1 典型计算机视觉任务 286
10.3.2 使用GoogLeNet实现图像分类 289
10.3.3 使用YOLOv4实现目标检测 295
10.3.4 使用Mask R-CNN实现实例分割 306
10.3.5 使用GOTURN模型实现目标跟踪 315
10.3.6 使用DB算法实现场景文本检测 319
10.3.7 使用CRNN实现场景文本识别 327
10.3.8 应用提示 338
参考文献 339