人脸识别与美颜算法实战:基于Python、机器学习与深度学习
书籍作者:鏂瑰渾鍦 |
ISBN:9787111650454 |
书籍语言:简体中文 |
连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 |
下载次数:4261 |
创建日期:2021-02-14 |
发布日期:2021-02-14 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
内容简介
本书将传统的图像处理技术、机器学习时代的图像技术,到目前炙手可热的深度学习时代的图像处理技术融汇贯通起来。生动的结合了目前热门的应用,以抖音、美颜相机、手机自带的滤镜和美颜功能为切入点,专注于人脸图像的各种处理,大量实际案例,带领读者与一线AI图像算法工程师在项目实践中的如何设计算法流程,如何优化算法逻辑,如何将算法应用到实际的场景中。另外本身的后一章,深扒了目前抖音、美颜相机、天天P图、淘宝、京东等APP里面图像技术的应用场景以及实现原理,提纲挈领的概述了电商、娱乐、金融、安防这四大领域中应用的AI+图像技术实现思路。让读者可以对整个中国AI+图像的应用现状以及前景有直观的认知。
前言
据统计,在当今各行各业中,互联网与软件工程行业薪资名列前茅,大幅领先于传统行业。BOSS直聘发布《2020年人才资本趋势报告》,该报告公布了2020年人才领域的前瞻趋势,对其中的人工智能相关方向进行了梳理。其中,自然语言处理岗位的平均薪资为25?553元;机器学习岗位的平均薪资为27?652元;语音识别岗位的平均薪资为24?037元;深度学习岗位的平均薪资为27?516元;语音、视频、图形开发岗位的平均薪资为22?979元。随着人工智能领域的不断扩大和普及,各行各业逐步深入实践和应用人工智能领域的相关技术,具有实践经验的顶尖AI人才缺口增大,人工智能技术将成为第四次工业革命的发动机,成为不可或缺的力量源泉。
在人工智能领域,计算机视觉是人工智能最重要的部分之一,尤其是人脸图像处理领域涌现了商汤、旷视、云丛、抖音等多家独角兽企业。2014年,中国人脸识别行业的市场规模为49亿元;2018年,中国人脸识别行业的市场规模为131亿元,年均复合增长率为37%。这充分显示了人脸图像处理技术的巨大商用价值,大量的人脸相关应用不断涌现。
本书结合大量的实际案例,从Python图像处理开始讲起,再到机器学习、深度学习的理论和应用,通过由浅入深、图文并茂的讲解及项目实战,提高读者的理论水平和代码实践能力。
本书特色
1 入门门槛低,学习曲线平滑
本书从搭建环境学起,首先介绍Windows、Linux和Mac OS这三种环境下编译环境的配置和安装;然后介绍与Python数据编程相关的基础知识、图像处理算法基础及常用函数;接着介绍机器学习和深度学习的基础理论;最后通过Python复现各种常用软件中的人脸图像算法应用。本书学习曲线平滑,适合深度学习和机器学习的零基础读者阅读。
2 通过对比、理论结合实践的方式讲解,适合新手学习
对于一个新知识点的出现,本书通过对比的方式给出了概念或原理,让读者能举一反三,拓宽知识面;对深度学习的一些理论和概念,本书结合目前热门软件中的图像算法应用实例,让读者能边学习边实践,缩短了新手与老手之间的差距。
3 内容丰富、实用,主次分明
本书所选案例涉猎广泛而丰富,算法案例紧跟当前潮流,如抖音、天天P图、美颜相机中的各种图像处理技巧,沿着“需求→算法设计→代码实现”的思路讲解,书中大量既丰富又生动有趣的例子简单易学,可直接上手。在代码示例中,不仅包含了模型构建和设计的核心思想,同时也兼顾了新手容易犯错的细节展示。此外,本书还介绍了一些在工程实践中常用的设计与实现技巧,以提高内容的实用性,增强案例与实际系统设计和实现过程的联系。
4 图文搭配合理、生动有趣,全程伴随实战
本书从实战出发,介绍了大约60多个案例,脉络清晰,没有太多枯燥的理论讲解,而是以一位资深AI算法工程师手把手带读者入门做项目的方式,讲述了新手如何入门成为AI图像算法工程师,遇到项目如何入手去做,以及目前抖音中好玩的效果是如何一步步通过算法设计做出来的,沿着Python基础、图像处理技术、视频处理技术、机器学习、深度学习及各类图像美颜算法的思路去实现。目前,各种App中美颜算法大行其道,希望通过作者有趣的讲解,可以带领读者探索其中的各种算法设计小技巧。
本书内容
第1章?AI时代:图像技术背景知识
本章首先介绍了什么是人工智能以及人工智能的历史和发展,通过介绍AI的发展历史和一些标志性事件,概述了目前中国AI技术的发展现状;然后介绍了计算机视觉技术及其分类和应用,让读者在第1章就可以体会到AI在生活中无处不在,以及它无限的发展前景。
第2章?武器和铠甲:开发环境配置
本章主要介绍了本书涉及的开发语言和编译环境,详细介绍了OpenCV开源库及Python不同版本间的区别,带领读者手把手搭建PyCharm和Anaconda编译环境,完成基本的AI开发环境配置,并且在不同环境下装载各种需要的工具包。
第3章?开启星辰大海:图像处理技术基础知识
本章详细介绍了图像处理技术的基础知识,每个知识点对应多个Python实例,让读者能够轻松完成图像的旋转、平移、镜像和缩放等一系列操作。
第4章?First Blood:第一波项目实战
本章以大量的Python实例展示了基于图像处理算法可以实现的多种效果,介绍了抖音哈哈镜、照片怀旧、素描、油画、卡通化和马赛克处理等一系列项目的算法原理和代码实现,有趣地展示了图像处理技术中的各种玩法。
第5章?Double Kill:视频图像处理理论和项目实战
本章介绍了视频图像处理技术的原理和流程,并以大量的实例展示了如何根据抖音的一些视频特效来设计算法以实现其效果,完成了抖音视频中抖动、闪白、霓虹、时光倒流、视频反复、慢动作和Black magic等效果设计。
第6章?Triple Kill:基于机器学习的人脸识别
本章详细介绍了机器学习的基础知识,从一个机器学习的实例出发,讲述了机器学习的原理,以及什么时候使用机器学习。本章以经典的人脸识别算法为例,从数据准备到算法设计原理,再到最后的训练,完成一个完整的机器学习项目。
第7章?Quatary Kill:基于深度学习的人脸识别
本章详细介绍了深度学习的基本概念和使用场景;讲解了深度学习和机器学习的区别,并以LeNet-5
目录
推荐序
前言
第1章 AI时代:图像技术背景知识 1
11 人工智能的前世今生 2
12 AI与CV的相互融合之路 3
13 AI图像处理技术 5
14 本章小结 7
第2章 武器和铠甲:开发环境配置 8
21 来自传承的馈赠:OpenCV开源跨平台机器视觉库 8
211 OpenCV的整体概念 9
212 OpenCV的应用领域 9
213 OpenCV的编程语言 9
214 OpenCV支持的系统 10
215 OpenCV的线上资源 10
22 召唤萌宠:Python语言的“制霸”之路 10
221 Python语言的发展 11
222 Python 27X版本和3X版本的区别 11
223 本书采用的Python版本 13
23 铸剑:基于PyCharm的系统环境配置 14
231 PyCharm在Mac OS系统下的安装和配置 14
232 Mac OS系统下Anaconda的安装和配置 17
24 牛刀小试:一起动手来写个例子吧 19
25 本章小结 21
第3章 开启星辰大海:图像处理技术基础知识 22
31 图像的基本概念 23
311 像素的概念 23
312 图像的构成 24
313 图像的格式 24
314 理解图像的位深和通道的概念 25
32 图像的读取、显示和存储操作 26
321 OpenCV基本图像处理函数 26
322 Python读取一张图片并显示和存储 27
33 从像素出发构建二维灰度图像 28
331 NumPy科学计算库 28
332 创建二维灰度图像 30
333 灰度图像的遍历 31
34 灰度图像和彩色图像的变换 32
341 图像的颜色空间 32
342 彩色图像的通道分离和混合 33
343 彩色图像的通道分离和混合程序示例 34
344 彩色图像的二值化 35
345 彩色图像的遍历 37
346 彩色图像和灰度图像的转换 38
35 图像的几何变换 40
351 图像几何变换的基本概念 40
352 插值算法 41
353 图像的缩放 42
354 图像的平移 44
355 图像的旋转 45
356 图像的镜像变换 47
36 图像色彩空间基础知识 48
361 图像的色调、色相、饱和度、亮度和对比度 48
362 RGB色彩空间 49
363 HSV色彩空间 49
364 HSI色彩空间 50
37 图像的直方图 50
371 图像直方图的基本概念 50
372 绘制灰度图像的直方图 51
373 绘制彩色图像的直方图 53
374 图像直方图均衡化 54
375 图像直方图反向投影 56
38 本章小结 58
第4章 First Blood:第一波项目实战 59
41 抖音哈哈镜 60
411 抖音的哈哈镜效果 60
412 哈哈镜的原理 61
413 哈哈镜的程序实现 61
42 给你一张老照片 64
421 怀旧风格算法原理 64
422 怀旧风格程序实现 65
43 给自己画一张文艺范的素描 66
431 轮廓检测算法原理 66
432 素描风格算法原理 67
433 素描风格算法的程序实现 68
44 来一张油画吧 69
441 图像油画算法原理 69
442 图像油画算法的程序实现 69
45 如何打马赛克 72
451 马赛克算法原理 72
452 马赛克算法的程序实现 72
46 打造自己的专属肖像漫画 74
461 漫画风格算法原理 74
462 漫画风格算法的程序实现 74
47 本章小结 76
第5章 Double Kill:视频图像处理理论和项目实战 77
51 视频处理流程和原理 78
511 视频的捕获和存储 78
512 提取视频中的某些帧 79
513 将图片合成为视频 80
514 多个视频合并 81
52 抖音中的视频抖动效果设计 82
521 视频抖动的原理 82
522 视频抖动的程序实现 83
53 抖音中的视频闪白效果设计 85
531 视频闪白的原理 86
532 视频闪白的程序实现 87
54 抖音中的视频霓虹效果设计 90
541 视频霓虹的原理 90
542 视频霓虹效果的程序实现 91
55 抖音中的视频时光倒流效果设计 94
551 视频时光倒流的原理 94
552 视频时光倒流的程序实现 94
56 抖音中的视频反复效果设计 95
561 视频反复的原理 95
562 视频反复的程序实现 95
57 抖音中的视频慢动作效果设计 96
571 视频慢动作的原理 97
572 视频慢动作的程序实现 97
58 视频人物漫画风格滤镜设计 98
59 本章小结 99
第6章 Triple Kill:基于机器学习的人脸识别 100
61 机器学习的基本概念 101
611 机器学习的目的 101
612 机器学习的内容 102
613 机器学习的作用 103
614 如何使用机器学习获得的东西 105
615 使用机器学习方法的时机 106
616 总结机器学习的基本概念 108
62 机器学习中的图像预处理流程 112
621 一个经典的机器学习图像处理实例 112
622 人脸识别机器学习Model训练思路 113
623 正样本图像预处理 113
624 负样本图像预处理 121
63 人脸检测机器学习算法设计 123
631 图像特征 123
632 Harr-like特征求值加速算法 127
633 图像分类器 128
634 人脸检测的训练算法流程 130
635 人脸检测的检测算法流程 131
64 训练人脸检测分类器并测试 132
641 训练准备 132
642 开始训练 133
643 模型测试 134
65 本章小结 135
第7章 Quatary Kill:基于深度学习的人脸识别 137
71 深度学习的基本概念 138
711 深度学习简介 138
712 深度学习和机器学习的区别 139
713 深度学习入门概念 141
72 卷积神经网络 147
721 卷积的原理 147
722 池化层的原理 150
723 全连接层的原理 150
724 一个经典的CNN网络结构 152
73 手写数字分类项目 153
731 训练环境的搭建 153
732 训练数据的准备 154
733 训练网络的搭建 155
734 训练代码 158
735 深度学习基础知识扩展 159
74 基于深度学习的人脸识别解决方案 161
741 数据的准备 161
742 数据集的读取和处理 163
743 网络的搭建 165
744 Model的训练过程 167
745 Model的测试过程 168
75 本章小结 169
第8章 Penta Kill:人脸图像美颜算法项目实战 170
81 人脸磨皮算法 171
811 图像滤波算法和效果 171
812 人脸磨皮算法设计 176
82 图像的色彩空间 180
821 RGB和HSV色彩空间基础知识 180
822 RGB和HSV转换的数学描述和函数实现 180
823 图片中的颜色检测 181
83 人脸美白算法设计 183
831 通过图层混合实现图像美白算法 184
832 通过beta参数调整实现图像美白算法 185
833 通过颜色查找表实现图像美白算法 187
84 人脸的手动祛痘算法设计 189
841 图像修复算法介绍 190
842 图像修复的原理 190
843 通过图像修复算法实现手动祛痘 191
85 本章小结 193
第9章 Legendary:AI时代图像算法应用新生态 194
91 抖音中的图像技术 195
911 抖音中的图像应用概览 195
912 抖音中的人脸检测技术 195
913 抖音中的人脸检测技术应用 197
914 抖音中的人体检测技术 201
915 抖音中的人体检测技术应用 201
916 抖音中的视频技术 202
917 抖音中的图像技术总结 205
92 美颜和美妆类App中的图像技术 206
921 美颜和美妆类App图像应用概览 207
922 五官的调整 207
923 美妆算法 208
924 染发算法 209
925 五官分析 211
926 美颜相机和美妆相机中图像技术的一些总结 213
93 电商中的图像技术 213
931 电商中的图像技术应用概览 213
932 虚拟穿戴技术和商品3D展示 214
933 尺寸测量 214
934 相似商品推荐及以图搜图 215
94 本章小结 216