书籍作者:龚心满 | ISBN:9787121457388 |
书籍语言:简体中文 | 连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 | 下载次数:1536 |
创建日期:2024-04-21 | 发布日期:2024-04-21 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
龚心满,硕士,新能源汽车感知融合资深工程师。毕业于中国计量大学控制理论与控制工程专业。曾就职于华人运通自动驾驶科技有限公司,担任深度学习高级工程师职位,负责ADAS感知项目的研发,现就职于吉咖智能机器人有限公司感知算法中心,负责高阶自动驾驶的落地。同时还参与多本人工智能书籍的撰写,也是多个技术专栏的签约作者。在安防和自动驾驶领域都有丰富的经验。
江涛,北京航空航天大学学士,香港中文大学硕士。先后在明星初创公司、研究院、互联网大厂、实验室任职,专注于深度学习与计算机视觉领域的前沿研究、落地部署、AI产品化,是多个国际知名开源项目的活跃贡献者和维护者,也是多个技术专栏的签约作者。
梁功臣,硕士,新能源汽车软件研发高级工程师。毕业于东北大学控制理论与控制工程专业。曾作为项目核心成员于中国科学院沈阳自动化研究所参与相关国家863项目(仿生医疗假肢)的研发科研工作,现就职于蔚来汽车科技有限公司数字架构定义与集成部门。
胡佳慧,硕士,毕业于中国计量大学控制工程专业。现就职于远景科技集团,负责新能源行业智能化项目的研发,同时也是多个知名开源项目的负责人。在人工智能研发与落地方面有着丰富的经验。
多位自动驾驶相关领域资深工程师倾力打造;多位自动驾驶相关领域教授、专家联合力荐;
从理论到实践,详细介绍自动驾驶算法与落地实践。主要内容包括:
.计算机视觉与神经网络
.目标检测在自动驾驶中的应用
.语义分割在自动驾驶中的应用
.车道检测与分割
.多目标跟踪在自动驾驶中的应用
.深度学习模型的落地与部署
前言
随着自身的不断发展,计算机视觉技术在自动驾驶感知领域获得了广泛应用,诸如交通标识牌检测、车辆检测、行人检测、3D激光点云目标检测、可行驶区域划分、车道线检测,以及多目标跟踪等感知功能都用到了计算机视觉技术。但很多初学者或想要进入自动驾驶感知领域的人很难系统地学习自动驾驶感知技术,而本书恰恰可以满足读者的这一需求。本书作者都是自动驾驶行业的深度开发者,有丰富的业内经验,可以帮助读者进入自动驾驶领域,同时加快自动驾驶的落地与发展。
本书是一本系统讲解自动驾驶感知技术的图书,书中展示了具体的实践案例及自动驾驶感知技术的落地部署方案,从理论到实践层面讲解与自动驾驶感知相关的技术,可让读者全面、深入、透彻地理解所讲解的算法。
第1章:主要以介绍神经网络的基础知识作为开始,全面讲解经典卷积神经网络、轻量化卷积神经网络,以及与Vision Transformer相关的Backbone模型,同时用一个交通标识牌识别模型对ResNet和MobileViT模型进行了实践与讲解。
第2章:主要讲解2D目标检测算法,开始主要介绍两阶段目标检测算法和单阶段目标检测算法,之后详细讲解YOLOv5、YOLOX、NanoDet和YOLOv5 Lite算法,并分别使用车辆检测、行人检测、交通标识牌检测和交通信号灯检测作为实践项目来对上述算法进行实践;同时对3D激光点云算法PointPillars的原理进行详细讲解,并结合OpenPCDet进行了代码的讲解。此外,本章还加入了对BEVFormer环视3D目标检测算法的介绍。
第3章:介绍语义分割在自动驾驶中的应用,主要讲解STDC算法的原理和设计思想,同时介绍基于Vision Transformer的TopFormer轻量化语义分割算法,还针对TopFormer基于Cityscapes数据集进行了实际的项目实践和讲解。
第4章:主要介绍自动驾驶中的车道线检测与分割技术,首先介绍UNet算法的原理;然后介绍基于Line Anchor的LaneATT算法;最后对CULane数据集进行了介绍,并基于LaneATT算法进行了实践和代码的讲解。
第5章:介绍多目标跟踪在自动驾驶中的应用,主要讲解SORT和DeepSORT的原理,以及速度更快的多目标跟踪算法ByteTrack的原理和基于MOT16数据集的实践与代码的讲解,同时简单介绍了ReID的相关知识。
第6章:主要介绍自动驾驶中的相关算法模型的部署落地技术,首先介绍常见的模型部署框架;接着介绍OpenCV的相关知识与GPU编程工具CUDA、模型推理框架TensorRT,这里详细解读了TensorRT的相应接口与如何进行量化加速和插件开发,以及如何使用ONNX进行模型的转换和基于TensorRT的落地部署;然后介绍如何使用TensorRT进行YOLOv5目标检测的部署和加入;最后使用NCNN进行NanoDet的部署。
本书主要由龚心满编写,参与编写的人员还有江涛编、梁功臣和胡佳慧。
说明:为了让读者可以通过本书与学术论文或技术文档进行无缝衔接,书中对很多英文专业名词没有进行翻译,这主要考虑到翻译后不能很好地表达算法本身的意思。读者如果有不习惯或不理解的地方,可以通过邮件([email protected])进行沟通交流。
第1章 计算机视觉与神经网络 1
1.1 人工神经网络 1
1.1.1 感知机 2
1.1.2 神经网络 2
1.2 卷积神经网络 4
1.2.1 卷积 4
1.2.2 激活函数 5
1.2.3 池化层 6
1.2.4 全连接层 6
1.3 经典卷积神经网络 7
1.3.1 AlexNet 7
1.3.2 VGG 8
1.3.3 GoogLeNet 9
1.3.4 ResNet 11
1.3.5 DarkNet 14
1.3.6 CSPDarkNet 16
1.4 轻量化卷积神经网络 18
1.4.1 MobileNet 18
1.4.2 ShuffleNet 22
1.4.3 GhostNet 25
1.5 Vision Transformer在计算机视觉中的应用 27
1.5.1 ViT 27
1.5.2 Swin Transformer 30
1.5.3 MobileViT 34
1.5.4 TRT-ViT 36
1.5.5 基于ResNet/MobileViT的交通标识牌识别项目实践 38
1.6 本章小结 55
第2章 目标检测在自动驾驶中的应用 56
2.1 目标检测简介 56
2.1.1 相关工作简介 56
2.1.2 两阶段目标检测算法简介 57
2.1.3 单阶段目标检测算法简介 62
2.2 自动驾驶中的车辆检测 66
2.2.1 BDD100K数据集简介 66
2.2.2 YOLOv5算法的原理 67
2.2.3 基于YOLOv5的车辆检测项目实践 74
2.3 自动驾驶中的行人检测 81
2.3.1 YOLOX算法的原理 81
2.3.2 基于YOLOX的行人检测项目实践 90
2.4 自动驾驶中的交通标识牌检测 104
2.4.1 NanoDet算法的原理 104
2.4.2 基于NanoDet的交通标识牌检测项目实践 110
2.5 自动驾驶中的交通信号灯的检测与识别 125
2.5.1 YOLOv5 Lite算法的原理 125
2.5.2 基于YOLOv5 Lite的交通信号灯检测项目实践 128
2.6 3D目标检测 131
2.6.1 PointPillars 132
2.6.2 BEVFormer 136
2.6.3 基于OpenPCDet的3D目标检测项目实践 139
2.7 本章小结 153?
第3章 语义分割在自动驾驶中的应用 154
3.1 STDC算法的原理 155
3.1.1 STDC模块 155
3.1.2 STDC语义分割网络 157
3.2 TopFormer算法的原理 160
3.2.1 Token Pyramid Module 161
3.2.2 Scale-Aware Semantics Extractor 162
3.2.3 Semantics Injection Module 162
3.2.4 Segmentation Head 163
3.3 基于TopFormer的可行驶区域分割项目实践 163
3.3.1 Cityscapes数据集简介 163
3.3.2 TopFormer模型实现 164
3.4 本章小结 172
第4章 车道线检测与分割 173
4.1 UNet算法的原理 174
4.2 LaneATT算法的原理 176
4.2.1 Lane的Anchor表征 177
4.2.2 基于Anchor的特征图池化 177
4.2.3 局部注意力机制 178
4.2.4 Proposal预测 179
4.2.5 后处理 179
4.3 基于LaneATT的车道线检测实践 180
4.3.1 CULane数据集介绍 180
4.3.2 LaneATT实践 180
4.4 本章小结 186
第5章 多目标跟踪在自动驾驶中的应用 187
5.1 多目标跟踪算法SORT的原理 187
5.2 多目标跟踪算法DeepSORT的原理 192
5.2.1 级联匹配 192
5.2.2 ReID特征提取 193
5.3 多目标跟踪算法ByteTrack的原理 194
5.4 基于ByteTrack的多目标跟踪项目实践 196
5.4.1 MOT16数据集 196
5.4.2 Byte匹配 197
5.5 本章小结 202
第6章 深度学习模型的落地和部署 203
6.1 常见模型部署框架介绍 203
6.1.1 TensorRT 204
6.1.2 NCNN 206
6.1.3 ONNX 206
6.2 OpenCV图像处理操作 207
6.2.1 OpenCV基本操作 207
6.2.2 使用OpenCV 进行图像预处理 212
6.3 GPU编程工具之CUDA 216
6.3.1 CUDA 编程模型 217
6.3.2 CUDA 线程组织 223
6.3.3 CUDA 内存组织 239
6.3.4 GPU 硬件组织结构 242
6.3.5 CUDA流 245
6.4 模型部署框架之TensorRT 249
6.4.1 使用TensorRT API搭建网络结构 250
6.4.2 从ONNX文件中导入网络结构定义 253
6.4.3 TensorRT推理引擎的序列化与反序列化 254
6.4.4 TensorRT的推理 257
6.4.5 INT8量化 259
6.4.6 TensorRT的插件开发 261
6.5 TensorRT 模型部署实例 263
6.5.1 使用 OpenCV 进行前处理 264
6.5.2 使用CUDA加速前处理 265
6.5.3 执行推理操作 268
6.5.4 后处理 270
6.6 NCNN模型部署 273
6.6.1 NCNN部署流程 273
6.6.2 使用NCNN部署NanoDet 276
6.7 本章小结 284
参考文献 285
非常好,值得购买,比较有用
2023-08-15 16:20:51
本书是系统讲解自动驾驶感知技术的书,同时带有具体的自动驾驶实践案例,并提供自动驾驶技术落地部署方案,包括目标检测,语义分割,车道线检测等…
2023-08-15 15:48:57