猜你喜欢
计算机视觉实践

计算机视觉实践

书籍作者:李轩涯 ISBN:9787302597483
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:6229
创建日期:2023-03-26 发布日期:2023-03-26
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

本书研究计算机对环境的表达、理解与感知相关的理论和技术,试图建立从图像或多维数据中获取“信息”的人工智能系统,是让计算机智能化的达到类似人类的双眼“看”的一门研究科学。本书兼具基础理论与编程实战,可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的实践教材或参考书,也可供从事计算机视觉和人工智能等领域研究的相关人员参考,是一本实用性极强的入门实践教辅材料。

编辑推荐

本书全面讲解了计算机视觉和人工智能技术,理论与实践充分结合,带您开启计算机视觉之门

前言




前言





近年来,人工智能行业的快速发展得到了社会各界的广泛关注,我国政府在《新一代人工智能发展规划》提出“到2030年,使中国成为世界主要人工智能创新中心”。与此同时,我国多所高校也陆续成立人工智能专业。2018年35所高校获教育部批准首批开设人工智能本科专业,2019、2020年新增人工智能专业的高校分别有180所、130所。然而,在人工智能行业高速发展的大背景下,AI人才仍然显得“供血不足”。


从当前的人才需求趋势来看,由于人工智能技术与业务落地实践结合非常紧密,行业亟须大量既懂理论又懂实践的应用型AI人才。作为人才培养的重要基地,我国高校人工智能人才培养目前还面临师资较少、经费不足、实践机会缺失等现实问题,导致目前高校培养的人才仍以学科型、研究型为主。关于行业需求量较大的应用型人才如何培养尚不明确,难以满足人工智能行业的深度需求。


为帮助更多人工智能爱好者了解产业需求,本书应用百度开源深度学习框架百度飞桨(PaddlePaddle),从机器学习、自然语言处理、计算机视觉三部分整理大量实践案例,辅以理论知识讲解,帮助读者快速入门,理解核心知识点。并通过由浅入深的真实案例操作,对相关知识进行全面实战检验。例如在机器学习部分,将按照数据建模步骤,从问题定义、数据收集、特征工程、模型训练、模型评估、模型应用方面,层层深入、循序渐进地剖析机器学习中极具代表性的实践; 在自然语言处理部分,将从自然语言理解(NLU)、自然语言生成(NLG)两个层面,带领读者探索自然语言处理的奥秘; 在计算机视觉部分,将以计算机视觉任务为主线,由简到难、循序渐进地引领读者搭建并训练一个个深度学习模型。总的来讲,本套教材兼具理论与实战,既能作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的实践教材或参考书,也可供从事人工智能领域研究的相关人员参考,是一套实用性极强的入门实践教辅材料。

本套教材中涵盖了大量源自百度飞桨平台的实践案例。作为我国首个自主研发、功能丰富、开源开放的产业级深度学习平台,百度飞桨已凝聚来自于各行各业的370万开发者,创建42.5万个AI模型,累计服务14万企事业单位,覆盖工业、能源、金融、农业、医疗、城市管理等众多应用场景。作者从百度飞桨中挑选了大量适合初学者学习的案例素材,以期通过真实的产业界实战练习,帮助读者更好地理解、应用相关知识点,更好完成从理论到实践的进阶,成为真正符合市场需求的应用型人工智能人才。

人工智能行业的发展离不开人才培养,应用型人才的培养离不开实践学习。希望这套教材的出现,可以帮助更多人工智能爱好者通过真实案例更深刻地理解理论知识,并在日后将书中所学应用到产业实践中,共同推动我国人工智能发展走向新高峰。




编者

2021年11月


目录



目录




第1章Python基础

实践一: 文件名称批量修改

实践二: 随机数生成与排序

实践三: 9×9乘法表

实践四: 收视率可视化分析

实践五: 鲜花图像爬取

实践六: 鲜花图像预处理


第2章图像分类

实践七: 基于深度神经网络的宝石分类

实践八: 基于卷积神经网络的美食识别

实践九: 基于VGG16 的中草药识别

实践十: 基于ResNet50的CIFAR10数据分类


第3章目标检测

实践十一: 两阶段目标检测(Faster RCNN)

实践十二: 一阶段目标检测(YOLOv3)


第4章图像分割

实践十三: 基于UNet的宠物分割

实践十四: 基于DeepLabv3 Plus的宠物分割

实践十五: 基于PaddleSeg的人像分割


第5章视频分类

实践十六: 基于TSN的视频分类

实践十七: 基于ECO的视频分类


第6章生成对抗网络

实践十八: 基于GAN的手写数字生成

实践十九: 基于DCGAN的人脸图像生成

实践二十: 基于pix2pix的图像翻译

实践二十一: 基于CycleGAN的图像风格迁移


参考文献



产品特色