书籍作者:龚超 | ISBN:9787122425164 |
书籍语言:简体中文 | 连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 | 下载次数:5441 |
创建日期:2024-03-23 | 发布日期:2024-03-23 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
“人工智能超入门丛书”致力于面向人工智能各技术方向零基础的读者,内容涉及数据思维、数据科学、视觉感知、情感分析、搜索算法、强化学习、知识图谱、专家系统等方向,体系完整、内容简洁、文字通俗,综合介绍人工智能相关知识,并辅以程序代码解决问题,使得零基础的读者快速入门。
本书是“人工智能超入门丛书”的一个分册,以机器学习为主线,介绍如何利用机器学习进行数据分析。全书内容共分7章,主要包括机器学习基本概念、数据分析相关基础知识、机器学习解决四类问题(回归问题、分类问题、聚类问题、降维问题)的算法、神经网络相关知识,并在附录中对Python编程基础知识、数据相关数学知识以及Python实验室Jupyter Lab的使用进行了介绍。
本书面向在人工智能方向零基础的读者,内容全面系统,语言通俗易懂,配合典型程序操作练习,简单易上手,能够帮助读者轻松认识和理解人工智能核心技术。本书可以作为大学生以及想要走向人工智能工作岗位的技术人员的入门读物,也可作为青少年人工智能相关技术方向的课程教材,同时也可作为技术普及读物供对人工智能技术感兴趣的读者阅读。
本书面向在人工智能方向零基础的读者,内容定位于专业知识入门和普及层面,全面系统,通俗易懂,让读者真正了解和理解人工智能的相关技术方向,而不仅仅是编程技术。
新一代人工智能的崛起深刻影响着国际竞争格局,人工智能已经成为推动国家与人类社会发展的重大引擎。2017年,国务院发布《新一代人工智能发展规划》,其中明确指出:支持开展形式多样的人工智能科普活动,鼓励广大科技工作者投身人工智能的科普与推广,全面提高全社会对人工智能的整体认知和应用水平。实施全民智能教育项目,在中小学阶段设置人工智能相关课程,逐步推广编程教育,鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广。
为了贯彻落实《新一代人工智能发展规划》,国家有关部委相继颁布出台了一系列政策。截至2022年2月,全国共有440所高校设置了人工智能本科专业、387所普通高等学校高等职业教育(专科)设置人工智能技术服务专业,一些高校甚至已经在积极探索人工智能跨学科的建设。在高中阶段,“人工智能初步”已经成为信息技术课程的选择性必修内容之一。在2022年实现“从0到1”突破的义务教育阶段信息科技课程标准中,明确要求在7—9年级需要学习“人工智能与智慧社会”相关内容。实际上,1—6年级阶段的不少内容也与人工智能关系密切,是学习人工智能的基础。
人工智能是一门具有高度交叉属性的学科,笔者认为其交叉性至少体现在三个方面:行业交叉、学科交叉、学派交叉。在大数据、算法、算力三驾马车的推动下,新一代人工智能已经逐步开始赋能各个行业,现在几乎没有哪一个行业不涉及人工智能有关元素。人工智能也在助力各学科的研究。近几年,Nature等顶级刊物不断刊发人工智能赋能学科的文章,如人工智能数学、化学、生物、考古、设计、音乐以及美术等的结合。人工智能内部的学派也在不断交叉融合,像知名的AlphaGo,就是集三大主流学派优势制作,并且现在这种不同学派间取长补短的研究开展得如火如荼。总之,未来的学习、工作与生活中,人工智能赋能的身影将无处不在,因此掌握一定的人工智能知识与技能将大有裨益。
根据笔者长期从事人工智能教学、研究经验来看,一些人对人工智能还存在一定的误区。比如将编程与人工智能直接画上了等号,又或是认为人工智能就只有深度学习等。实际上,人工智能的知识体系十分庞大,内容涵盖相当广泛,不但有逻辑推理、知识工程、搜索算法等相关内容,还涉及机器学习、深度学习以及强化学习等算法模型。当然,了解人工智能的起源与发展、人工智能的道德伦理,对正确认识人工智能和树立正确的价值观也是十分必要的。
通过对人工智能及其相关知识的系统学习,可以培养数学思维(Mathematical Thinking)、逻辑思维(Reasoning Thinking)、计算思维(Computational Thinking)、艺术思维(Artistic Thinking)、创新思维(Innovative Thinking)与数据思维(Data Thinking),即MRCAID。然而遗憾的是,目前市场上既能较综合介绍人工智能相关知识,又能辅以程序代码解决问题,同时还能迅速入门的图书并不多见,因此笔者策划了本系列图书,以期实现体系内容较全、配合程序操练及上手简单方便等特点。
本书以传统的机器学习为主线,按照如下内容进行组织:第1章介绍机器学习的基本概念;第2章介绍掌握机器学习时必须要了解的一些关于数据分析的基础知识;第3章~第6章分别介绍机器学习解决四类问题的算法,即回归问题、分类问题、聚类问题以及降维问题,第3章在讨论什么是回归问题的基础上介绍了一元线性回归与多元线性回归,在第4章中,首先对分类问题进行了界定,并介绍了利用k近邻算法与决策树两种不同的分类算法,第5章介绍了聚类问题以及两种不同方式的聚类算法——K均值聚类与系统聚类等内容,第6章介绍了降维问题、主成分分析以及奇异值分解等内容;第7章对神经网络的相关知识展开系统介绍。本书的附录部分回顾了Python的基础知识,介绍了关于导数与代数等数学基础知识,同时还介绍了Python室验室Jupyter Lab的使用。
本书的出版要感谢提供热情指导与帮助的院士、教授、中小学教师等专家学者,也要感谢与笔者一起并肩参与写作的其他作者。在本书的出版过程中,未来基因(北京)人工智能研究院、腾讯教育、阿里云、科大讯飞等机构提供了大力支持,在此一并表示感谢。
由于水平有限,书中内容不可避免地存在疏漏与不足,欢迎广大读者批评指正并提出宝贵的意见。
龚超
2022年9月于清华大学
第1章 机器“学习” 001
1.1 数据科学、人工智能与机器学习 002
1.1.1 数据科学与机器学习 002
1.1.2 人工智能≠机器学习≠深度学习 005
1.2 机器学习概述 011
1.2.1 机器学习是什么 011
1.2.2 机器学习学什么 018
1.3 数据素养 021
1.3.1 何为数据素养 021
1.3.2 数据素养的维度划分 023
第2章 数据基础 025
2.1 先利其器 026
2.2 科学计算 029
2.2.1 向量与矩阵生成 029
2.2.2 向量与矩阵运算 035
2.3 数据分析 040
2.3.1 Series与DataFrame 040
2.3.2 文件的导入与处理 044
2.4 数据可视 047
2.4.1 基本图形 047
2.4.2 画图点睛 052
第3章 回归问题 057
3.1 什么是回归问题 058
3.1.1 回归分析概述 058
3.1.2 最小二乘法 060
3.2 线性回归 061
3.2.1 一元线性回归 061
3.2.2 多元线性回归 069
3.3 进阶:可视化 075
第4章 分类问题 078
4.1 什么是分类问题 079
4.2 近朱者赤近墨者黑的k近邻 079
4.2.1 k近邻算法基本原理 079
4.2.2 k近邻算法实践 085
4.3 通过熵解决分类的决策树 087
4.3.1 决策树与信息熵 087
4.3.2 决策树案例与实践 090
4.4 进阶:距离 098
第5章 聚类问题 100
5.1 什么是聚类 101
5.2 K均值聚类 103
5.2.1 K均值聚类原理 103
5.2.2 K均值聚类实践 109
5.3 系统聚类 113
5.3.1 系统聚类原理 113
5.3.2 系统聚类实践 118
5.4 进阶:再谈距离 120
第6章 降维问题 122
6.1 什么是降维问题 123
6.2 主成分分析 124
6.2.1 主成分分析原理 124
6.2.2 主成分分析实践 126
6.3 奇异值分解 131
6.3.1 奇异值分解原理 131
6.3.2 奇异值分解实践 133
6.4 进阶:特征值与特征向量 136
第7章 神经网络 141
7.1 从神经元到感知机 142
7.1.1 从生物神经元到人工神经元 142
7.1.2 从单层感知机到多层感知机 146
7.2 神经网络的运行原理 150
7.2.1 结构概述 150
7.2.2 前向传播 151
7.2.3 反向传播 155
7.3 神经网络的参数说明与实践 156
7.3.1 参数与超参数 156
7.3.2 解决分类与回归问题 158
7.4 进阶:反向传播推导 163
附录A Python基础 166
A.1 运算符 167
A.1.1 基本算术运算符与数值型 167
A.1.2 关系运算符、逻辑运算符与布尔型 168
A.2 字符串与数据结构 170
A.2.1 字符串 170
A.2.2 列表 171
A.2.3 元组 172
A.2.4 字典 173
A.3 控制结构 174
A.3.1 if语句 174
A.3.2 while语句 175
A.3.3 for语句 176
A.3.4 多重循环 177
A.4 定义函数 178
附录B 导数与代数基础 179
B.1 导数 180
B.2 向量 183
B.3 矩阵 189
附录C 腾讯扣叮Python实验室:Jupyter Lab使用说明 196
这本书是一个不错的入门指南,适合那些对机器学习和数据挖掘感兴趣的初学者。书中介绍了数据分析、数据预处理、监督学习、无监督学习、模型评估等基本概念和技术,同时也提供了一些实际的项目案例和代码实现。此外,书中还包含了一些有用的数据科学工具和资源,如Python、Scikit-Learn和Jupyter Notebooks等。总体而言,这本书对于想要了解机器学习和数据科学的人来说是值得一读的资源。
2023-04-08 10:12:32
作为入门读物,这本书对于数据科学和机器学习的概念和基本原理进行了简单易懂的介绍,适合初学者阅读。书中通过具体案例和实例,讲解了数据分析、数据清洗、数据可视化、模型选择等方面的知识,并介绍了常用的机器学习算法和工具。对于想要了解数据科学和机器学习的初学者来说,这本书是一本不错的入门读物。
2023-04-08 10:12:32
我作为AI语言模型没有阅读真实书籍和文献的能力,无法进行评价和推荐。但是,推荐您可以通过搜索引擎、豆瓣读书等平台找到相关书籍的评价和推荐,以便选择最适合自己的读物。
2023-04-08 10:12:32