书籍作者:常珊 | ISBN:9787115633927 |
书籍语言:简体中文 | 连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 | 下载次数:2549 |
创建日期:2024-06-27 | 发布日期:2024-06-27 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
本书着重介绍人工智能技术在医药研发领域的应用。全书按照循序渐进的方式组织内容:先介绍人工智能的基本方法和生物医药的基本概念,然后介绍人工智能在分子表示、药物分子性质预测、分子生成、配体与蛋白质结合能力预测,以及蛋白质结构预测等新药研发任务中的具体应用,并结合具体示例,介绍如何将人工智能方法应用到实际的药物研发中。
要想更好地掌握本书涵盖的内容,读者须掌握 Python 语言和药物学的基础知识。本书适合想了解人工智能辅助药物研发的从业人员、高等院校医工交叉学科的学生阅读,也适合对人工智能辅助医药研发感兴趣的药物研发人员、程序员阅读。
1. 揭秘人工智能如何赋能药物设计/研发。
2. 涵盖人工智能应用于药物设计领域的核心技术。
3. 基于Python语言介绍人工智能的应用案例,展示人工智能在分子表示、药物分子性质预测、分子生成、配体与蛋白质结合能力预测,以及蛋白质结构预测等新药研发任务中的具体应用
第 1章 绪论 1
1.1 人工智能发展历史 1
1.2 传统计算机辅助药物设计的历史 3
1.3 人工智能辅助药物研发概况 3
第 2章 机器学习的基本概念 5
2.1 机器学习、深度学习与人工智能 5
2.1.1 人工智能 5
2.1.2 机器学习的关键术语 7
2.2 机器学习的分类 12
2.2.1 按任务类型分类 12
2.2.2 按学习方式分类 13
2.3 机器学习与药物研发 14
2.3.1 药物设计方法 15
2.3.2 药物设计中常见的机器学习方法 16
2.3.3 预测模型的构建 17
2.4 参考资料 18
第3章 支持向量机 20
3.1 支持向量机简介 20
3.2 间隔与支持向量 21
3.3 核函数 22
3.4 软间隔与正则化 25
3.5 支持向量回归 29
3.6 支持向量机算法 31
3.6.1 选块算法 31
3.6.2 分解算法 32
3.6.3 模糊支持向量机算法 32
3.6.4 序贯最小优化算法 33
3.7 示例 34
3.8 参考资料 37
第4章 决策树 39
4.1 决策树简介 39
4.2 决策树划分选择 40
4.2.1 信息熵 40
4.2.2 信息增益 42
4.2.3 信息增益率 44
4.2.4 基尼指数 45
4.3 示例 46
第5章 集成学习 51
5.1 集成学习简介 51
5.1.1 Bagging 52
5.1.2 Boosting 53
5.2 集成方法 54
5.2.1 集成学习的结合策略 54
5.2.2 增加基学习器多样性的
方法 55
5.3 随机森林 56
5.4 示例 57
5.5 参考资料 64
第6章 k近邻算法 65
6.1 k近邻算法概述 65
6.1.1 k近邻算法 65
6.1.2 距离加权近邻算法 67
6.1.3 对k近邻算法的说明 68
6.2 k近邻算法的实现 69
6.2.1 准备:使用Python导入数据 70
6.2.2 从文本文件中解析数据 71
6.2.3 如何测试分类器 72
6.3 示例:用k近邻算法改进约会网站的配对效果 72
6.4 示例:手写识别系统 79
6.5 参考资料 82
第7章 神经网络 84
7.1 生物神经元对人工神经元的启发 84
7.2 生物神经网络与人工神经网络的主要区别 86
7.3 前馈神经网络 87
7.4 反向传播算法 89
7.5 激活函数 90
7.5.1 Logistic函数 91
7.5.2 Tanh函数 91
7.5.3 ReLU函数 92
7.5.4 Leaky ReLU函数 93
7.5.5 Swish函数 93
7.6 用Tensorflow构建神经网络,实现激酶抑制剂分类 94
7.6.1 数据预处理 94
7.6.2 神经网络构建 96
7.6.3 模型训练 98
7.6.4 模型使用 99
7.7 参考资料 100
第8章 卷积神经网络 102
8.1 卷积神经网络的结构 102
8.1.1 卷积层 102
8.1.2 池化层 107
8.1.3 反池化 110
8.1.4 激活函数层 111
8.1.5 全连接层 111
8.2 卷积神经网络的相关计算 112
8.2.1 特征图 112
8.2.2 感受野 113
8.2.3 填充 114
8.2.4 膨胀卷积 115
8.3 示例:用卷积神经网络预测药物分子性质 116
8.4 参考资料 118
第9章 生成式深度学习 119
9.1 深度学习与GAN 119
9.1.1 深度学习 119
9.1.2 GAN 120
9.2 GAN的相关概念 121
9.2.1 梯度下降法 121
9.2.2 信息熵与KL散度 122
9.2.3 纳什均衡 123
9.2.4 高斯分布和高斯过程 123
9.3 GAN理论基础 124
9.3.1 什么是GAN 124
9.3.2 GAN的原理 124
9.4 GAN的训练过程 126
9.4.1 训练判别器D 127
9.4.2 训练生成器G 127
9.5 GAN的应用与代码示例 128
9.6 GAN的特点和GAN ZOO 132
9.6.1 GAN的优点 132
9.6.2 GAN的缺点 132
9.6.3 GAN ZOO 133
9.7 参考资料 134
第 10章 Python编程基础与计算环境搭建 135
10.1 Python简介 135
10.2 Python基本编程 136
10.2.1 Anaconda介绍 137
10.2.2 安装Anaconda 137
10.2.3 终端窗口运行Python代码片段 140
10.2.4 PyCharm简介 140
10.2.5 配置PyCharm 140
10.2.6 在PyCharm中编写Python脚本 142
10.3 Python语言基本要素 143
10.3.1 基本数据类型 143
10.3.2 if语句 147
10.3.3 循环语句 147
10.3.4 函数 148
10.3.5 类 149
10.4 深度学习框架的搭建 150
10.4.1 TensorFlow和PyTorch简介 150
10.4.2 安装TensorFlow 151
10.4.3 安装PyTorch 152
10.5 参考资料 154
第 11章 常用数据库介绍 155
11.1 药物数据库 155
11.1.1 PubChem数据库 155
11.1.2 DrugBank数据库 158
11.1.3 DGIdb 160
11.1.4 ChEMBL 161
11.1.5 ETCM 164
11.2 蛋白质数据库 165
11.2.1 UniProt数据库 165
11.2.2 PDB 167
11.2.3 NCBI数据库 168
11.2.4 SMART数据库 170
11.2.5 Pfam数据库 172
11.2.6 STRING 172
11.2.7 其他蛋白质数据库 174
11.3 药物-靶点数据库 174
11.3.1 TTD 174
11.3.2 BindingDB 175
11.3.3 其他药物-靶点数据库 177
11.4 参考资料 178
第 12章 分子对接 180
12.1 计算机辅助药物设计概念 180
12.2 分子对接的原理与分类 182
12.2.1 分子对接的原理 182
12.2.2 分子对接的分类 182
12.3 分子对接的操作流程 183
12.4 人工智能在分子对接中的应用 191
12.4.1 打分函数 191
12.4.2 蛋白质-配体分子对接中的机器学习 192
12.4.3 基于深度学习的多肽与蛋白质相互作用的预测框架 192
12.5 参考资料 193
第 13章 QSAR的深度学习新应用 195
13.1 QSAR 195
13.1.1 QSAR的定义 195
13.1.2 QSAR的发展简介 196
13.1.3 QSAR模型研究方法 197
13.2 传统的QSAR 199
13.2.1 2D-QSAR的基本原理 199
13.2.2 3D-QSAR的基本原理 201
13.3 QSAR模型构建步骤 203
13.3.1 软件介绍 203
13.3.2 3D-QSAR操作步骤 203
13.4 机器学习背景下的QSAR 211
13.4.1 常见的机器学习方法 212
13.4.2 深度学习方法 213
13.5 参考资料 214
第 14章 分子的特征工程 218
14.1 药物分子结构 218
14.1.1 什么是分子 218
14.1.2 什么是分子键 218
14.1.3 什么是分子构象 219
14.1.4 什么是分子的手性 220
14.2 分子描述符 221
14.2.1 什么是分子描述符 221
14.2.2 分子描述符的分类 221
14.2.3 SMILES字符串 222
14.2.4 SMARTS字符串 223
14.3 分子指纹 224
14.3.1 什么是分子指纹 224
14.3.2 分子访问系统结构键 224
14.3.3 扩展连通性指纹 225
14.4 药物分子的特征工程 226
14.4.1 什么是分子特征 226
14.4.2 其他特征化方法 226
14.4.3 特征选择 227
14.5 参考资料 228
第 15章 药物分子性质预测 231
15.1 药物代谢动力学 231
15.1.1 药物代谢动力学介绍 231
15.1.2 ADMET简介 232
15.1.3 解离常数 233
15.2 Lipinski原则 233
15.2.1 Lipinski原则介绍 233
15.2.2 Lipinski原则的简单程序实现 234
15.3 机器学习中的药物分子性质预测 235
15.3.1 数据特征化处理 235
15.3.2 机器学习预测药物分子性质 237
15.4 深度学习中的药物分子性质预测 239
15.4.1 特征化处理和数据集划分 239
15.4.2 深度学习预测药物分子性质 241
15.5 参考资料 244
第 16章 分子从头生成 245
16.1 先导化合物的优化 245
16.2 药物分子设计的原则 245
16.2.1 前药设计 245
16.2.2 孪药设计 247
16.2.3 软药设计 247
16.3 传统的先导化合物优化 247
16.3.1 采用生物电子等排体进行替换 247
16.3.2 生物电子等排体的分类 248
16.4 计算机辅助的先导化合物优化 249
16.4.1 QSAR 249
16.4.2 骨架跃迁 251
16.5 分子从头生成简介 252
16.5.1 什么是分子从头生成 252
16.5.2 分子生成的分类 253
16.6 深度学习与分子从头生成 254
16.6.1 分子从头生成背景 254
16.6.2 分子从头生成模型 256
16.6.3 分子从头生成的挑战 258
16.7 参考资料 259
第 17章 蛋白质结构预测 262
17.1 蛋白质的结构与功能 262
17.1.1 蛋白质的结构层次 262
17.1.2 蛋白质的功能 264
17.2 蛋白质折叠动力学简介 264
17.2.1 蛋白质折叠 264
17.2.2 蛋白质折叠动力学 265
17.3 蛋白质结构预测算法 266
17.3.1 遗传算法 266
17.3.2 模拟退火算法 267
17.3.3 同源建模方法 268
17.4 蛋白质结构预测的颠覆性发展 269
17.5 基于蛋白质结构预测的药物设计 271
17.5.1 分子对接 271
17.5.2 基于半监督学习的药物-靶点相互作用研究 272
17.5.3 药物-靶点结合亲和力研究 273
17.6 参考资料 274
第 18章 蛋白质-分子结合的深度学习预测 276
18.1 药物靶点的基本概念 276
18.2 药物靶点与小分子的相互作用 277
18.3 药物靶点与小分子的结合自由能的计算 278
18.3.1 基于物理模型的方法 279
18.3.2 经验打分函数 280
18.3.3 基于知识的方法 281
18.3.4 基于深度学习的蛋白质-配体分子结合能力 281
18.4 人工智能预测蛋白质-配体分子结合能的实战 283
18.4.1 药物靶点与小分子的特征提取 283
18.4.2 基于蛋白质与配体相互作用的指纹提取 284
18.4.3 人工智能模型预测蛋白质-配体结合常数 285
18.5 参考资料 288