书籍作者:宋弢 | ISBN:9787302618386 |
书籍语言:简体中文 | 连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 | 下载次数:8384 |
创建日期:2023-05-17 | 发布日期:2023-05-17 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
《智能药物研发--新药研发中的人工智能》围绕生物化学分子,介绍了新药研发过程中各阶段的人工智能技术,主要内容包括人工智能在生物分子的化学表征方法、基于分子表征的无监督预训练方法、分子性质预测、智能分子生成、药物-靶标相互作用预测、药物-药物相互作用预测、生物医药知识图谱应用、分子逆合成设计及生物医学命名实体识别等方面的应用。
宋弢,教授,博士生导师,国家级人才项目青年专家,山东省泰山学者,山东省青年五四奖章获得者,山东省青年创新团队负责人,爱思维尔中国高被引专家,入选全球前2%顶尖科学家年度影响力榜单。2015年10月,华中科技大学,机械工程博士后流动站出站,入职中国石油大学。
主要研究方向:智能信息处理、智能药物设计、海洋环境智能预报等。
曾湘祥,教授、博士生导师、国家高层次青年人才计划入选者、湖南省杰出青年基金获得者。曾受邀在哈佛大学、印第安纳大学、俄克拉荷马州立大学等地合作研究,曾担任厦门大学博士生导师,马德里理工大学客座研究员,香港中文大学荣誉访问教授。获2019年吴文俊人工智能优秀青年奖,2020年亚马逊机器学习研究奖,厦门大学教学成果奖特等奖,福建省教学成果奖二等奖,福建省自然科学奖三等奖,CCF科学技术奖。他入选了科睿维安2020和2021年度“全球高被引科学家”名单,爱思唯尔2021年年度“中国高被引学者”名单,斯坦福发布的“全球前2%顶尖科学家”名单。
研究方向包括计算智能,知识图谱,生物医药大数据等,近年来在nature子刊、cell子刊、TKDE/TNNLS/TPDS/TCYB、AAAI、IJCAI等期刊和会议发表论文100余篇。获IMCS2016年度最佳论文奖,ACMC2019国际会议最佳论文奖。成果入选世界人工智能大会“卓越引领者奖”榜单。创办的DrugAI公众号入选2020年度中国“学术媒体公众号Top10”。
前 言
新药研发是一个周期长、耗费高的过程,大部分药物成功上市需要10~15年。新药研发中许多化学生物实测技术在所谓的“wet实验室”中开展,而计算方法的开发和应用有助于加速药物发现,因其不在生物体内或体外开展实验,通常被称为“in silico”。计算方法已经广泛应用了几十年,随着人工智能的兴起,特别是机器学习和深度学习技术的成熟,新药研发有了创新,基于人工智能的新药研发不仅有效缩短了药物发现的时间,而且诞生了全新的智能药物。
本书介绍了应用于新药研发领域的先进人工智能技术,涵盖了新药研发的多个阶段,总结了人工智能技术在不同阶段常用的数据集和对应的深度学习技术的发展情况。
本书第1~2章介绍了新药研发的主要过程和用到的主流的人工智能技术的类型。将人工智能技术应用到药物研发是一项多学科交叉的工作,首要挑战是用计算机语言描述和表达具有化学意义的分子结构。第3章介绍了与药物研发相关的化学分子的多种描述符,阐述了这些具有化学意义的分子是如何转换为计算机语言进行存储计算的。在本书的多个章节中,以分子的计算机描述符作为分类标准,介绍了基于多种描述符发展的人工智能技术。第4章描述了在人工智能技术中,关于分子的不同种类的计算机描述符是如何进行无监督预训练学习的。
新药发现中只有符合特定理化性质的化合物分子才能成为候选化合物,而分子结构决定分子性质,本书第5章介绍了分子性质预测模型。根据分子结构进行预测也称为基于配体的预测,最初是使用数学模型预测某些分子性质。近几十年,这一过程转向使用大规模数据源和分子描述符库,利用更现代的机器学习算法自动生成预测模型。
药物发现本身就是一个多目标或多参数的挑战,被批准的药物必须满足在预定剂量下的安全性和有效性的要求,药物设计面临的重大挑战之一是新的分子结构的生成—如何设计分子才能满足所考虑的疾病领域确定的各种重要约束条件。本书第6章介绍了人工智能技术在智能分子生成领域的发展,常用的深度学习模型包括变分自编码器、生成对抗网络和循环神经网络等,模型通过对现有的大量分子数据结构的学习,生成全新的、满足要求的智能分子。
药物在生物体内的目标是与靶标蛋白结合,药物-靶标相互作用在药物发现过程中起着至关重要的作用,主要目标是为特定靶标寻找合适的新配体。本书第7章介绍了人工智能技术在药物-靶标相互作用预测中的应用,包括药物分子与靶标的表征方法以及基于机器学习和深度学习的预测模型。在药物的实际应用过程中,由于服药个体的差异性和疾病类型的复杂性,病人同时或在一定时间内服用两种或两种以上药物,可使药效加强或副作用减轻,也可使药效减弱或出现不应有的毒副作用。本书第8章介绍了基于深度学习的药物-药物相互作用预测,包括基于相似性、图神经网络和知识图谱的方法。知识图谱在其他方面也有较多的应用,药物研发依赖较多的医药和化学知识,为知识图谱在新药研发中的应用提供了基础。本书的第9章详细介绍了基于知识图谱的常用模型和应用。
合成有机化学中重大的挑战之一是新化学分子合成路线的设计和规划,药物化学和药物发现中更是如此。给定一个目标分子,什么样的一系列反应和条件可以被优化,以使材料、产物、成本和时间最合理化,从而在实验室中产生预期目标结果。逆向合成规划从所需的产品开始向前工作,以决定哪些步骤应该构成合成的一部分。本书的第10章介绍了人工智能技术在分子逆合成设计中的应用。这些新方法利用大量数据资源构建人工智能模型,能够快速准确的预测已被证明具有人类专家竞争力的合成路线选择。新药研发是一项系统性的多学科融合的工作,现如今PubMed已收录3000万篇生物医学文献,从庞大的文献资源中挖掘相关数据是非常有价值的事情。本书的第11章介绍了基于深度学习的生物医学命名实体识别方法,这是关系实体特征提取和知识图谱构建的基础。
人工智能技术在新药研发中的广泛应用有效提升了新药研发的速度和效率,我们期望随着技术的不断进步和成熟,产出更多智能药物分子,推动整个行业的进步和发展,使更多疾病得以治愈。
在此,感谢中国石油大学(华东)的李雪、韩佩甫、代欢欢、王干、张旭东、张莹、高畅楠、焦麟钫、任咏琪、王璐璐对本书审校工作的贡献。感谢清华大学出版社邓艳编辑在本书出版审校方面的支持和帮助。
人工智能技术发展迅猛,作者对许多问题并未做深入研究,加上作者知识水平和实践经验有限,书中难免存在不足,敬请读者批评指正。关于本书内容,如果您有更多的宝贵意见,可关注深度奇点和DrugAI微信公众号与我们进行互动交流,期待能够得到您的真挚反馈,在技术道路上互勉共进。
编者
目 录
第1章 绪论1
1.1 新药研发概述1
1.2 新药研究阶段2
1.2.1 靶标的选择与确证2
1.2.2 模型的建立2
1.2.3 先导化合物的发现3
1.2.4 先导化合物的优化3
1.3 新药开发阶段4
1.3.1 临床前研究4
1.3.2 临床研究5
1.3.3 新药申请6
1.3.4 批准上市6
1.4 药物研发中的药物信息学6
第2章 计算和数据驱动的药物发现8
2.1 计算机辅助药物发现8
2.2 使用人工智能进行药物开发的原因9
2.3 用于药物设计的人工智能方法的类型9
2.4 人工智能在药物设计中的应用10
第3章 生物分子的化学表征方法13
3.1 概述13
3.2 基于序列的分子表示14
3.2.1 基于SMILES的分子表示14
3.2.2 基于描述符的分子表示14
3.3 基于图的分子表示15
第4章 基于分子表征的无监督预训练方法16
4.1 概述16
4.2 分子无监督预训练策略17
4.3 基于序列的预训练策略18
4.3.1 基于SMILES的预训练策略18
4.3.2 基于描述符的预训练策略19
4.4 基于图的预训练策略20
4.5 无监督预训练应用22
4.5.1 分子性质预测23
4.5.2 药物-药物相互作用预测24
4.5.3 药物-靶标相互作用预测25
4.6 总结26
第5章 分子性质预测27
5.1 概述27
5.2 分子性质预测模型通用数据集27
5.3 传统机器学习在分子性质预测中的应用29
5.4 基于SMILES的分子性质预测模型32
5.5 基于图的分子性质预测模型34
5.6 基于元学习的分子性质预测模型37
5.7 总结41
第6章 智能分子生成43
6.1 概述43
6.2 生成模型通用数据集44
6.3 基于SMILES的生成模型45
6.3.1 基于VAE的分子生成模型45
6.3.2 基于GAN的分子生成模型46
6.3.3 基于RNN的分子生成模型47
6.4 基于图的生成模型48
6.4.1 基于VAE的分子生成模型48
6.4.2 基于GAN的分子生成模型49
6.4.3 基于RNN的分子生成模型50
6.4.4 基于流的分子生成模型50
6.5 总结52
第7章 基于深度学习的药物-靶标相互作用预测53
7.1 概述53
7.2 数据集53
7.3 虚拟筛选软件55
7.4 药物分子与蛋白质靶标的表征56
7.4.1 药物分子的表征 56
7.4.2 蛋白质的表征58
7.5 基于机器学习的预测模型60
7.6 基于深度学习的预测模型61
7.6.1 基于循环网络的预测模型61
7.6.2 基于卷积的预测模型62
7.6.3 基于生成的预测模型63
7.6.4 基于图的预测模型64
7.7 总结65
第8章 基于深度学习的药物-药物相互作用预测67
8.1 概述67
8.2 常见的药物相互作用数据库67
8.3 基于序列结构的预测模型68
8.3.1 基于相似性的方法68
8.3.2 相似性和神经网络相结合的方法70
8.4 基于图神经网络的预测模型70
8.4.1 基于图神经网络的方法71
8.4.2 基于知识图谱的方法72
8.5 信息提取模型73
8.6 基于复杂网络的方法76
8.7 总结77
第9章 生物医药知识图谱79
9.1 概述79
9.2 构建生物医药知识图谱的常见数据库80
9.3 知识图谱嵌入模型81
9.3.1 基于翻译的模型 84
9.3.2 基于张量分解的模型84
9.3.3 基于神经网络的模型85
9.4 基于知识图谱的生物医学预测任务86
9.4.1 药物不良反应预测86
9.4.2 药物重定位89
9.5 总结92
第10章 基于深度学习的分子逆合成设计94
10.1 概述 94
10.2 逆合成设计的准备97
10.2.1 化学反应数据集97
10.2.2 化学反应的数据表示99
10.2.3 原子映射101
10.2.4 评估标准103
10.3 用于逆合成设计的模型104
10.3.1 单步逆合成设计104
10.3.2 多步逆合成设计108
10.4 用于逆合成设计的进阶工具110
10.4.1 Chematica110
10.4.2 ASKCOS112
10.4.3 RoboRXN112
10.5 总结 113
第11章 生物医学命名实体识别114
11.1 概述 114
11.2 深度学习BioNER结构115
11.2.1 数据集的准备 116
11.2.2 实体特征的提取116
11.2.3 候选实体的分类118
11.3 深度学习方法119
11.3.1 基于单一神经网络的方法 121
11.3.2 基于多任务学习的方法123
11.3.3 基于迁移学习的方法125
11.3.4 基于混合模型的方法128
11.4 不同方法的比较分析130
11.4.1 数据集130
11.4.2 评价标准与性能比较131
11.5 挑战与展望135
参考文献137