目录
目录
序
1 概述 1
1.1 写作动机 1
1.2 化学信息学起源与发展 2
1.3 化学信息学基础与各种应用 2
1.3.1 数据库 3
1.3.2 化学家的基本问题 3
1.3.3 药物发现 5
1.3.4 化学信息学在其他领域的应用 5
参考文献 6
2 QSAR/QSPR 7
2.1 引言 7
2.2 数据处理与校正 10
2.2.1 结构数据 10
2.2.2 生物数据 11
2.3 分子描述符 11
2.3.1 结构键(1D) 12
2.3.2 拓扑描述符(2D) 12
2.3.3 几何描述符(3D) 12
2.4 数据分析方法 13
2.4.1 概述 13
2.4.2 无监督学习 14
2.4.3 监督学习 14
2.5 分类方法 15
2.5.1 主成分分析 15
2.5.2 线性判别分析 15
2.5.3 Kohonen神经网络 15
2.5.4 其他分类方法 16
2.6 数据建模方法 16
2.6.1 基于回归分析的QSAR方法 16
2.6.2 三维QSAR 18
2.6.3 非线性模型 20
2.7 数据分析方法总结 25
2.8 模型验证 25
2.8.1 验证程序的正确使用 25
2.8.2 建模与验证的流程 27
2.8.3 数据集拆分 27
2.8.4 建模、训练、验证、测试和外部数据集 28
2.8.5 交叉验证 30
2.8.6 自举验证 31
2.8.7 Y随机化验证 32
2.8.8 拟合优度和质量标准 33
2.8.9 适用范围和模型可接受性标准 35
2.8.10 外部和内部验证的范围 36
2.8.11 分类模型的验证 38
2.9 QSAR方法在监管中的应用 39
参考文献 40
3 化合物理化性质的预测 43
3.1 引言 43
3.2 理化性质的建模方法概述 43
3.2.1 基于其他分子特性的性质预测 44
3.2.2 基于理论的化合物性质预测 44
3.2.3 化合物性质预测的加和模型 45
3.2.4 结构-性质关系的统计学方法 47
3.3 各种性质的预测方法 48
3.3.1 平均分子极化率 48
3.3.2 热力学性质 49
3.3.3 辛醇/水分配系数(log P)的预测 51
3.3.4 辛醇/水分布系数(log D)的预测 55
3.3.5 水溶解度(log S)的预测 56
3.3.6 熔点的预测 59
3.3.7 酸电离常数的预测 60
3.4 统计方法的局限性 63
3.5 展望 63
参考文献 64
4 化学反应 67
4.1 引言 67
参考文献 68
4.2 反应预测与合成设计 69
4.2.1 概述 69
4.2.2 反应预测 71
4.2.3 合成设计 76
4.2.4 小结 83
参考文献 83
4.3 生化途径的探索 86
4.3.1 概述 86
4.3.2 生化途径的数据库 89
4.3.3 生化途径的检索系统 90
4.3.4 分析检索结果 91
4.3.5 BioPath数据库的应用 96
4.3.6 小结 106
参考文献 107
5 结构-波谱相关性和计算机辅助结构解析 109
5.1 引言 109
5.2 分子描述符 110
5.2.1 基于片段的描述符 110
5.2.2 拓扑结构代码 111
5.2.3 三维分子描述符 112
5.3 红外光谱 112
5.3.1 概述 112
5.3.2 红外光谱模拟 113
5.4 核磁共振波谱 116
5.4.1 核磁共振性质的量子化学预测 116
5.4.2 数据库检索法预测核磁共振波谱 117
5.4.3 基于增量方法预测核磁共振波谱 117
5.4.4 机器学习方法预测核磁共振波谱 118
5.5 质谱 122
5.5.1 结构鉴定和质谱解析 123
5.5.2 质谱预测 123
5.5.3 代谢组学和天然产物 124
5.6 计算机辅助结构解析 125
参考文献 127
6 药物发现 132
6.1 药物发现:概论 132
6.1.1 引言 132
6.1.2 药物设计中的术语定义 133
6.1.3 药物发现过程 134
6.1.4 生物信息学和化学信息学在药物设计中的应用 134
6.1.5 基于结构和基于配体的药物设计 135
6.1.6 靶标发现与验证 136
6.1.7 先导化合物的发现 137
6.1.8 先导化合物的优化 148
6.1.9 临床前试验和临床试验 154
6.1.10 展望 154
参考文献 155
6.2 药物、靶标和疾病信息之间的关联 158
6.2.1 引言 158
6.2.2 数据资源 159
6.2.3 计算生物学在药物发现中的应用案例 160
6.2.4 讨论与展望 163
参考文献 164
6.3 天然产物研究中的化学信息学 167
6.3.1 引言 167
6.3.2 潜力和挑战 167
6.3.3 软件和数据访问 170
6.3.4 计算驱动的生药学联用策略 175
6.3.5 机遇 176
6.3.6 其他应用程序 183
6.3.7 局限 183
6.3.8 展望 184
参考文献 185
6.4 中药化学信息学 190
6.4.1 引言 190
6.4.2 2型糖尿病:西药方法 190
6.4.3 2型糖尿病:中药方法 190
6.4.4 中西互鉴 190
6.4.5 筛选方法 193
参考文献 196
6.5 PubChem项目 197
6.5.1 引言 197
6.5.2 PubChem的目标 197
6.5.3 PubChem数据库的体系结构 197
6.5.4 PubChem的数据资源 199
6.5.5 PubChem的数据提交和分子结构表示 199
6.5.6 PubChem的数据扩充 200
6.5.7 PubChem的数据库存储准备 200
6.5.8 PubChem的查询数据准备和结构检索 201
6.5.9 化学结构查询项的输入 203
6.5.10 查询处理 204
6.5.11 PubChem入门 204
6.5.12 Web服务 205
6.5.13 小结 205
参考文献 206
6.6 药效团及其应用 208
6.6.1 引言 208
6.6.2 药效团概念的发展历史 208
6.6.3 药效团的表示 210
6.6.4 药效团的建模 215
6.6.5 药效团在药物设计中的应用 218
6.6.6 计算机辅助药效团建模和药物筛选的软件 224
6.6.7 小结 224
参考文献 224
6.7 活性位点的预测、分析与比较 227
6.7.1 引言 227
6.7.2 活性位点预测算法 228
6.7.3 靶标优选:可药性预测 234
6.7.4 基于序列同源性的活性位点搜索 237
6.7.5 靶标比较:虚拟活性位点筛选 238
6.7.6 展望 243
参考文献 244
6.8 基于结构的虚拟筛选 249
6.8.1 引言 249
6.8.2 分子对接算法 250
6.8.3 打分函数 252
6.8.4 基于结构的虚拟筛选流程 255
6.8.5 基于蛋白质结构的药效团遴选 257
6.8.6 验证 257
6.8.7 总结与展望 260
参考文献 261
6.9 ADME性质预测 265
6.9.1 引言 265
6.9.2 常规SPR/QSPR模型 265
6.9.3 水溶解度(log S)的预测 267
6.9.4 血脑屏障通透性(log BB)预测 272
6.9.5 人体肠道吸收的预测 275
6.9.6 其他ADME性质 278
6.9.7 小结 281
参考文献 281
6.10 外源性代谢物预测 284
6.10.1 引言:生命科学中外源生物转化的重要性 284
6.10.2 生物转化的类型 286
6.10.3 方法概述 288
6.10.4 用户需求:代谢数据的不同用途 293
6.10.5 案例研究 295
参考文献 303
6.11 美国国家癌症研究所CADD组的化学信息学研究 304
6.11.1 引言和历史 304
6.11.2 化学信息服务 304
6.11.3 工具和软件 307
6.11.4 药物合成和活性预测 309
6.11.5 可下载的数据集 310
参考文献 310
6.12 罕见数据的QSAR建模 312
6.12.1 引言 312
6.12.2 观测性的元数据和QSAR建模 313
6.12.3 药物警戒和QSAR 314
6.12.4 结论 316
参考文献 317
6.13 计算机辅助药物设计展望 319
6.13.1 创新药物的源头 319
6.13.2 药物设计、合成和评价技术的整合 320
6.13.3 走向精准医学 322
6.13.4 向自然学习:从复杂的模板到简单的设计 323
6.13.5 结论 325
参考文献 325
7 农业研究中的计算方法 327
7.1 引言 327
7.2 研究策略 327
7.2.1 基于配体的方法 328
7.2.2 基于结构的方法 332
7.3 不良反应预测 338
7.3.1 计算毒理学 338
7.3.2 程序和数据库 339
7.3.3 计算毒理学模型 341
7.4 结论 344
参考文献 344
8 监管科学与化学信息学 347
8.1 引言 347
8.1.1 科技进步 347
8.1.2 21世纪的监管科学 347
8.2 风险评估中数据缺口填补方法 349
8.2.1 QSAR和分子结构知识 350
8.2.2 毒理问题的阈值 350
8.2.3 交叉参照 353
8.3 数据库和知识库 355
8.3.1 结构可检索的毒物数据库架构 355
8.3.2 化学中心毒物数据库的数据模型 357
8.3.3 化学品清单 359
8.4 新型描述符 360
8.4.1 ToxPrint化学型 360
8.4.2 肝生化途径的化学型 364
8.4.3 线形分子指纹片段标注的动态生成 366
8.4.4 其他类型的描述符 368
8.5 化学多样性空间分析 368
8.5.1 主成分分析 368
8.6 结论 370
参考文献 371
9 化学计量学在分析化学中的应用 374
9.1 引言 37