猜你喜欢

平江路志《平江路志》编纂委员会
讲谈社·日本的历史套装寺泽薫
机械传动装置基础件失效分析朱孝禄
幼小衔接暑假作业（全3册）幼儿园中班大班一日一练学前班学前拼音语言数学练习册幼升小一年级入学准备王艳玲
当代电影艺术导论（清华通识文库）尹鸿
浮浪临安七姐
人人都该懂点婚姻法律师张大姐
快速伸缩复合训练解剖学（全彩图解版）德里克·汉森
成人学音乐简谱钢琴实战教程成都飞笛成人音乐教学研究室
情绪的力量 [美] 利兹·福斯利恩（Liz Fosslien）[美]莫莉·韦斯特·达菲（Mollie West
音乐录音手册管弦乐团及其他古典乐队录音指南理查德·金
睡个好觉 [The Mystery of Sleep] [加] 迈尔·克利格
米饭料理 [韩] 郑勋
穿书后我天天看男二演戏小雨不知
空中英语教室中级——融合版（2021年4月号）刘彬
中国经济 [美] 巴里·诺顿
云原生落地：企业级DevOps实践应阔浩
全二册平易近人+平易近人军事卷陈锡喜
实用中国地图册天域北斗数码科技有限公司
程序员的数学思维修炼+妙趣横生的算法（套装共2册）周颖
手诊点对点法章政
车辆网络安全ISO/SAE 21434标准的基本指南菲利普·维罗尼西
跨境电商大监管：底层逻辑、合规运营与案例评析冯晓鹏
数据可视化分析(第二版) 喜乐君
党的二十大报告辅导读本+党的二十大报告学习辅导百问 +中国共产党章程（口袋本）套装3册本书编写组
期货短线——量价分析与多空技巧白云龙
Java [西班牙] 哈维尔·费尔南德兹·冈萨雷斯
被黑莲花杀死之后扶栖
信念共同体 [印] 考希克·巴苏
唑类高能材料化学陆明
范式变更：碳中和的长潮与大浪朱民
软价值经济学：数字经济时代的底层逻辑滕泰
Python机器学习：基于PyTorch和Scikit-Learn 塞巴斯蒂安·拉施卡
动力系统与线性代数（影印版） Fritz Colonius Wolfgang Kliemann
在岁月中远行俞敏洪
生活总有可取之处辰暖
Spring Boot编程思想（核心篇）（限量版亲笔签名书签随机发售）小马哥
陶瓷手记5 谢明良
孩子脾胃肺好，大病小病不来找李军红
玩着也能学Python 编程猫教材与出版中心
0-12月宝宝视觉开发必备全书：宝宝视觉激发卡 0岁卡+黑白卡+彩色卡+红黑白洞洞卡（套装共4册）瑞雅婴童创智研发中心
艺术与现实的审美关系车尔尼雪夫斯基
天生变态狂+天才在左疯子在右（套装2册）詹姆斯·法隆
小学语文同步练字帖二年级上册 2021秋2年级小学生同步教材生字写字课钢笔硬笔书法训练开心教育开心教育研究中心
小散户如何正确炒股谢宏章
瑞丽家居设计（2021年第02期）周小捷
以公理争强权金光耀
管人的艺术：团队沟通的方法和技巧原书第6版珍藏版斯蒂芬·P.罗宾斯
旅行者(诗人严建文最新作品集) 严建文
水下声信道及其复用技术生雪莉

大语言模型：基础与前沿

书籍作者：熊涛	ISBN：9787115634887
书籍语言：简体中文	连载状态：全集
电子书格式：pdf,txt,epub,mobi,azw3	下载次数：9243
创建日期：2024-06-25	发布日期：2024-06-25
运行环境：PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板

内容简介

本书深入阐述了大语言模型的基本概念和算法、研究前沿以及应用，涵盖大语言模型的广泛主题，从基础到前沿，从方法到应用，涉及从方法论到应用场景方方面面的内容。首先，本书介绍了人工智能领域的进展和趋势；其次，探讨了语言模型的基本概念和架构、Transformer、预训练目标和解码策略、上下文学习和轻量级微调、稀疏专家模型、检索增强型语言模型、对齐语言模型与人类偏好、减少偏见和有害性以及视觉语言模型等内容；最后，讨论了语言模型对环境的影响。

本书内容全面、系统性强，适合高年级本科生和研究生、博士后研究人员、讲师以及行业从业者阅读与参考。

作者简介

熊涛，美国明尼苏达大学双城分校电子与计算机工程博士。曾在多家中美知名高科技公司担任高级管理职位和首席科学家，在人工智能的多个领域，包括大语言模型、图神经网络等从事研发和管理工作多年。

编辑推荐

适读人群：高年级本科生和研究生、博士后研究人员、讲师以及行业从业者

内容丰富。本书全面且深入介绍了大语言模型及其前沿进展，适合所有需要了解这个领域或掌握这种方法与工具的科学家、工程师和学生参考。

内容紧贴前沿领域。大语言模型作为当前爆火的chatGPT背后的技术，受到广泛关注，预计未来将推动人工智能技术进一步发展。

深入浅出，理论与实践相结合。本书摒弃了纯理论的说教模式，从案例入手，采用庖丁解牛的方式帮助读者理解与认识大语言模型。

作者权威，大厂海外技术骨干。本书作者熊涛曾担任多家中美高科技公司的首席科学家，长期深耕人工智能领域，发表相关论文百余篇。

行业专家背书，包括清华大学教授陈文光、复旦大学浩清特聘教授漆远、阿里巴巴集团阿里云副总裁叶杰平、蚂蚁集团副总裁赵闻飙。

目录

第 1章大语言模型：辩论、争议与未来发展方向 1

1.1 新时代的曙光 1

1.2 LLM有意识吗 3

1.2.1 理解LLM的层次结构 3

1.2.2 意识是否需要碳基生物学 4

1.2.3 具身化与落地 4

1.2.4 世界模型 7

1.2.5 沟通意图 8

1.2.6 系统性和全面泛化 9

1.3 未来发展方向 10

1.4 小结 13

第 2章语言模型和分词 15

2.1 语言建模的挑战 16

2.2 统计语言建模 16

2.3 神经语言模型 18

2.4 评估语言模型 19

2.5 分词 19

2.5.1 按空格分割 20

2.5.2 字符分词 21

2.5.3 子词分词 21

2.5.4 无分词器 24

2.5.5 可学习的分词 25

2.6 小结 27

第3章 Transformer 29

3.1 Transformer编码器模块 29

3.2 编码器-解码器架构 31

3.3 位置嵌入 32

3.3.1 绝对位置编码 32

3.3.2 相对位置编码 34

3.4 更长的上下文 38

3.5 外部记忆 42

3.6 更快、更小的Transformer 45

3.6.1 高效注意力 45

3.6.2 条件计算 47

3.6.3 搜索高效Transformer 48

3.6.4 在单个GPU上一天内训练一个语言模型 49

3.7 推理优化 49

3.7.1 推测解码 49

3.7.2 简化Transformer 51

3.7.3 修剪 52

3.7.4 蒸馏 53

3.7.5 混合精度 54

3.7.6 高效扩展Transformer推理 54

3.8 小结 56

第4章预训练目标和解码策略 57

4.1 模型架构 57

4.2 预训练目标 60

4.3 具有代表性的语言模型 62

4.4 解码策略 67

4.5 小结 72

第5章上下文学习和轻量级微调 73

5.1 上下文学习 74

5.1.1 示范样本选择 75

5.1.2 样本排序 82

5.1.3 指令生成 82

5.1.4 思维链 84

5.1.5 递归提示 87

5.1.6 为什么ICL有效 90

5.1.7 评估 93

5.2 提示语言模型的校准 94

5.3 轻量级微调 97

5.3.1 基于添加的方法 98

5.3.2 基于规范的方法 100

5.3.3 基于重新参数化的方法 101

5.3.4 混合方法 103

5.4 小结 104

第6章训练更大的模型 107

6.1 扩大尺度法则 107

6.1.1 预训练Transformer扩大尺度的启示 107

6.1.2 预训练和微调Transformer带来的新启示 110

6.1.3 k比特推理扩大尺度法则 111

6.1.4 挑战与机遇 112

6.2 涌现能力 113

6.3 人工智能加速器 115

6.4 并行 117

6.4.1 数据并行 119

6.4.2 流水线并行 126

6.4.3 张量/模型并行 131

6.4.4 专家混合 133

6.5 混合训练和低精度训练 133

6.5.1 单位缩放 133

6.5.2 FP8与INT8 135

6.6 其他节省内存的设计 136

6.7 小结 137

第7章稀疏专家模型 139

7.1 为什么采用稀疏专家模型 139

7.2 路由算法 142

7.2.1 每个词元选择top-k个专家 142

7.2.2 每个专家选择top-k个词元 144

7.2.3 全局最优分配 145

7.2.4 随机路由 148

7.2.5 双层路由 149

7.2.6 针对不同预训练领域的不同专家 149

7.3 其他改进措施 152

7.3.1 加快训练速度 152

7.3.2 高效的MoE架构 153

7.3.3 生产规模部署 154

7.3.4 通过稀疏MoE扩展视觉语言模型 154

7.3.5 MoE与集成 155

7.4 小结 156

第8章检索增强型语言模型 157

8.1 预训练检索增强型语言模型 158

8.2 词元级检索 161

8.3 通过高效和精简检索进行问答和多跳推理 163

8.4 检索增强型Transformer 166

8.5 检索增强型黑盒语言模型 168

8.6 视觉增强语言建模 169

8.7 小结 170

第9章对齐语言模型与人类偏好 171

9.1 基于人类反馈进行微调 172

9.1.1 基于人类反馈的强化学习 172

9.1.2 KL散度：前向与反向 174

9.1.3 REINFORCE、TRPO和PPO 174

9.1.4 带有KL惩罚的强化学习：贝叶斯推理观点 178

9.1.5 通过分布控制生成进行语言模型对齐 180

9.1.6 通过f散度最小化统一RLHF和GDC方法 182

9.2 基于语言反馈进行微调 183

9.3 基于监督学习进行微调 184

9.4 基于人工智能反馈的强化学习 185

9.5 基于自我反馈进行迭代优化 188

9.6 基于人类偏好进行预训练 190

9.7 小结 193

第 10章减少偏见和有害性 195

10.1 偏见 196

10.2 有害性 199

10.3 偏见和有害性的检测与减少 200

10.3.1 基于解码的策略 201

10.3.2 基于提示的脱毒 202

10.3.3 基于数据的策略 204

10.3.4 基于投影和正则化的方法 205

10.3.5 基于风格转换的方法 205

10.3.6 基于强化学习的微调和基于人类偏好的预训练 206

10.4 小结 206

第 11章视觉语言模型 207

11.1 语言处理的多模态落地 207

11.2 不需要额外训练即可利用预训练模型 208

11.2.1 视觉引导解码策略 208

11.2.2 作为大语言模型提示的视觉输入 209

11.2.3 基于相似性搜索的多模态对齐 212

11.3 轻量级适配 213

11.3.1 锁定图像调优 213

11.3.2 作为（冻结）语言模型前缀的学习视觉嵌入 214

11.3.3 视觉-文本交叉注意力融合 216

11.4 图文联合训练 219

11.5 检索增强视觉语言模型 222

11.6 视觉指令调整 225

11.7 小结 227

第 12章环境影响 229

12.1 能源消耗和温室气体排放 229

12.2 估算训练模型的排放量 230

12.3 小结 231

参考文献 232

产品特色