猜你喜欢
推荐系统技术原理与实践

推荐系统技术原理与实践

书籍作者:文亮 ISBN:9787115609809
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:7702
创建日期:2024-04-07 发布日期:2024-04-07
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

本书系统介绍推荐系统的技术理论和实践。首先介绍推荐系统的基础知识;然后介绍推荐系统常用的机器学习和深度学习模型;接着重点介绍推荐系统的4层级联架构,包括召回、粗排、精排和重排,以及谷歌、阿里巴巴等大型互联网公司在4层级联架构中的模型设计和实现原理;紧接其后介绍多目标排序在推荐系统中的应用,具体介绍阿里巴巴、谷歌等大型互联网公司的实践;最后从不同角度审视推荐系统,介绍公平性问题、知识蒸馏、冷启动等各种前沿实践。本书基于一线研发人员的视角向读者分享推荐系统的实践经验,所有模型结构和前沿实践都在业务场景中落地。
本书适合推荐系统领域的从业者、高校科研人员、高校计算机专业学生,以及对推荐系统感兴趣的产品研发人员和运营人员阅读。

作者简介

文亮,奇虎360公司资深算法专家, 硕士毕业于电子科技大学信息与软件工程学院。主要研究方向有推荐系统、深度学习和信息安全,曾发表5篇相关领域的学术论文,其中3篇被EI收录 。他拥有超过5年的机器学习与推荐系统实践经验,作为奇虎360推荐场景的核心研发人员,主导深度学习在奇虎360信息流推荐场景的落地工作。

编辑推荐
适读人群 :本书适合以下3类读者。 ·推荐、广告、搜索等领域的开发人员。本书能够帮助他们深入学习推荐系统的完整技术结构,并应用于业务工作中。 ·有一定机器学习基础,希望进入推荐系统领域的初学者。本书能够帮助他们了解推荐系统的技术原理以及大型互联网公司的业务实践。 ·高校计算机相关专业学生。本书能够帮助他们学习机器学习和深度学习的基础知识,从零开始了解推荐系统的知识体系。

1.集机器学习和深度学习于一身,由360资深算法专家撰写,让你轻松掌握推荐系统的核心技术。
2.推荐系统技术已经正式步入深度学***。基于一线研发人员的视角,系统介绍推荐系统的技术理论和实践。
3.覆盖推荐系统召回、粗排、精排和重排全链路,本书从多个角度审视推荐系统中的公平性问题、知识蒸馏、冷启动等前沿实践,是推荐系统领域实践者不容错过的指南。
4.以业界实践为基础,介绍推荐系统的核心技术。通过谷歌、阿里巴巴等大型互联网公司在4层级联架构中的模型设计和实现原理,快速了解业内主流解决方案,搭建属于自己的实用知识体系。

目录
第 1章 推荐系统简介 1
1.1 什么是推荐系统 1
1.2 推荐系统的作用和意义 2
1.3 推荐系统的技术架构 3
1.4 推荐系统的召回阶段 5
1.5 推荐系统的粗排阶段 5
1.6 推荐系统的精排阶段 5
1.7 推荐系统的重排阶段 6
1.8 小结 6
第 2章 推荐系统算法基础 7
2.1 LR--应用极广的机器学习模型 7
2.1.1 LR的数学原理 7
2.1.2 LR的训练方法 9
2.1.3 LR的训练优化 12
2.1.4 LR的优势和局限性 13
2.2 MLP--极简单的深度学习模型 13
2.2.1 MLP的模型结构 15
2.2.2 MLP的训练方法 16
2.2.3 MLP的优势和局限性 16
2.3 机器学习常用的优化算法 17
2.3.1 随机梯度下降法 17
2.3.2 小批量随机梯度下降法 18
2.3.3 FTRL在线学习算法 18
2.4 深度学习常用的优化算法 18
2.4.1 深度学习的优化挑战 18
2.4.2 AdaGrad算法 19
2.4.3 RMSProp算法 20
2.4.4 AdaDelta 算法 21
2.4.5 Adam 算法 21
2.5 深度学习常用的激活函数.22
2.5.1 引入激活函数的目的 22
2.5.2 sigmoid 激活函数 23
2.5.3 ReLU 激活函数 25
2.5.4 Leaky ReLU 激活函数25
2.5.5 PReLU 激活函数 26
2.5.6 阿里巴巴的 Dice 激活函数 26
2.5.7 RReLU 激活函数 27
2.6 欠拟合和过拟合 28
2.6.1 欠拟合和过拟合的原因与解决方案 28
2.6.2 处理欠拟合的特定技术 29
2.6.3 处理过拟合的特定技术 30
2.7 深度学习中模型参数的初始化 31
2.7.1 权重和超参数的初始化 31
2.7.2 权重初始化案例-连续点击概率模型 31
2.8 小结 33
第3 章 召回技术演进 35
3.1 召回层的作用和意义 36
3.2 召回模型的演进 37
3.3 传统召回算法 38
3.3.1 基于协同过滤的召回算法 38
3.3.2 基于矩阵分解的召回算法 41
3.3.3 传统召回算法小结 42
3.4 Embedding 模型化召回的基本框架 42
3.4.1 Embedding 的产生 43
3.4.2 Embedding 的发展 44
3.4.3 基于 Embedding 的召回框架 44
3.5 基于内容语义的 i2i 召回 46
3.5.1 物品 Embedding 生成 46
3.5.2 Word2vec-经典的词向量方法 46
3.5.3 FastText-字符级别n-gram 方法 54
3.5.4 BERT-动态词向量方法 55
3.5.5 语言模型扩展为序列模型 58
3.5.6 内容语义召回小结 59
3.6 基于 Graph Embedding 的i2i 召回 60
3.6.1 DeepWalk-随机游走图表征 61
3.6.2 EGES-阿里巴巴的Graph Embedding 方法 61
3.6.3 Node2vec-优化图结构的Graph Embedding 方法 63
3.6.4 GCN-基于谱域的图神经网络 65
3.6.5 GraphSAGE-基于空间域的图神经网络 68
3.6.6 Graph Embedding 小结 70
3.7 基于深度学习的 u2i 召回 70
3.7.1 DSSM-经典的双塔模型 70
3.7.2 YouTube 的深度学习召回算法 71
3.7.3 基于用户长短兴趣的Embedding 召回 73
3.7.4 深度学习 u2i 召回小结 78
3.8 小结 78
第4 章 粗排技术演进 80
4.1 粗排的发展 81
4.2 粗排的前深度学习时代 81
4.3 粗排的深度学习时代 82
4.3.1 向量内积模型 82
4.3.2 向量版 WDL 模型--向量内积模型的改进 83
4.4 粗排的最新进展 84
4.4.1 阿里巴巴的粗排模型 COLD 84
4.4.2 知识蒸馏 85
4.5 粗排的未来展望 90
4.6 小结90
第5 章 精排技术演进 91
5.1 精排模型的演化关系 92
5.2 传统机器学习推荐模型 94
5.2.1 FM 模型-稀疏数据下的特征交叉94
5.2.2 FFM-特征域感知 FM 模型 97
5.2.3 GBDT+LR-Facebook 的特征交叉模型 98
5.2.4 MLR-阿里巴巴的经典 CTR 预估模型 100
5.3 精排的深度学习时代 103
5.3.1 WDL-谷歌的经典 CTR预估模型 103
5.3.2 DCN-深度交叉网络 105
5.3.3 DCN-v2-谷歌的改进版DCN 模型 107
5.3.4 DIN-基于注意力机制的用户动态兴趣表达 109
5.3.5 DIEN-使用序列模型对用户兴趣建模 112
5.3.6 BST-使用 Transformer 对用户行为序列建模 116
5.3.7 DSIN-基于会话的兴趣演化模型 117
5.3.8 MIMN-多通道用户兴趣网络 121
5.3.9 SIM-基于搜索的超长用户行为序列建模 126
5.3.10 CAN-特征交叉新路线 135
5.4 小结 139
第6 章 重排技术演进 141
6.1 重排的作用 142
6.2 基于规则的多样性重排 143
6.3 基于行列式点过程的重排 143
6.4 深度学习在重排中的应用 145
6.5 强化学习在重排中的应用 147
6.6 小结 149
第7 章 多目标排序在推荐系统中的应用.150
7.1 推荐系统的优化目标 151
7.2 多目标排序模型的演化关系 152
7.3 通过样本权重进行多目标优化 154
7.4 多目标排序模型 155
7.4.1 共享底层参数的多塔结构 155
7.4.2 MOE-替换共享底层参数的门控网络 158
7.4.3 MMOE-改进 MOE 的多门混合专家系统 159
7.4.4 PLE-改进 MMOE 解决“跷跷板”现象 160
7.4.5 ESMM-根据目标依赖关系建模 167
7.4.6 ESM2-改进 ESMM 解决数据稀疏性问题 170
7.4.7 DBMTL-用贝叶斯网络对目标依赖关系建模 172
7.5 多目标融合优化 174
7.5.1 基于 UWL 联合概率分布的多目标融合 174
7.5.2 帕累托多目标融合 176
7.6 多目标模型训练方式 177
7.6.1 联合训练 177
7.6.2 交替训练 178
7.7 小结 178
第8 章 推荐系统的前沿实践 180
8.1 推荐系统的应用场景 181
8.2 推荐系统的公平性问题 182
8.2.1 公平性策略-消除位置偏置和资源曝光偏置 182
8.2.2 YouTube 消除位置偏置实践 187
8.2.3 华为消除位置偏置实践--PAL 模型 188
8.2.4 360 消除用户组偏差实践--语料采样 189
8.2.5 360 多场景融合实践--偏置建模消除用户组偏差 191
8.2.6 360 实践--PID 建模消除资源曝光偏置 192
8.3 多场景融合实践 194
8.3.1 360 多场景融合实践--将场景信息作为特征加入模型 195
8.3.2 360 多场景融合实践--多塔结构学习各个场景 195
8.3.3 阿里巴巴多场景融合实践--STAR 模型多场景融合 196
8.4 知识蒸馏在推荐系统中的应用 200
8.4.1 知识蒸馏的背景 200
8.4.2 阿里巴巴广告知识蒸馏实践 201
8.4.3 阿里巴巴淘宝推荐知识蒸馏实践 203
8.4.4 爱奇艺知识蒸馏实践 205
8.5 推荐系统的冷启动问题 206
8.5.1 基于规则的冷启动过程 207
8.5.2 引入辅助信息优化 Embedding冷启动 207
8.5.3 元学习优化 Embedding冷启动 208
8.6 深度学习模型的特征选择 216
8.6.1 基于 L2 的特征选择 216
8.6.2 基于 SE Block 的特征选择 216
8.7 推荐系统的其他问题 218
8.7.1 基于 Look-alike 解决推荐系统长尾问题 218
8.7.2 正负样本不平衡实践--Focal loss 221
8.7.3 深度学习推荐系统的预训练实践 222
8.8 小结 222
短评

上次买的找不到了,再次购买,速度,赞?

2023-07-08 00:50:36

好评,非常好

2023-07-06 21:39:12

这本书写的很好,值得购买。

2023-07-03 11:06:10

此用户未填写评价内容

2023-07-07 13:35:17

此用户未填写评价内容

2023-07-07 09:13:09

此用户未填写评价内容

2023-07-07 19:47:34

帮朋友买的,就是快,书适合想从事推荐算法的同学,按召回,排序分层介绍,覆盖了冷启,多任务学习,内容很全面!

2023-07-07 00:04:20

此用户未填写评价内容

2023-07-06 11:45:52

此用户未填写评价内容

2023-07-06 20:21:50

很快收到了!非常好的一本书!

2023-07-03 10:56:18

推荐系统技术原理与实践(异步图书出品) 引言: 在信息爆炸的时代,人们面临着海量的信息和选择。为了帮助用户更好地发现并获取个性化的信息,推荐系统应运而生。推荐系统是一种通过分析用户行为和个人兴趣,为用户提供个性化推荐的技术。本文将介绍推荐系统的技术原理和实践,帮助读者更好地理解推荐系统的工作原理和应用。 一、推荐系统的基本原理 推荐系统的基本原理是通过对用户行为和兴趣的分析,预测用户可能感兴趣的物品,并将其推荐给用户。推荐系统通常包括以下几个核心组成部分: 1. 用户建模:推荐系统通过分析用户的历史行为数据,如点击记录、购买记录、评分记录等,对用户的兴趣进行建模。用户建模可以采用多种算法,如基于内容的方法、协同过滤方法、深度学习方法等。 2. 物品建模:推荐系统需要对物品进行建模,以便理解物品的特征和属性。物品建模可以使用多种技术,如基于内容的方法、标签关联方法、主题模型方法等。 3. 推荐算法:推荐系统利用用户建模和物品建模的结果,运用不同的推荐算法进行推荐。常见的推荐算法包括基于规则的推荐、基于协同过滤的推荐、基于内容的推荐、基于深度学习的推荐等。 4. 评估和反馈:推荐系统需要对推荐结果进行评估,以度量推荐的准确性和效果。同时,推荐系统还需要根据用户的反馈和行为变化进行动态调整和改进。 二、推荐系统的实践应用 推荐系统在各个领域都有广泛的应用,下面列举几个典型的实践应用场景: 1. 电子商务:推荐系统在电子商务平台中被广泛使用,通过分析用户的购买历史和浏览行为,为用户提供个性化的商品推荐。这不仅可以提高用户的购买转化率,还可以增强用户的购物体验。 2. 社交媒体:社交媒体平台借助推荐系统,根据用户的兴趣和社交关系,推荐适合用户的朋友、话题、文章等内容。这样可以提高用户的参与度和留存率。 3. 视频流媒体:视频流媒体平台利用推荐系统,根据用户的观看历史和偏好,推荐用户可能感兴趣的电影、剧集、综艺等内容。这可以提高用户的观看时长和用户黏性。 4. 新闻媒体:新闻媒体平台利用推荐系统,根据用户的阅读历史和关注领域,推荐用户感兴趣的新闻报道和文章。这可以提高用户的阅读体验和新闻获取效率。 三、推荐系统的挑战与发展趋势 尽管推荐系统在各个领域都取得了一定的成功,但仍然存在一些挑战和亟待解决的问题: 1. 冷启动问题:当用户新加入系统或物品新上线时,推荐系统很难准确预测用户的兴趣。解决冷启动问题是推荐系统发展的一个重要方向。 2. 数据稀疏性问题:用户行为数据通常是非常稀疏的,这给推荐系统的建模和预测带来了挑战。如何利用有限的数据进行准确的推荐是一个关键问题。 3. 多样性与长尾问题:推荐系统往往倾向于给用户推荐热门的物品,导致长尾物品的推荐较少。如何在满足用户兴趣的同时,保持推荐结果的多样性是一个需要解决的问题。 未来,推荐系统的发展趋势包括以下几个方面: 1. 深度学习与推荐系统的结合:深度学习在计算机视觉、自然语言处理等领域取得了重大突破,将其应用于推荐系统,有望提升推荐的准确性和效果。 2. 多模态推荐:随着多媒体数据的快速增长,将多模态数据(如图像、音频、视频等)纳入推荐系统的考虑,可以更好地满足用户的多样化需求。 3. 联邦学习与隐私保护:推荐系统需要处理大量用户的个人数据,如何保护用户隐私成为一个重要的问题。联邦学习等技术可以在保护用户隐私的同时,进行有效的推荐。 结论: 推荐系统是一项重要的技术,它可以帮助用户更好地发现和获取个性化的信息。本文介绍了推荐系统的技术原理和实践,

2023-07-10 10:10:58

产品特色