精通推荐算法：核心模块+经典模型+代码详解

书籍作者：谢杨易	ISBN：9787121474514
书籍语言：简体中文	连载状态：全集
电子书格式：pdf,txt,epub,mobi,azw3	下载次数：8673
创建日期：2024-06-25	发布日期：2024-06-25
运行环境：PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板

内容简介

本书系统介绍了推荐算法的知识框架和技术细节，包括召回、粗排、精排和重排等模块。第1章从用户体验、内容生产和平台发展角度介绍为什么需要推荐系统，并阐述推荐系统的分类及整体技术架构。第2章介绍推荐算法模型的基础——数据样本和特征工程。第3章介绍传统推荐算法。第4~7章介绍推荐系统中最复杂的部分——精排模块，包括特征交叉、用户行为序列建模、Embedding表征学习和多任务学习。第8章介绍召回模块，并详细讲解非个性化召回和个性化召回算法。第9章介绍粗排模块，重点讲解特征蒸馏和轻量级特征交叉等方法。第10章介绍重排模块，包括打散和多样性、上下文感知和端上重排等技术细节。

本书适用于推荐算法初学者、有一定工作经验的推荐算法工程师，以及搜索、广告和营销等领域的从业者，也可作为高等院校计算机等相关专业师生的参考资料。

作者简介

谢杨易，本科毕业于华中科技大学，硕士毕业于中国科学院大学。主要研究方向为推荐算法、个性化搜索和自然语言处理，历任阿里巴巴算法专家、腾讯应用算法研究员等职位，在搜索和推荐算法领域积累了丰富的经验。CSDN博客专家，原创文章100余篇。发表专利15个，已授权6个。

编辑推荐

体系化、全链路，覆盖推荐算法核心模块。

有前沿、有经典，详解常用的模型和技术。

搜广推、适用广，轻松搞定入门面试进阶。

前言

当前互联网高速发展，用户规模和内容规模均迅猛提升。身处信息严重过载的时代，如何让用户从海量信息中发现自己感兴趣的内容，成了很多公司的核心问题。在此背景下，搜索系统和推荐系统应运而生。前者主要解决用户主动寻找内容的问题，后者则将合适的内容分发给合适的用户，偏被动型消费。它们是连接用户和内容的桥梁，重要性不言而喻。

自从2012年AlexNet在ImageNet大规模视觉识别比赛中一举夺魁后，深度学习就深入各大业务领域，推荐系统也不例外。基于深度学习的推荐系统，大幅提升了内容分发的准确性和用户体验，已被应用在各大推荐场景中。推荐算法工程师也由此步入了新的时代。

当前深度学习技术仍然在快速更新中，推荐算法也在飞速发展，因此，从业者必须持续学习新知识。同时，推荐系统链路很长，包括召回、粗排、精排和重排等诸多模块，如何掌握整体架构，并深入每个模块理解其细节，就成为一件困难且重要的事。

本书主要介绍推荐算法技术，覆盖召回、粗排、精排和重排等模块，目的是让读者熟悉推荐算法的全部链路，加深体系化理解，并掌握关键技术细节。另外，本书介绍的很多技术也可应用在搜索和广告等领域。

本书既适合搜索、推荐和广告算法领域的初学者，也适合有一定经验的工程师进阶学习。它能帮助你掌握推荐算法的整体架构、每个核心模块的知识框架，以及一些工作必备的经典模型，同时，能帮助你深入理解它们的出发点和具体实现方案，在实际工作中融会贯通。

身处信息爆炸时代的推荐算法工程师是幸运的，但仍然需要不断学习新知识，接受更多挑战。希望本书分享的知识和经验能够助广大读者一臂之力！

本书特色

本书主要介绍推荐算法技术，特点如下。

（1）内容全面，结构合理。书中囊括推荐算法的所有核心模块，涵盖召回、粗排、精排和重排等内容，帮助读者掌握完整链路，加深对推荐算法的整体理解。先介绍算法模块的知识框架，使读者对其有整体认知，再展开讲解每个细节技术点，帮助读者加深对该模块的理解。

（2）由浅入深，深入本质。针对每个算法模块的讲解，都按照从基础实现到复杂优化的思路，从简到难，由浅入深。通过讲解这些优化手段的出发点和具体实现，以及不同优化手段的关键点，让读者抓住算法本质。

（3）模型经典，代表性强。针对每个模块都选取一些有代表性的经典模型进行重点讲解，这些经典模型都是推荐算法工程师必须掌握的。

（4）贴近工作，实战性强。本书不会利用大量篇幅讲解理论，也不会只介绍一些入门知识。书中介绍的模型和技术细节大多已被应用在实际工作场景中，实战性很强。

（5）代码详细，操作性强。本书为关键的算法模型和模块配备了具体实现代码，并附有详细的注释和运行流程讲解，帮助读者深入理解其运行机理和实现方法。

本书内容

本书包括10章，各章的具体内容如下。

第1章介绍为什么需要推荐系统、推荐系统的分类及其主要技术架构。

第2章介绍如何构建数据样本和特征工程，从而训练模型。这是推荐算法的基础。

第3章介绍深度学习之前的主流推荐算法，包括协同过滤、矩阵分解、逻辑回归和因子分解机等算法。

第4~7章讲解精排模型算法。

第4章讲解特征交叉，并介绍Wide&Deep和DeepFM等经典模型。

第5章讲解用户行为序列建模，包括短序列建模和长序列建模方法，重点讲解DIN、DIEN和SIM等模型。

第6章讲解Embedding表征学习，并介绍Node2vec和GraphSAGE等模型。

第7章讲解多任务学习，包括多任务建模和多任务融合，重点讲解ESSM、MMOE和PLE等模型。

第8章介绍召回算法，包括非个性化召回和个性化召回，重点讲解YouTubeDNN、ESAM和TDM等模型。

第9章介绍粗排算法，包括特征蒸馏和轻量级特征交叉等方法，重点讲解PFD、COLD和FSCD等模型。

第10章介绍重排算法，包括打散和多样性、上下文感知和端上重排等，重点讲解PRM和EdgeRec等模型。

此外，本书会根据推荐算法的发展情况，在后续版本中增加一些新内容，欢迎读者持续关注。

精通推荐算法：核心模块+经典模型+代码详解

内容简介

作者简介

编辑推荐

前言

目录

产品特色