猜你喜欢
机器学习算法实践:推荐系统的协同过滤理论及其应用

机器学习算法实践:推荐系统的协同过滤理论及其应用

书籍作者:王建芳 ISBN:9787302507833
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:5307
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

个性化推荐能够根据用户的历史行为显式或者隐式地挖掘用户潜在的兴趣和需求,并为其推送个性化信息,因此受到研究者的追捧及工业界的青睐,其研究具有重大的学术价值及商业应用价值,已广泛应用于大型电子商务平台、社交平台、新闻客户端以及其他各类旅游和娱乐类网站中。
本书内容丰富,较全面地介绍了基于协同过滤的推荐系统存在的问题、解决方法和评估策略,主要内容涉及协同过滤推荐算法中的时序技术、矩阵分解技术和社交网络信任技术等知识。
本书可供从事推荐系统、人工智能、机器学习、模式识别和信息检索等领域的科研人员及研究生阅读、参考。

编辑推荐
推荐系统发展到现在产生了许多具有广泛影响力的算法模型,经典的算法是协同过滤算法,其易于实现,因而具有广泛的实用价值,但它也存在着算法复杂度高和推荐精度低的问题。《机器学习算法实践——推荐系统的协同过滤理论及其应用》提出了一系列改进协同过滤推荐质量的方法,并将相关算法应用到实际生活中,开发出一个原型系统。
前言

前言

个性化推荐与信息检索技术的目标一致,也是一种帮助用户更快速地发现有用信息的工具,但与信息检索技术不同的是,个性化推荐能够根据用户的历史行为显式或者隐式地挖掘用户潜在的兴趣和需求,为其推送感兴趣并且个性化的信息,已越来越受到研究者的追捧及工业界的青睐,其研究具有重大的学术价值及商业应用价值。如今基于个性化推荐算法的推荐系统已广泛应用于大型电子商务平台(如天猫、京东和亚马逊等)、社交平台(如新浪微博、Facebook和Twitter等)、新闻客户端(今日头条、天天快报等)以及其他各类旅游和娱乐类网站(如携程网、电影音乐社区等)中,在提高用户满意度和忠诚度的同时也为自身带来了可观的经济效益。
协同过滤推荐算法是个性化推荐中运用最早和最成功的一种推荐技术,它的任务是利用用户与项目评分矩阵中的已知元素来预测未知元素的评分值并将预测评分高的项目推荐给用户。协同过滤的最大优点是对推荐对象没有特殊的要求,能处理非结构化的复杂对象(如音乐、图书、电影和资讯类新闻内容等,这类产品是难以进行机器自动内容分析的信息),避免了内容分析的不完全和不精确,而且能够根据用户的历史行为推荐个性化的信息。传统的基于邻域模型的推荐算法分为数据收集(输入)、获得最近邻集合(主要是计算相似度)和预测并推荐(输出)等步骤。目前协同过滤推荐算法还存在数据的高维稀疏性、冷启动和大数据环境下扩展性等制约其进一步发展的瓶颈问题,如何解决以上问题进而提高推荐系统的推荐质量成为个性化推荐的关键,近年来基于协同过滤的推荐算法及其相关改进模型得到了学者们的广泛关注和研究。
本书作者一直从事推荐系统理论及其应用的研究工作,提出了一系列改进推荐质量的方法,并成功应用于多种复杂的实际问题。作者的这些工作大大丰富了推荐系统理论,尤其是所关注的协同过滤推荐算法对其在其他领域的进一步研究与应用奠定了技术基础,具有重要的理论意义和实际应用价值。
本书由河南理工大学计算机科学与技术学院王建芳独立完成,是作者在本领域所发表学术论文的基础上进一步加工、深化而成的,是对已有研究成果的全面总结。全书共分5篇14章。第一篇包括第1章,讨论了推荐算法的分类、各类算法的基本思想和改进策略,阐述推荐算法存在的问题、实验方法和评测指标。第二篇包括第2章和第3章,主题是围绕基于时序的协同过滤推荐算法展开研究。在推荐系统中随着时间的推移,用户的关注点在不断变化,如何捕获这一动态的时间效应是个难题。本篇针对基于时序的协同过滤推荐算法展开研究。第三篇包括第4~11章,主题是围绕基于矩阵分解的协同过滤推荐算法展开研究。矩阵分解模型能够基于用户的行为对用户和项目进行自动分析,也就是把用户和项目划分到不同主题,这些主题可以理解为用户的兴趣和项目属性。本篇针对SVD、概率矩阵分解、非负矩阵分解及其与相关算法的整合分别提出相关的理论。第四篇包括第12章和第13章,主题是围绕协同过滤推荐算法与社交网络的信任展开研究,将用户的评分信息和用户的社交网络信息融入传统的矩阵分解中以提高推荐质量。第五篇包括第14章,从实际应用的角度用Spark实现一个基于矩阵分解的推荐原型系统。
在本书的撰写过程中,已毕业的硕士研究生张朋飞、李骁、武文琪以及在读研究生谷振鹏、刘冉东、苗艳玲等对书稿内容和相关实验提供了大量的帮助,在此向他们表示衷心的感谢。本书的出版得到河南省高等学校重点科研项目(项目编号: 15A520074)和河南理工大学博士基金的支持,在此一并表示感谢。
推荐系统所涉及的算法,尤其是协同过滤推荐算法是一个快速发展、多学科交叉的新颖研究方法,其理论及应用均有大量的问题尚待进一步深入研究。由于作者知识水平和资料获取方面的限制,书中不妥之处在所难免,敬请同行专家和读者批评指正。
作者
2018年5月



目录

目录
第一篇基 础 理 论

第1章理论入门

1.1引言

1.2推荐系统的形式化定义

1.3基于近邻的协同过滤推荐算法

1.3.1余弦相似度

1.3.2修正余弦相似度

1.3.3Pearson相似度

1.3.4Jaccard相似度

1.4基于用户兴趣的推荐算法

1.5基于模型的协同过滤推荐算法

1.5.1矩阵分解模型

1.5.2交替最小二乘

1.5.3概率矩阵分解

1.5.4非负矩阵分解

1.6基于信任的协同过滤推荐算法

1.7推荐系统现存问题

1.7.1冷启动

1.7.2数据稀疏性

1.7.3可扩展性

1.7.4用户兴趣漂移

1.8评测指标

本章小结

参考文献
第二篇基于时序的协同过滤推荐算法

第2章基于巴式系数改进相似度的协同过滤推荐算法

2.1引言

2.2相关工作

2.2.1余弦相似度

2.2.2调整余弦相似度

2.2.3Pearson相关系数

2.2.4Jaccard相似度

2.3一种巴氏系数改进相似度的协同过滤推荐算法

2.3.1巴氏系数

2.3.2巴氏系数相似度

2.3.3BCCF算法描述

2.4实验与分析

2.4.1数据集

2.4.2评价标准

2.4.3实验结果与分析

本章小结

参考文献

第3章基于用户兴趣和项目属性的协同过滤推荐算法

3.1引言

3.2相关工作

3.3基于用户兴趣和项目属性的协同过滤推荐算法

3.3.1基于时间的用户兴趣度权重

3.3.2改进相似度计算

3.3.3加权预测评分

3.3.4算法步骤

3.4实验结果与分析

3.4.1数据集

3.4.2评价标准

3.4.3结果分析

本章小结

参考文献
第三篇基于矩阵分解的协同过滤推荐算法

第4章SVD和信任因子相结合的协同过滤推荐算法

4.1引言

4.2标注和相关工作

4.2.1标注

4.2.2奇异值分解

4.2.3计算相似度

4.3SVD和信任因子相结合的协同过滤推荐算法

4.3.1项目特征空间

4.3.2两阶段k近邻选择

4.3.3信任因子

4.3.4预测评分

4.3.5算法

4.4实验结果与分析

4.4.1数据集和实验环境

4.4.2评价标准

4.4.3实验结果分析

本章小结

参考文献

第5章相似度填充的概率矩阵分解的协同过滤推荐算法

5.1引言

5.2相关工作

5.2.1协同过滤推荐算法

5.2.2概率矩阵分解技术

5.3CFPFCF算法

5.3.1算法设计思想

5.3.2CFPFCF算法的描述

5.4实验分析

5.4.1数据集与误差标准

5.4.2实验结果与性能比较

本章小结

参考文献

第6章基于偏置信息的改进概率矩阵分解算法研究

6.1引言

6.2相关工作

6.2.1矩阵分解模型

6.2.2Baseline预测

6.3算法流程

6.4实验分析

6.4.1实验所用数据集

6.4.2实验环境配置

6.4.3实验评价标准

6.4.4实验结果及分析

本章小结

参考文献

第7章基于项目属性改进概率矩阵分解算法

7.1引言

7.2IARBP算法

7.2.1相似度度量

7.2.2算法描述

7.2.3算法复杂度分析

7.3实验结果对比分析

7.3.1实验数据集

7.3.2实验评价标准

7.3.3对比实验配置及说明

7.3.4实验参数分析

7.3.5实验对比

本章小结

参考文献

第8章基于交替最小二乘的改进概率矩阵分解算法

8.1引言

8.2交替最小二乘

8.3Baseline预测

8.4IPMF算法

8.4.1算法改进思想

8.4.2算法流程

8.4.3复杂度分析

8.5实验结果分析

8.5.1对比实验设定

8.5.2实验分析

本章小结

参考文献

第9章基于社交网络的改进概率矩阵分解算法研究

9.1引言

9.2相关工作

9.2.1推荐系统的形式化

9.2.2矩阵分解与推荐系统

9.3概率矩阵分解

9.4主要研究内容

9.4.1基于社交网络的改进概率矩阵分解

9.4.2算法流程

9.4.3算法复杂度分析

9.5实验分析

9.5.1实验数据集

9.5.2实验评价标准

9.5.3对比算法

9.5.4潜在因子维度的影响

9.5.5偏置的影响

9.5.6信任因子的影响

9.5.7对比实验分析

本章小结

参考文献

第10章带偏置的非负矩阵分解推荐算法

10.1引言

10.2相关工作

10.2.1矩阵分解

10.2.2奇异值矩阵

10.2.3Baseline预测

10.2.4NMF算法

10.3RBNMF算法

10.3.1理论分析

10.3.2RBNMF算法流程

10.4实验分析

10.4.1数据集

10.4.2评价标准

10.4.3实验结果及分析

本章小结

参考文献

第11章基于项目热度的协同过滤推荐算法

11.1引言

11.2非负矩阵分解

11.3两阶段近邻选择

11.3.1两阶段k近邻选择

11.3.2项目“热度”和局部信任

11.3.3预测评分

11.4算法描述

11.5实验结果分析

11.5.1不同策略下相似度的分布

11.5.2两种因素的分布与分析

11.5.3实验结果及分析

本章小结

参考文献

第四篇基于信任的协同过滤推荐算法

第12章带偏置的专家信任推荐算法

12.1引言

12.2相关工作

12.2.1专家算法

12.2.2生成推荐值

12.2.3Baseline预测

12.3改进专家算法

12.3.1改进专家信任

12.3.2评分形成

12.3.3算法描述

12.4实验结果与分析

12.4.1数据集

12.4.2评估标准

12.4.3实验结果及分析

本章小结

参考文献

第13章一种改进专家信任的协同过滤推荐算法

13.1引言

13.2标注与相关工作

13.2.1标注

13.2.2近邻模型

13.2.3专家算法

13.3改进专家算法

13.3.1重要概念

13.3.2评分形成

13.3.3算法描述

13.4实验结果与分析

13.4.1数据集

13.4.2评估标准

13.4.3实验结果与分析

本章小结

参考文献

第五篇原型系统开发

第14章电影推荐原型系统

14.1引言

14.2主要功能

14.3关键技术

14.3.1概率矩阵分解模型

14.3.2社交网络正则化

14.4集群搭建

14.4.1集群软硬件环境

14.4.2Spark集群

14.4.3HBase集群

14.5系统特点

14.6用户使用说明

14.6.1系统简介界面

14.6.2建模一和建模二界面

14.6.3集群界面

14.6.4看过的电影界面

14.6.5推荐电影界面

14.6.6统计分析界面

参考文献



短评

物流速度很快,产品质量很好,书的内容也非常不错,物流值得信赖,值得购买,推荐

2018-11-27 19:48:34

好书,专业正版,值得购买!

2018-11-24 11:53:19

产品特色