斯坦福数据挖掘教程（第3版）

书籍作者：尤雷·莱斯科夫	ISBN：9787115556691
书籍语言：简体中文	连载状态：全集
电子书格式：pdf,txt,epub,mobi,azw3	下载次数：5067
创建日期：2021-10-07	发布日期：2021-10-07
运行环境：PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板

内容简介

本书由斯坦福大学“Web挖掘”课程的内容总结而成，主要关注极大规模数据的挖掘。书中包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统、社会网络图挖掘和大规模机器学习等主要内容。第3 版新增了决策树、神经网络和深度学习等内容。几乎每节都有对应的习题，以此来巩固所讲解的内容。读者还可以从网上获取相关拓展资料。

作者简介

【作者简介】

尤雷.莱斯科夫（Jure Leskovec）

Pinterest公司首席科学家，斯坦福大学计算机科学系副教授，研究方向为大型社交和信息网络的数据挖掘。他的研究成果获得了很多奖项，如Microsoft Research Faculty Fellowship、Alfred P. Sloan Fellowship和Okawa Foundation Fellowship，还获得了很多最佳论文奖，同时也被《纽约时报》《华尔街日报》《华盛顿邮报》《连线》、NBC、BBC和CBC等流行的社会媒体刊载。他还创建了斯坦福网络分析平台（SNAP）。

阿南德.拉贾拉曼（Anand Rajaraman）

数据库和Web技术领域领军者，硅谷连续创业者和风险投资人，斯坦福大学计算机科学系助理教授。自1996年起创立过多家公司，这些公司先后被亚马逊、谷歌和沃尔玛集团收购，而他本人历任亚马逊技术总监、沃尔玛负责全球电子商务业务的副总裁。之后创立了风投公司Milliways Ventures和Rocketship VC，投资过Facebook、Lyft等众多公司。作为学者，他主要研究数据库系统、Web和社交媒体，他的研究论文在学术会议上获得了多个奖项，他在2012年被Fast Company杂志列入“商界Z具创造力100人”。

杰弗里.大卫.厄尔曼（Jeffrey David Ullman）

计算机科学家，美国国家工程院院士，2020年图灵奖得主。早年在贝尔实验室工作，之后任教于普林斯顿大学，十年后加入斯坦福大学直至退休，一生的科研、著书和育人成果卓著。他是ACM会员，曾获SIGMOD创新奖、高德纳奖、冯诺依曼奖等多项科研大奖；合著有“龙书”《编译原理》、数据库名著《数据库系统实现》等多部经典著作；培养的多名学生已成为数据库领域的专家，其中包括谷歌联合创始人Sergey Brin，本书第二作者也是他的得意弟子。目前担任Gradiance公司CEO。

【译者简介】

王斌博士

小米AI实验室主任，NLP首席科学家。中国中文信息学会理事，《中文信息学报》编委。加入小米公司之前，是中科院研究员、博导及中科院大学教授。译有《信息检索导论》《大数据：互联网大规模数据挖掘与分布式处理》和《机器学习实战》等书。

王达侃

优刻得AI部门负责人，曾任WeWork Research & Applied Science中国区负责人，并曾在LinkedIn、Twitter和微软亚洲研究院负责AI以及大数据方向的研发工作。硕士毕业于美国斯坦福大学计算机系，本科毕业于上海交通大学ACM班。

编辑推荐

适读人群：本书适合作为本科生、研究生数据挖掘课程的教材，也适合对数据挖掘感兴趣的技术人员阅读。

1.本书作者Jeffrey Ullman是2020图灵奖获得者；

2.本书译者是国内知名NLP专家王斌老师；

3.本书内容源自斯坦福大学网红课程“CS246：海量数据挖掘”、“CS224W：图机器学习”和“CS341：项目实战课”；

4.书中以海量数据挖掘和机器学习为重点，全面分析并实现了各种常用的数据挖掘算法，同时介绍了目前Web应用的许多重要话题；

5.在第2版《大数据互联网大规模数据挖掘与分布式处理（第2版）》基础上，第3版内容新增一章，专门探讨神经网络和深度学习并扩充了社会网络分析和决策树的相关内容。

本书源自斯坦福大学“CS246：海量数据挖掘”“CS224W：图机器学习”和“CS341：项目实战课”三门课程的内容。书中以海量数据挖掘和机器学习为重点，全面分析并实现了各种常用的数据挖掘算法，同时介绍了目前Web应用的许多重要话题。

这一版不仅新增一章，专门探讨神经网络和深度学习这一主题，还在上一版基础上扩充了社会网络分析和决策树的相关内容，同时更新了其他一些内容。

- 分布式文件系统以及MapReduce；

- 相似性搜索；

- 数据流处理以及特殊情况专用处理算法；

- 搜索引擎技术，如谷歌的PageRank；

- 频繁项集挖掘；

- 大规模高维数据集的聚类算法；

- 广告管理系统和推荐系统；

- 社会网络图挖掘；

- 降维处理，如SVD和CUR分解；

- 大规模机器学习；

- 深度神经网络。

【亚马逊读者好评】

“作为斯坦福大学‘大规模数据挖掘’在线课程的教材，这本书介绍了各种数据挖掘算法以及一些大数据应用。”

“这本书中包含许多热门的算法，特别是与挖掘图数据相关的算法，并且算法的理论和实现并重。书中的大量例子相当直观，易于理解。各章最后还提炼了章节要点，以帮助读者巩固和消化知识要点，让人很惊喜！”

“这本书涵盖了很多话题，从MapReduce和局部敏感哈希，到图的算法和大规模机器学习，内容全面、实用。”

短评

刚出版的书，就半价销售，快递也很快，不错。

2021-04-23 10:04:21

斯坦福数据挖掘教程（第3版）

内容简介

作者简介

编辑推荐

目录

短评

标签

产品特色