猜你喜欢
深入浅出Embedding

深入浅出Embedding

书籍作者:吴茂贵 ISBN:9787111680642
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:3024
创建日期:2021-10-07 发布日期:2021-10-07
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

这是一本系统、全面、理论与实践相结合的Embedding技术指南,由资深的AI技术专家和高级数据科学家撰写,得到了黄铁军、韦青、张峥、周明等中国人工智能领域的领军人物的一致好评和推荐。

在内容方面,本书理论与实操兼顾,一方面系统讲解了Embedding的基础、技术、原理、方法和性能优化,一方面详细列举和分析了Embedding在机器学习性能提升、中英文翻译、推荐系统等6个重要场景的应用实践;在写作方式上,秉承复杂问题简单化的原则,尽量避免复杂的数学公式,尽量采用可视化的表达方式,旨在降低本书的学习门槛,让读者能看得完、学得会。

全书一共16章,分为两个部分:

第1部分(第1~9章)Embedding理论知识

主要讲解Embedding的基础知识、原理以及如何让Embedding落地的相关技术,如TensorFlow和PyTorch中的Embedding层、CNN算法、RNN算法、迁移学习方法等,重点介绍了Transformer和基于它的GPT、BERT预训练模型及BERT的多种改进版本等。

第二部分(第10 ~16章)Embedding应用实例

通过6个实例介绍了Embedding及相关技术的实际应用,包括如何使用Embedding提升传统机器学习性,如何把Embedding技术应用到推荐系统中,如何使用Embedding技术提升NLP模型的性能等。


作者简介

吴茂贵

资深大数据和人工智能技术专家,在BI、数据挖掘与分析、数据仓库、机器学习等领域工作超过20年。在基于Spark、TensorFlow、PyTorch、Keras等的机器学习和深度学习方面有大量的工程实践实践,对Embedding有深入研究。

著有《深度实践Spark机器学习》《Python深度学习:基于TensorFlow》《Python深度学习:基于Pytorch》等多部著作,广受读者好评。

王红星

高级数据科学家,任职于博世(中国)投资有限公司苏州分公司,负责BOSCH数据湖,数据分析与人工智能相关的产品与服务的设计和开发。在大数据、机器学习、人工智能方面有丰富的实践经验。


编辑推荐
适读人群 :所有从事人工智能技术领域的研究者和开发者。

(1)作者背景资深:作者是有20余年从业经验的AI技术专家和高级数据科学家。
(2)豪华专家阵容:黄铁军(中国人工智能学会会士/北京智源人工智能研究院院长)、周明(创新工场首席科学家/中国计算机学会副理事长)。
(3)内容系统全面:系统讲解了Embedding的基础、技术、原理、方法和性能优化。
(4)注重实操:详细列举和分析Embedding在机器学习性能提升、中英文翻译、推荐系统等6个重要场景的应用实践。
(5)学习门槛低:秉承复杂问题简单化原则,避免艰涩难懂数学公式,尽可能采用可视化的表达方式,内容循序渐进。

前言

为什么写这本书

近年来,视觉处理和自然语言处理(NLP)技术都取得了不小的进步。更可喜的是,这些新技术的落地和应用也带动了相关领域如传统机器学习、推荐、排序等的快速发展。

这些新技术的背后都离不开Embedding(嵌入)技术,Embedding已成为这些技术的基本元素和核心操作。Embedding起源于Word Embedding,经过多年的发展,已取得长足进步。从横向发展来看,由原来单纯的Word Embedding,发展成现在的Item Embedding、Entity Embedding、Graph Embedding、Position Embedding、Segment Embedding等;从纵向发展来看,由原来静态的Word Embedding发展成动态的预训练模型,如ELMo、BERT、GPT、GPT-2、GPT-3、ALBERT、XLNet等,这些预训练模型可以通过微调服务下游任务。Embedding不再固定不变,从而使这些预训练模型可以学习到新的语义环境下的语义,高效完成下游的各种任务,如分类、问答、摘要生成、阅读理解等,其中有很多任务的完成效率已超过人工完成的平均水平。

这些技术不但强大,而且非常实用。掌握这些技术因而成为当下很多AI技术爱好者的迫切愿望。本书就是为实现广大AI技术爱好者这个愿望而写的!

虽然本书不乏新概念、新内容,但仍采用循序渐进的方法。为了让尽可能多的人掌握这些技术,书中先介绍相关基础知识,如语言模型、迁移学习、注意力机制等,所以无须担心没有基础看不懂本书。然后,本书通过多个典型实例,使用最新版本的PyTorch或TensorFlow实现一些核心代码,并从零开始介绍如何实现这些实例,如利用Transformer进行英译中、使用BERT实现对中文语句的分类、利用GPT-2实现文本生成等。为了帮助大家更好地理解各种原理和逻辑,书中尽量采用可视化的讲解方法,并辅以相关关键公式、代码实例进一步说明。总而言之,无须担心没有高等数学背景无法看懂、看透本书。

本书特色

本书把基本原理与代码实现相结合,并精准定位切入点,将复杂问题简单化。书中使用大量可视化方法说明有关原理和逻辑,并用实例说明使抽象问题具体化。

读者对象

对机器学习、深度学习,尤其是NLP最新进展感兴趣的在校学生、在职人员。

有一定PyTorch、TensorFlow基础,并希望通过解决一些实际问题来进一步提升这方面水平的AI技术爱好者。

对机器学习、推荐排序、深度学习等前沿技术感兴趣的读者。

如何阅读本书

本书分为两部分,共16章。

第一部分为Embedding基础知识(第1~9章),重点介绍了Embedding技术的发展历史及最新应用,并对各种预训练模型涉及的基础知识做了详细说明,如语言模型、迁移学习、注意力机制等。第1章说明万物皆可嵌入;第2章讲解如何获取Embedding;第3、4章分别介绍视觉处理、文本处理方面的基础知识;第5章为本书重点,介绍了多种注意力机制;第6~8章介绍了ELMo、BERT、GPT、XLNet等多种预训练模型;第9章介绍了推荐排序系统。

第二部分为Embedding应用实例(第10~16章),以实例为主介绍了Embedding技术的多种应用,以及使用新技术解决NLP方面的一些问题。第10章介绍如何使用Embedding处理机器学习中的分类特征;第11章介绍如何使用Embedding提升机器学习性能;第12章介绍如何使用Transformer实现将英文翻译成中文;第13章介绍Embedding在推荐系统中的前沿应用;第14章介绍如何使用BERT实现中文语句分类问题;第15章介绍如何使用GPT-2实现文本生成;第16章是对Embedding技术的总结。

勘误和支持

由于笔者水平有限,加之编写时间仓促,书中难免出现错误或不准确的地方,恳请读者批评指正。你可以通过访问http://www.feiguyunai.com下载代码和数据,也可以通过邮箱([email protected])进行反馈。非常感谢你的支持和帮助,也非常欢迎大家加入图书群(QQ:799038260)进行在线交流。

致谢

在本书编写过程中,我得到了很多同事、朋友、老师和同学的支持!感谢刘未昕、张粤磊、张魁等同事的支持(他们负责整个环境的搭建和维护),感谢博世王冬的鼓励和支持!感谢上海交大慧谷的程国旗老师,上海大学的白延琴老师、李常品老师,上海师范大学的田红炯老师、李昭祥老师,赣南师大的许景飞老师等的支持和帮助!

感谢机械工业出版社杨福川老师、李艺老师给予本书的大力支持和帮助。

最后,感谢我的爱人赵成娟在繁忙的教学之余帮助审稿,并提出了不少改进意见和建议。

吴茂贵

2021年3月31日于上海


目录


短评

优惠活动的时候入手的感觉可以

2021-07-25 17:08:36

书不错,蛮好的,学习。

2021-06-25 22:27:51

本书真是不错的,知识点丰富,对知识点讲解通俗易懂,非常棒??

2021-07-22 19:26:51

学习人工智能嵌入式方法的好向导,值得好好研读!

2021-07-11 22:17:52

深入浅出Embedding:原理解析与应用实践。其实没啥意思,不买也罢。

2021-06-18 20:55:11

书本内容很不错,值得研读

2021-07-02 18:51:17

讲得不太好,就是博客的拼拼凑凑,代码也有比较多的bug。大家可以直接看B站课程,比这本书讲得好太多。虽然请了很多大牛联袂推荐,但是我不太相信大牛们看过这本书!

2021-06-29 21:54:38

送货速度很快,晚上买第二天上午就送到了。书的质量很好,没有发现印刷问题。书的内容也很全面,由浅入深,有理论有实践,几乎手把手教。

2021-06-14 21:56:50

质量非常好,客服态度非常非常赞,有问题及时给解决了

2021-06-12 11:17:59

新书,很好的选题,值得推荐

2021-06-09 18:55:31

标签
深度学习
产品特色