猜你喜欢
携程人工智能实践

携程人工智能实践

书籍作者:携程技术团队 ISBN:9787121384400
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:7680
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

《携程人工智能实践》的作者来自携程多个研发部门,从具体的应用场景入手,主要包括旅行产品的个性化推荐和搜索,旅行场景的 OCR、机器翻译和知识图谱,主题图片优选、推荐理由抽取,以及安全风险控制和如何工程化提升研发效率等,较为全面地介绍了如何对具体的业务问题进行建模,将其转变为具体的机器学习模型,并将业务目标转化为机器学习的目标函数。本书在此基础上提供了一些有效的经验,使得读者能够利用机器学习的方式全面有效地帮助企业提升业务目标、提升人效比,乃至为网站的安全保驾护航。作者希望本书能够帮助产品技术同人更好地理解机器学习模型的落地,给读者带来启发和借鉴。


作者简介

携程技术团队

作为携程集团的核心竞争力,携程技术团队由近7000位来自海内外的精英工程师组成,为携程集团业务的运作和开拓提供全面技术支持,并以技术创新源源不断地为产品和服务创造价值。

技术从来都不是闭门造车,携程技术团队会一直以开放和充满热情的心态,通过各种渠道和方式,和圈内小伙伴们探讨、交流、碰撞,共同收获和成长。


编辑推荐
适读人群 :人工智能领域的从业人员; 人工智能行业的产品和技术同人; 想要入门算法的同人

《携程人工智能实践》详细介绍了携程在人工智能技术落地方面的深入探索,重点分享了如何从实际应用场景入手,把业务和产品的目标转化为人工智能模型和算法问题。并综合考虑系统、环境和数据的多种约束,设计和实施具体落地方案,同时对人工智能服务化和人工智能运营的理念和技术进行了很好的分析和总结,是携程技术团队多年开发和应用人工智能实践经验的结晶。本书对互联网行业和人工智能应用研究机构的科研技术人员来说,是一本很好的案头参考书。


前言


序 言

人工智能发展至今已经有几十年,期间经历了各种曲折历程,虽曾出现波峰,但更多的却是波谷。然而从21 世纪开始,随着算法、计算能力和大数据等相关科研技术的发展和突破,尤其是最近十几年互联网和移动互联网的快速崛起,现阶段人工智能已处于高速发展的时期,落地的应用和场景层出不穷,成为时代的“宠儿”。

以深度学习为代表的人工智能技术,正以一种深刻和特别的方式改变着我们的生活,极有可能与大数据技术一起引领第四次工业革命。因此,互联网一线公司都投入了大量资源,积极进行研究和尝试,希望利用人工智能技术来解决业务中的各类问题。

携程作为中国最大、世界第二大的互联网旅行服务公司,其结合自身的业务场景和海量出行数据,从多个方面对人工智能领域进行了积极探索。本书的作者们来自携程的多个研发部门,读者会发现从旅行产品的个性化推荐和搜索,到旅行场景的OCR、机器翻译和知识图谱,再到产品层面的主题图片优选、推荐理由抽取,以及安全风控和如何工程化提升研发效率,在本书中都有相应的阐述。当然,我们的工作才刚刚开始,我们相信人工智能技术会为旅行等服务领域带来巨大改变。

与传统的人工智能图书不同,本书不会偏重理论,是从具体业务场景来展现人工智能技术的落地方案,因此书中选取的都是真实的技术案例,作者编写本书的初衷也是希望让更多人参与到人工智能技术的实际研发中来。人工智能并不神秘,虽然人们的学习曲线较陡, 前仍在高速发展中,还有很多新的方向可以探索和落地,希望这本书可以抛砖引玉,给读者带来一定的收获。

携程长期秉承技术驱动产品和业务的理念,一直在积极地和行业内的技术同人进行交流和分享。我们相信,只要大家一起行动起来,合力打造一个开放和交流的技术生态圈,必将会让我们技术人得到真正的成长。

欢迎大家针对书中的内容进行深入探讨,如果发现问题或有更好的想法,期待能及时向我们提供反馈。旅行是带给人幸福的行业,如果有识之士希望通过技术实现“让旅行更幸福”,也欢迎加入携程的技术团队。我们对技术的价值和力量深信不疑。

携程技术副总裁 李小林




前 言

近年来,得益于深度学习和硬件计算能力的快速发展,人工智能技术正快速渗透到互联网应用的方方面面,这样的变化同样也伴随着携程产品技术的迭代更新。人工智能技术不仅直接提升了携程的订单收入、用户满意度等关键产品指标,还在业务运营、内容生产、信息安全与风险控制等方面发挥了重要作用。

携程作为OTA 领域的领军企业,积累了大量的用户出行场景数据、客服场景咨询与沟通数据、产品相关内容数据等,这些数据在机器学习模型的训练中发挥了巨大的作用。另外,携程有足够多的复杂场景,这些真实的复杂场景催生并推动了人工智能在携程中的广泛应用。同时,携程的产品线丰富且分支较多,因此将人工智能服务化和中台化成为必不可少的模块,它会对共性需求进行收口,以通用服务/ 中台的形式提供服务,有效降低部门之间的重复工作,节省开发成本,缩短开发周期。

与传统的人工智能书籍不同,本书更加关注如何将具体业务场景的问题分析和模型建模转化为具体的机器学习和深度学习问题,同时对于复杂业务场景,详细阐述了对应的算法架构体系,也介绍了如何更好地拟合各种业务指标,如自主率、点击率、人效比、网站的安全性等,最大限度地对业务进行赋能。作者希望通过具体的实践案例,给读者带来启发和借鉴。

作者介绍了OTA 场景在落地时的一些差异性问题,帮助用户理解在不同应用场景中可能遇到的一些差异性问题。例如,由于旅游产品的非标属性,用户在决策之前非常依赖内容化信息,因此携程在AI 内容化方面做了大量的工作和实践,帮助用户减少决策前的费力度;在同一酒店,不同的供应商和房型具有入住政策、软硬件设施和价格的差异,个性化推荐的召回池不是酒店实体,而是更加细分的入住政策、服务和设施,这些是入住体验的关键影响因素。

本书的内容安排如下。

第1 章和第2 章介绍了人工智能的一些基础原理,包括数学基础和模型构建,使读者快速回顾和了解算法中的一些基础内容,加深对后续章节中的技术细节的理解。

第3 章介绍了个性化推荐与搜索,如冷启动、个性化搜索、酒店排序、瀑布流排序等方面的实践,具体阐述如何利用算法为用户提供更好的优质服务。

第4 章介绍了携程在AI 服务化方面的工作,从旅游领域知识图谱、QA 问答、机器翻译和证件全文本识别四个方向进行详细阐述,这些方向都能够带给用户更好的服务体验、更细致的产品细节、更快速的问题解答、国际化的畅通体验和更便捷的操作服务。

第5 章和第6 章介绍了AI 如何有效提高工作人员在相关场景中的运营工作效率,从内容产品化、房态预测、用户模拟评分、邮件自动化、实时智能异常检测等多个方面进行了具体介绍,有效地发现了业务趋势和问题,并在一定条件下进行了自动处理。

第7 章和第8 章介绍了AI 在信息安全和风险控制方面的一些具体应用,详细阐述了对应的难点、目标和解决方案。

第9 ~ 11 章介绍了在AI 中台化方面的实践——AI 挖掘中台、AI 运营中台和通用数据服务,说明了在中台化建设中如何进行业务架构和系统架构规划。

本书面向的读者主要是人工智能领域的从业人员,包括产品和技术同人,同时也欢迎从事其他岗位和行业的读者通过阅读本书,对人工智能的原理和应用有一定的了解,一起探索和拓展人工智能的应用落地。对于想要入门的算法同人,建议详细阅读数学基础和模型构建章节,以便能够更好地结合理论和实践。没有相关数学知识背景或仅仅对具体应用场景感兴趣的同人,可以跳过数学基础和模型构建的内容。

感谢参与本书写作的来自携程的同人,他们将工作中的宝贵经验进行提炼和总结,并形成知识体系分享给读者。感谢出版社的工作人员,在本书的出版过程中给予的帮助和支持。

《携程人工智能实践》编委会


目录

目 录

第1 章 数学基础 001

1.1 引言 001

1.2 线性代数 001

1.2.1 概述 001

1.2.2 向量与矩阵 002

1.2.3 矩阵的运算 003

1.2.4 几种特殊的矩阵 005

1.2.5 线性方程组与矩阵的逆 007

1.2.6 特征值和特征向量 010

1.2.7 张量的定义和运算 011

1.3 概率基础 013

1.3.1 频率与概率 013

1.3.2 熵 016

1.3.3 常见的概率分布 017

1.4 优化理论 020

1.4.1 优化理论简介 020

1.4.2 无约束的优化问题 022

1.4.3 无约束的优化方法 024

1.4.4 风险函数的优化方法 026

1.4.5 带约束的优化方法 028

1.5 本章小结 031

参考文献 031


第2 章 模型构建 032

2.1 引言 032

2.2 建模流程 032

2.2.1 目标定义 032

2.2.2 损失函数 035

2.2.3 求解优化 037

2.2.4 结果评估 037

2.2.5 模型选择 040

2.3 常见模型 042

2.3.1 模型的分类方法 042

2.3.2 回归模型 043

2.3.3 逻辑回归模型 047

2.4 集成学习 049

2.4.1 集成学习概述 049

2.4.2 Bagging 051

2.4.3 Boosting 052

2.5 本章小结 055

参考文献 057


第3 章 个性化推荐与搜索 058

3.1 个性化推荐概述 058

3.2 跨领域推荐改善用户冷启动问题 059

3.2.1 背景描述 059

3.2.2 基础定义 060

3.2.3 建模思路 061

3.2.4 模型结构 062

3.2.5 实验结果 065

3.3 Bandit 算法在携程场景中的应用实践 066

3.3.1 Context-free Bandit 算法 067

3.3.2 Contextual Bandit 算法 069

3.3.3 场景应用 070

3.4 旅游度假产品的搜索个性化排序 078

3.4.1 度假搜索排序框架 079

3.4.2 度假搜索排序算法 080

3.4.3 模型演进及其他 085

3.4.4 小结 086

3.5 深度学习在酒店房型推荐中的应用实践 087

3.5.1 酒店房型推荐业务的背景 087

3.5.2 业务问题转化为算法问题 087

3.5.3 算法流程 088

3.5.4 小结 089

3.6 强化学习在酒店排序中的应用实践 089

3.6.1 业务背景 089

3.6.2 传统排序学习的局限性 090

3.6.3 强化学习的基本思路 091

3.6.4 算法流程 091

3.6.5 小结 093

3.7 瀑布流排序算法实践 094

3.7.1 场景简介 094

3.7.2 优化目标 094

3.7.3 特征工程 095

3.7.4 模型 097

3.7.5 位置偏差 098

3.7.6 评价指标 099

3.7.7 场景实践 101

3.8 本章小结 101


第4 章 AI 服务化 102

4.1 AI 服务化的背景与难点 102

4.2 旅游领域知识图谱 102

4.2.1 旅游领域知识图谱的特点 103

4.2.2 旅游领域知识图谱的构建 104

4.2.3 旅游领域知识图谱的应用 112

4.3 QA 问答中的文本匹配与排序 117

4.3.1 基于深度学习的语义匹配模型 118

4.3.2 基于交互的语义匹配模型 122

4.3.3 迁移学习在语义匹配网络中的应用 125

4.3.4 对语义匹配模型的一些思考 127

4.4 携程国际化中的机器翻译 130

4.4.1 模型架构 130

4.4.2 建模技巧 135

4.4.3 翻译质量评估 138

4.5 证件全文本识别 141

4.5.1 文本识别简介与发展历程 141

4.5.2 文本识别步骤 142

4.5.3 文本检测 142

4.5.4 文本识别 145

4.5.5 文本识别在证件识别中的应用实践 145

4.6 本章小结 147

参考文献 147


第5 章 AI 助力产品运营 150

5.1 旅游场景中的主题图片自动优选 151

5.1.1 业务场景 151

5.1.2 图像识别 151

5.1.3 图像去重 154

5.1.4 图像优美度识别 155

5.1.5 小结 158

5.2 知识推理在携程业务中的应用 158

5.2.1 标签系统的业务背景和业务痛点 159

5.2.2 标签规则配置平台的设计与实现 160

5.2.3 小结 164

5.3 基于专名的内容产品化 165

5.3.1 内容产品化的业务背景 165

5.3.2 命名实体识别 165

5.3.3 实体链接 168

5.3.4 小结 174

5.4 主题推荐理由抽取 174

5.4.1 主题推荐理由抽取的业务背景 174

5.4.2 智能内容抽取 175

5.4.3 自动内容生成 186

5.4.4 小结 193

5.5 本章小结 194

参考文献 194


第6 章 AI 运营 199

6.1 问题的背景与难点 199

6.2 机器学习在海外酒店房态预测中的运用 201

6.2.1 业务背景 201

6.2.2 海外酒店房态预测的难点 201

6.2.3 海外酒店房态预测难点的解决方案 202

6.2.4 海外酒店房态预测的应用场景 208

6.3 IM+ 用户模拟评分 209

6.3.1 业务背景 209

6.3.2 基于深度学习的模拟评分 210

6.3.3 技术方案流程 214

6.4 海外邮件自动化 215

6.4.1 业务背景 215

6.4.2 自然语言处理在邮件自动化中的应用 216

6.5 实时智能异常检测平台的算法及工程实现 221

6.5.1 应用场景 221

6.5.2 大而全的监控衍生出的问题 222

6.5.3 统计模型的困扰 222

6.5.4 算法选择和设计目标 223

6.5.5 算法的描述和检验 225

6.5.6 实时性工程 231

6.6 本章小结 233


第7 章 信息安全 234

7.1 问题的背景与难点 235

7.2 机器学习在Web 攻击检测中的实践 235

7.2.1 携程Web-IDS 攻击检测系统架构介绍 235

7.2.2 定义目标问题 238

7.2.3 收集数据和实现特征工程 238

7.2.4 模型效果评估 240

7.2.5 线上应用和持续优化 241

7.3 机器学习在滑块验证码防御中的实践 242

7.3.1 滑块验证码人机识别 243

7.3.2 滑块验证码轨迹相似度识别 247

7.4 本章小结 253

参考文献 253


第8 章 风险控制 254

8.1 自动化迭代反欺诈模型体系 254

8.1.1 风控变量体系 256

8.1.2 自动化迭代模型框架 256

8.1.3 RNN 表征学习 259

8.1.4 自动化与传统方法的效果对比 261

8.2 “程信分”模型体系 263

8.2.1 “程信分”模型 263

8.2.2 “闪住”催收模型 266

8.3 主动学习在业务风控场景中的应用 268

8.3.1 酒店反刷单主动学习模型 268

8.3.2 机票防虚占主动学习模型 271

8.4 本章小结 273

参考文献 273


第9 章 AI 挖掘中台 274

9.1 AI 挖掘中台的背景 274

9.2 AI 挖掘中台的框架和功能 275

9.2.1 AI 挖掘中台的构成 275

9.2.2 AI 挖掘操作步骤 276

9.2.3 AI 挖掘中台的组件及工作流程 279

9.2.4 AI 挖掘中台应用成效 281

9.3 大数据和人工智能的赋能 281

9.4 本章小结 282


第10 章 AI 运营中台 283

10.1 AI 运营中台的背景 283

10.2 AI 运营中台的框架和功能 284

10.2.1 框架 284

10.2.2 流程 288

10.2.3 模块 289

10.3 AI 运营中台的高效运营 290

10.3.1 AI 赋能方式 290

10.3.2 企业应用实例 291

10.4 本章小结 292


第11 章 通用数据服务 294

11.1 通用数据服务的背景 294

11.2 通用数据服务平台的架构和功能 295

11.2.1 通用数据服务平台的架构 295

11.2.2 通用数据服务平台的功能模块 295

11.3 通用数据服务的监控 299

11.3.1 存储监控 300

11.3.2 查询监控 300

11.3.3 写入监控 301

11.4 本章小结 302


短评

非常不错的书,正好打折也划算

2020-04-17 00:59:49

标签
机器学习,人工智能
产品特色