猜你喜欢
知识图谱:从入门到精通(套装共2册)

知识图谱:从入门到精通(套装共2册)

书籍作者:肖仰华 ISBN:12792748
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:2994
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

《知识图谱:概念与技术》内容提要

知识图谱是一种大规模语义网络,已经成为大数据时代知识工程的代表性进展。知识图谱技术是实现机器认知智能和推动各行业智能化发展的关键基础技术。知识图谱也成为大规模知识工程的代表性实践,其学科日益完善。

《知识图谱:概念与技术》是一本系统介绍知识图谱概念、技术与实践的书籍。全书共5篇,由16 章构成,力求涵盖知识图谱相关的基本概念与关键技术。“基础篇”介绍知识图谱的基本概念、内涵与外延、历史沿革、应用价值,以及相关的基础知识。“构建篇”重点介绍大规模高质量知识图谱的自动化构建技术,涵盖词汇挖掘、实体识别、关系抽取及概念图谱构建、百科图谱构建、众包构建与质量控制等专题。“管理篇”系统地阐述了知识图谱建模与存储、查询与检索,以及图数据管理系统。“应用篇”对于基于知识图谱的关键应用技术展开介绍,包括搜索与推荐、自然语言问答,以及基于知识图谱的自然语言理解。“实践篇”介绍知识图谱实践中的基本原则和有用实践,初步讨论了知识图谱实践中的开放性问题。

《知识图谱:概念与技术》可作为高年级本科生、硕士生或者博士生的教材,也适合企业与行业智能化的从业人员阅读


《知识图谱:方法、实践与应用》内容提要

知识图谱是较为典型的多学科交叉领域,涉及知识工程、自然语言处理、机器学习、图数据库等多个领域。《知识图谱:方法、实践与应用》系统地介绍知识图谱涉及的关键技术,如知识建模、关系抽取、图存储、自动推理、图谱表示学习、语义搜索、知识问答、图挖掘分析等。此外,本书还尝试将学术前沿和实战结合,让读者在掌握实际应用能力的同时对前沿技术发展有所了解。

《知识图谱:方法、实践与应用》既适合计算机和人工智能相关的研究人员阅读,又适合在企业一线从事技术和应用开发的人员学习,还可作为高等院校计算机或人工智能专业师生的参考教材。

作者简介

《知识图谱:概念与技术》作者简介

肖仰华

博士,复旦大学教授、博士生导师、复旦大学知识工场实验室创始人。曾担任多家企业高级技术顾问与首席科学家。曾获得十多个国家、省/市、企业级的研究奖项,曾承担三十多项国家、省/市、企业级研发项目。在国际学术会议与期刊(包括SIGMOD、VLDB、ICDE、IJCAI、AAAI、ACL、TKDE等)发表论文百余篇,授权近20项知识图谱专利。担任多个国际期刊编委,百余次为国际/国内学术机构/会议提供学术服务工作。领导构建了知识工场平台,发布了一系列知识图谱包括CN-DBpedia、CN-Probase等。


《知识图谱:方法、实践与应用》作者简介

王昊奋,上海交通大学计算机博士。中文知识图谱zhishi.me创始人、OpenKG发起人之一、CCF理事、CCF术语审定工委主任、CCF TF执委、中文信息学会语言与知识计算专委会副秘书长、上海交通大学校友会AI分会秘书长。在知识图谱、问答系统和聊天机器人等诸多领域有丰富的研发经验。

漆桂林,东南大学计算机学院教授、东南大学认知智能研究所所长、南京柯基数据科技有限公司首席科学家、OpenKG发起人之一、中国中文信息学会语言与知识计算专业委员会副主任、中国科学技术情报学会知识组织专业委员会副主任、爱思唯尔(Elsevier)数据管理顾问委员会顾问、国际期刊 Journal of Data Intelligence 执行主编。科研成果在电力故障智能检测和知识推送、医药知识问答及网络安全态势感知系统等领域得到了实际应用。

陈华钧,浙江大学计算机科学与技术学院教授。浙江大学阿里巴巴知识引擎联合实验室负责人、浙江省大数据智能计算重点实验室副主任、中国人工智能学会知识工程与分布智能专业委员会副主任委员、中国中文信息学会语言与知识计算专业委员会副主任委员、OpenKG发起人。曾获国际语义网会议ISWC佳论文奖。


前言

《知识图谱:概念与技术》前言

内容架构

全书共五篇,由16章构成,力求涵盖知识图谱相关的基本概念与关键技术。

第1篇 基础篇

包含前两章。第1章介绍知识图谱的基本概念、历史沿革、研究意义、应用价值等。第2章介绍知识图谱所必需的基础知识,主要介绍与知识图谱密切相关的知识表示、机器学习、自然语言处理的基本概念。

第2篇 构建篇

介绍知识图谱的构建。大规模高质量知识图谱的构建是整个知识图谱技术落地的核心,因此也是整本书的重点。本篇的核心是第3章与第4章。在这两章中,我们介绍了知识图谱中知识获取的两个核心问题。其中一个是点的识别与建立,知识图谱中的点可以是词汇与实体,因此第3章重点介绍了词汇挖掘与实体识别。有了知识图谱中的点之后,建立点之间的关系是知识图谱构建的核心问题。为此,第4章主要介绍了关系抽取(从文本中获取关系实例)。

在此基础上,第2篇进一步对两类重要的知识图谱,即概念图谱(第5章)与百科图谱(第6章)的构建展开了具体介绍。这两类知识图谱在知识图谱技术发展历程中有着突出地位,有很多实际应用。最后,第2篇再对其中的两个专题:众包构建(第7章)与质量控制(第8章)展开介绍。当前的知识图谱构建还离不开人,如何把人力用好是第7章的主题。质量控制是知识图谱构建的核心,第8章从质量视角再次盘点整个知识图谱构建的全流程。

可以看出,我们在构建部分浓墨重彩,从构建的关键环节(词汇挖掘、实体识别、关系抽取)、两类重要知识图谱的构建,以及构建的两个专题等三个切面对知识图谱构建进行了全方位的论述。其目的在于向读者立体式地呈现知识图谱构建的完整体系。这也从一个侧面说明了知识图谱知识体系的庞杂。

第3篇 管理篇

介绍知识图谱的建模与存储(第9章)、查询与检索(第10章)以及图数据管理系统(第11章)。这一篇旨在从数据管理的角度系统阐述知识图谱如何建模、如何存储、如何查询、如何检索,以及如何实现系统性的高效管理。

第4篇 应用篇

把知识图谱构建好、管理好的目的还是为了应用好。第4篇对于基于知识图谱的应用技术展开介绍,包括搜索与推荐(第13章)、自然语言问答(第14章)。这些应用本质上都依赖基于知识图谱的自然语言理解,因此这一专题也单独成章(第12章)。

第5篇 实践篇

知识图谱实践有哪些基本原则和最佳实践(第15章),以及在知识图谱应用过程中还存在哪些挑战(第16章),都会在这一篇中回答。

肖仰华

2019年11月10日

《知识图谱:方法、实践与应用》前言

本书主要内容

本书共包括9章,主要内容如下:

第1章主要介绍知识图谱的基本概念、历史渊源、典型的知识图谱项目、技术要素以及核心应用价值。

第2章围绕知识表示与建模,首先介绍传统人工智能领域的典型知识表示方法,如谓词逻辑、描述逻辑、框架系统等,接下来重点介绍RDF、OWL等互联网时代的知识表示框架,此外还介绍知识图谱的向量表示方法等。最后以Protégé为例介绍知识建模的具体实践过程。

第3章围绕知识存储,首先介绍知识图谱存储的主要特点和难点,然后介绍几种常用的知识图谱存储索引及存储技术,并对原生图数据库的技术原理进行简要介绍。此外,还概要介绍常用的图数据库,并以Apache Jena和gStore为例介绍知识图谱存储的具体实践过程。

第4章围绕知识抽取与知识挖掘,首先介绍从不同来源获取知识图谱数据的常用方法,然后重点围绕实体抽取、关系抽取和事件抽取等,对从文本中获取知识图谱数据的方法展开了较为具体的介绍。最后以DeepDive开源工具为例介绍关系抽取的具体实践过程。

第5章围绕知识图谱的融合,分别对概念层的融合和实体层的融合展开介绍,包括本体映射、语义映射技术、实体对齐、实体链接等。最后以LIMES开源工具为例介绍实体融合的具体实践过程。

第6章围绕知识图谱推理,首先介绍推理的基本概念,然后分别从基于演绎逻辑的知识图谱推理和基于归纳的知识图谱推理,对常用的知识图谱推理技术进行介绍。最后以Apache Jena和Drools等开源工具为例介绍知识图谱推理的具体实践过程。

第7章和第8章分别围绕语义搜索和知识问答展开,介绍语义索引、基于知识图谱的问答等系列技术,并以gAnswer等开源工具为例,介绍基于知识图谱实现精准搜索和问答的具体实践过程。

第9章为应用案例章节,作者挑选了电商、图情、生活娱乐、企业商业、创投、中医临床领域和金融证券行业7个应用案例,对知识图谱技术在不同领域的实现过程和应用方法展开介绍。

作者

2019年7月


目录

《知识图谱:概念与技术》目录

第1篇 基础篇

第1章 知识图谱概述 2

1.1 知识图谱的基本概念 2

1.2 知识图谱的历史沿革 10

1.3 知识图谱的研究意义 16

1.4 知识图谱的应用价值 20

1.5 知识图谱的分类 24

第2章 基础知识 43

2.1 概述 43

2.2 知识表示 45

2.3 机器学习 64

2.4 自然语言处理 73

第2篇 构建篇

第3章 词汇挖掘与实体识别 84

3.1 概述 84

3.2 领域短语挖掘 86

3.3 同义词挖掘 95

3.4 缩略词抽取 101

3.5 实体识别 109

第4章 关系抽取 127

4.1 概述 127

4.2 基于模式的抽取 133

4.3 基于学习的抽取 139

4.4 开放关系抽取 150

第5章 概念图谱构建 160

5.1 概述 160

5.2 isA关系抽取 168

5.3 isA关系补全 175

5.4 isA关系纠错 181

第6章 百科图谱构建 189

6.1 概述 189

6.2 基于单源的百科图谱构建 192

6.3 基于多源的百科图谱融合 207

第7章 知识图谱的众包构建 221

7.1 概述 221

7.2 知识型众包的基本概念 223

7.3 知识型众包研究的问题 226

7.4 基于众包的知识图谱构建与精化 235

第8章 知识图谱的质量控制 250

8.1 概述 251

8.2 缺失知识的发现与补全 260

8.3 错误知识的发现与纠正 270

8.4 过期知识的更新 274

第3篇 管理篇

第9章 知识图谱的建模与存储 286

9.1 概述 286

9.2 知识图谱的数据模型 287

9.3 知识图谱的物理存储 296

第10章 知识图谱的查询与检索 314

10.1 概述 314

10.2 查询语言:SPARQL 315

10.3 子图查询 324

10.4 其他查询 335

第11章 图数据管理系统 347

11.1 概述 347

11.2 知识图谱与图数据管理系统 348

11.3 图数据管理系统的基本架构和设计原则 357

11.4 典型的图数据管理系统 360

第4篇 应用篇

第12章 基于知识图谱的语言认知 376

12.1 概述 377

12.2 实体理解 380

12.3 概念理解 393

12.4 属性理解 401

第13章 基于知识图谱的搜索与推荐 407

13.1 概述 407

13.2 基于知识图谱的搜索 410

13.3 基于知识图谱的推荐 421

第14章 基于知识图谱的问答 440

14.1 概述 440

14.2 基于模板的KBQA 451

14.3 基于图模型的KBQA 455

14.4 基于深度学习的KBQA 459

第5篇 实践篇

第15章 知识图谱实践 470

15.1 概述 470

15.2 知识图谱系统 478

15.3 知识图谱工程 487

第16章 开放性问题 503

16.1 知识表示 503

16.2 知识获取 506

16.3 知识应用 511


《知识图谱:方法、实践与应用》目录

第1章 知识图谱概述 1

1.1 什么是知识图谱 1

1.2 知识图谱的发展历史 2

1.3 知识图谱的价值 5

1.4 国内外典型的知识图谱项目 9

1.5 知识图谱的技术流程 15

1.6 知识图谱的相关技术 19

1.7 本章小结 30

参考文献 31

第2章 知识图谱表示与建模 40

2.1 什么是知识表示 40

2.2 人工智能早期的知识表示方法 43

2.3 互联网时代的语义网知识表示框架 48

2.4 常见开放域知识图谱的知识表示方法 64

2.5 知识图谱的向量表示方法 68

2.6 开源工具实践:基于Protégé的本体知识建模 77

2.7 本章小结 80

参考文献 80

第3章 知识存储 82

3.1 知识图谱数据库基本知识 82

3.2 常见知识图谱存储方法 91

3.3 知识存储关键技术 121

3.4 开源工具实践 126

参考文献 131

第4章 知识抽取与知识挖掘 133

4.1 知识抽取任务及相关竞赛 133

4.2 面向非结构化数据的知识抽取 136

4.3 面向结构化数据的知识抽取 154

4.4 面向半结构化数据的知识抽取 161

4.5 知识挖掘 168

4.6 开源工具实践:基于DeepDive的关系抽取实践 178

参考文献 180

第5章 知识图谱融合 184

5.1 什么是知识图谱融合 184

5.2 知识图谱中的异构问题 185

5.3 本体概念层的融合方法与技术 190

5.4 实例层的融合与匹配 236

5.5 开源工具实践:实体关系发现框架LIMES 266

5.6 本章小结 269

参考文献 269

第6章 知识图谱推理 279

6.1 推理概述 279

6.2 基于演绎的知识图谱推理 283

6.3 基于归纳的知识图谱推理 306

6.4 知识图谱推理新进展 324

6.5 开源工具实践:基于Jena和Drools的知识推理实践 327

6.6 本章小结 329

参考文献 330

第7章 语义搜索 334

7.1 语义搜索简介 334

7.2 结构化的查询语言 336

7.3 语义数据搜索 342

7.4 语义搜索的交互范式 348

7.5 开源工具实践 355

参考文献 364

第8章 知识问答 366

8.1 知识问答概述 366

8.2 知识问答的分类体系 371

8.3 知识问答系统 376

8.4 知识问答的评价方法 386

8.5 KBQA前沿技术 392

8.6 开源工具实践 406

8.7 本章小结 415

参考文献 416

第9章 知识图谱应用案例 420

9.1 领域知识图谱构建的技术流程 420

9.2 领域知识图谱构建的基本方法 425

9.3 领域知识图谱的应用案例 428

9.4 本章小结 460

参考文献 461