猜你喜欢
知识图谱实战

知识图谱实战

书籍作者:于俊 ISBN:9787111721642
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:6050
创建日期:2023-06-06 发布日期:2023-06-06
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

这是一本综合介绍知识图谱构建与行业实践的著作,是作者多年从事知识图谱与认知智能应用落地经验的总结,得到了多位知识图谱资深专家的推荐。
本书以通俗易懂的方式来讲解知识图谱相关的知识,尤其对从零开始构建知识图谱过程中需要经历的步骤,以及每个步骤需要考虑的问题都给予较为详细的解释。
本书基于实际业务进行抽象,结合知识图谱的7个构建步骤,深入分析知识图谱技术应用以及8个行业综合案例的设计与实现。
全书分为基础篇、构建篇、实践篇,共16章内容。
基础篇(第1章),介绍知识图谱的定义、分类、发展阶段,以及构建方式、逻辑/技术架构、现状与应用场景等。
构建篇(第2~8章),详细介绍知识抽取、知识表示、知识融合、知识存储、知识建模、知识推理、知识评估与运维等知识图谱构建的核心步骤,并结合实例讲解应用方法。
实践篇(第9~16章),详细讲解知识图谱的综合应用,涵盖知识问答评测、知识图谱平台、智能搜索、图书推荐系统、开放领域知识问答、交通领域知识问答、汽车领域知识问答、金融领域推理决策。

作者简介

于 俊
中国科学技术大学电子信息专业博士研究生,科大讯飞大数据及人工智能技术专家,安徽大学计算机技术专业硕士生导师,CCF高级会员。有超过15年的大数据及人工智能算法工程化经验,专注大数据分析及数据价值挖掘、大数据及人工智能技术应用落地。著有《Spark核心技术与高级应用》《Spark机器学习进阶实战》等书。

李雅洁
华中科技大学应用统计硕士,在知识图谱、自然语言处理、大数据分析与挖掘、机器学习等领域有丰富的研究和开发经验。精通Python、R语言以及Spark等大数据框架,擅长自然语言处理及知识图谱构建。

彭加琪
中国科学技术大学计算机科学硕士,科大讯飞核心研发平台主管,负责AI数据平台和知识中台建设,精通Java、Python等编程语言,擅长分布式系统建设以及企业级知识图谱构建与应用。

程知远
悉尼大学数据科学硕士,科大讯飞大数据工程师,负责智慧教学产品及学生行为分析的算法研究及引擎实现。精通Java、Python等编程语言,擅长分布式系统建设以及企业级知识图谱构建与应用。

编辑推荐
适读人群 :1.对知识图谱感兴趣的读者伴随着大数据时代的到来,很多工作都和大数据息息相关,无论是传统行业、还是移动互联网行业,都必须要了解大数据,通过大数据发现自身的价值,使用

(1)作者:科大讯飞大数据及人工智能技术专家于俊新力作,曾撰写《Spark核心技术与高级应用》《Spark机器学习进阶实战》,广受好评。
(2)专家力荐:王士进(认知智能国家重点实验室副主任、讯飞研究院副院长)、李直旭(复旦大学研究员、博士生导师)、徐童(中国科学技术大学教授)联袂推荐。
(3)一书学透:详解知识图谱构建8个核心步骤,涵盖知识图谱落地的8个关键场景。
(4)内容前沿:剖析CCKS近3年自然语言知识问答评测、生活服务问答评测、开放知识问答评测任务方案。
(5)掌握内涵:援引中国古典著作精选名句揭示知识图谱的内涵。引导读者站在哲学视角来理解知识图谱,看透本质,从而应对应用过程中出现的各种问题。

前言

前  言
临渊羡鱼,不如退而结网。
知识图谱就是一张网,一张基于现实世界的概念、实体、关系、属性构建起来的结构化知识网络。知识图谱作为人工智能的底层支撑和核心技术,能够“帮助”人工智能对现实世界中复杂、相互联结的数据进行理解与处理,使机器具备理解、分析和决策的能力,并且更加接近人类认知世界的水平,从而成功应用于智能搜索、推荐系统、知识问答、推理决策等领域。
本书从诸多中国古典著作中精选名句,并结合知识图谱技术精髓进行关联讲解,引导读者以哲学的思考方式来理解知识图谱的内涵,并使用知识图谱解决应用过程中出现的各种问题。
为什么要写这本书
2019年春天,随着大数据赋能业务逐渐兴起,科大讯飞大数据研究院大数据分析与算法团队开始响应公司号召,扎根于此业务,希望能够基于大数据分析与算法从海量数据中学习并自动决策,有效解决数据分析和挖掘瓶颈。而扎根业务以后,我们发现业务需求更多的是数据治理以及知识图谱等,需要通过构建行业知识图谱来支撑业务发展,以解决实际业务场景的问题。
2019年秋天,在机械工业出版社策划编辑的建议下,笔者决定和小伙伴们一起朝着新的目标努力——编写一本知识图谱构建与应用的书籍。
在本书的写作过程中,知识图谱技术也在不断变化。秉承大道至简的原则,我们一方面尽可能在知识图谱构建章节统筹各种概念,另一方面尽可能在实践章节跳出概念给出应用案例。笔者希望能抛砖引玉,以个人的一些想法和见解,为读者拓展出更深入、更全面的思路。
本书只是一个开始,如何基于海量数据使用知识图谱技术解决更多业务问题,还需要无数的知识图谱从业人员前赴后继,越过漫漫雄关,共同创造美好的知识图谱新时代。
本书特色
本书结合知识图谱的抽取、表示、融合、存储、建模、推理、评估等构建技术进行讲解,并在构建基础上基于实际业务进行抽象,最后给出知识图谱技术的应用案例。本书希望帮助读者完成知识图谱技术栈的学习和实践,以便读者厘清知识图谱相关内容,降低学习成本。
本书以通俗易懂的方式讲解知识图谱相关的知识,尤其对从零开始构建知识图谱过程中需要经历的步骤以及每个步骤需要考虑的问题,给出了比较详细的解释。
读者对象
(1)对知识图谱感兴趣的读者
伴随着人工智能时代的到来,很多工作都需要使用知识图谱分析与挖掘数据深层关系并有效推理知识。对这部分读者来说,本书的内容能够帮助他们加深对知识图谱的构建、应用场景和存在价值的理解。
(2)从事知识图谱构建、开发的人员
通过学习知识图谱实践案例,这部分读者可以掌握知识图谱构建、开发的方法,快速地构建知识图谱。可以说,本书提供了一条捷径,同时能够缩小知识图谱构建开发人员与算法研究人员之间的鸿沟,帮助他们掌握知识图谱相关知识。
(3)从事知识图谱算法、研究的人员
对从事知识图谱算法、研究的人员来说,通过本书他们能够身临其境地“体验”各种场景,了解各种知识图谱在不同场景下的优缺点,本书对他们解决生产环境中遇到的知识图谱、数据挖掘等问题有很好的借鉴作用。
(4)设计知识图谱架构及技术方案的人员
对设计知识图谱架构及技术方案的人员来说,本书能够帮助他们构建知识图谱的应用并进行效果闭环验证。读者只有对知识图谱的功能、效率、优缺点等有了全面的了解,才能在架构设计中综合考虑各种因素,设计出高效、稳定的知识图谱架构。
如何阅读本书
在结构安排上,本书分为“基础篇”“构建篇”“实践篇”,共16章内容,从知识图谱概念引出知识图谱构建技术,再到多个行业实践方案的设计思路与代码实现,层层推进,便于读者系统学习与落地应用。
基础篇(第1章),介绍知识图谱的定义、分类、发展阶段,以及构建方式、逻辑/技术架构、现状与应用场景等。
构建篇(第2~8章),详细介绍知识抽取、知识表示、知识融合、知识存储、知识建模、知识推理、知识评估与运维等,并结合实例讲解应用方法。
实践篇(第9~16章),详细讲解知识图谱的综合应用,涵盖知识问答评测、知识图谱平台,以及智能搜索、图书推荐系统、开放领域知识问答、交通领域知识问答、汽车领域知识问答、金融领域推理决策实践。
勘误和支持
由于笔者水平有限,撰写时间仓促,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。本书代码和数据目录:https: //github.com/datadance/book3-kg.git。如果你有更多的宝贵意见,可以通过知识图谱技术交流QQ群435263033或者邮箱[email protected]联系我们,期待得到大家的反馈,让我们在知识图谱与人工智能征程中互勉共进。
致谢
感谢合作者李雅洁、彭加琪、程知远;感谢程礼磊、丁辉、丁可、郑英帅、李卫东、林发可、曹伟灿等技术专家,在本书写作遇到困难的时候,他们一直鼓励、支持我,并提供了宝贵的建议,使本书的质量更上一层楼。
感谢机械工业出版社的编辑,在我面临读博压力、二宝出生、团队解散的情况下,在我多少次徘徊在放弃边缘的时刻,他们

目录

目  录
前言
基础篇
第1章 理解知识图谱 / 2
1.1 知识图谱概述 / 2
1.1.1 知识定义及分类 / 3
1.1.2 知识图谱定义 / 4
1.1.3 知识图谱分类 / 5
1.1.4 知识图谱发展阶段 / 8
1.2 知识图谱架构 / 8
1.2.1 构建方式 / 8
1.2.2 逻辑架构 / 9
1.2.3 技术架构 / 9
1.3 知识图谱现状 / 13
1.3.1 学术界研究现状 / 13
1.3.2 工业界应用现状 / 13
1.4 知识图谱应用场景 / 14
1.4.1 智能搜索 / 14
1.4.2 推荐系统 / 15
1.4.3 知识问答 / 15
1.4.4 推理决策 / 16
1.5 本章小结 / 16
构建篇
第2章 知识抽取 / 18
2.1 知识抽取概述 / 18
2.1.1 知识抽取的定义 / 19
2.1.2 知识抽取的任务 / 20
2.2 知识抽取的方法 / 26
2.2.1 面向结构化数据 / 26
2.2.2 面向半结构化数据 / 28
2.2.3 面向非结构化数据 / 30
2.3 知识抽取实例 / 37
2.3.1 Deepdive的安装
和配置 / 38
2.3.2 实验步骤 / 39
2.3.3 模型构建 / 47
2.4 本章小结 / 49
第3章 知识表示 / 50
3.1 知识表示概述 / 50
3.1.1 知识表示的定义 / 50
3.1.2 知识表示的任务 / 51
3.2 知识表示的方法 / 51
3.2.1 基于符号的知识表示 / 51
3.2.2 基于向量的知识表示 / 60
3.3 知识表示实例 / 64
3.3.1 环境配置 / 64
3.3.2 生成映射文件 / 65
3.3.3 将MySQL数据转为RDF
三元组 / 67
3.4 本章小结 / 68
第4章 知识融合 / 69
4.1 知识融合概述 / 69
4.1.1 知识融合的定义 / 70
4.1.2 知识融合的任务 / 70
4.2 知识融合的方法 / 73
4.2.1 本体对齐方法 / 73
4.2.2 实体对齐方法 / 77
4.3 知识融合实例 / 80
4.3.1 环境配置 / 81
4.3.2 预处理与匹配 / 81
4.3.3 结果评估 / 84
4.4 本章小结 / 85
第5章 知识存储 / 86
5.1 知识存储概述 / 86
5.1.1 知识存储的定义 / 86
5.1.2 知识存储的任务 / 87
5.2 知识存储的方法 / 89
5.2.1 基于关系型数据库的
知识存储 / 89
5.2.2 基于NoSQL的
知识存储 / 92
5.2.3 基于分布式的
知识存储 / 96
5.3 知识存储实例 / 98
5.3.1 使用Apache Jena
存储数据 / 98
5.3.2 使用Neo4j数据库
存储数据 / 98
5.4 本章小结 / 103
第6章 知识建模 / 104
6.1 知识建模概述 / 104
6.1.1 知识建模的定义 / 104
6.1.2 知识建模的任务 / 107
6.2 知识建模的方法 / 109
6.2.1 手工建模方法 / 109
6.2.2 半自动建模方法 / 113
6.2.3 本体自动建模方法 / 114
6.3 知识建模实例 / 116
6.3.1 创建项目实例 / 117
6.3.2 创建本体关系和属性 / 118
6.3.3 知识图谱可视化 / 120
6.4 本章小结 / 121
第7章 知识推理 / 122
7.1 知识推理概述 / 122
7.1.1 知识推理的定义 / 122
7.1.2 知识推理的任务 / 123
7.2 知识推理的方法 / 124
7.2.1 基于逻辑规则的推理 / 124
7.2.2 基于知识表示学习的推理 / 131
7.2.3 基于神经网络的推理 / 134
7.2.4 混合推理 / 136
7.3 知识推理实例 / 137
7.4 本章小结 / 139
第8章 知识评估与运维 / 140
8.1 知识评估与运维概述 / 140
8.1.1 知识评估概述 / 141
8.1.2 知识运维概述 / 142
8.2 知识评估与运维的任务 / 143
8.2.1 知识评估任务 / 143
8.2.2 知识运维任务 / 147
8.3 知识评估与运维流程 / 149
8.3.1 知识评估流程 / 149
8.3.2 知识运维流程 / 150
8.4 本章小结 / 151
实践篇
第9章 知识问答评测 / 154
9.1 知识问答系统概述 / 154
9.1.1 知识问答系统定义 / 155
9.1.2 知识问答问题分类 / 155
9.1.3 知识问答评测技术方案 / 157
9.2 自然语言知识问答评测 / 159
9.2.1 任务背景 / 159
9.2.2 数据分析 / 159
9.2.3 技术方案 / 160
9.2.4 任务结果 / 163
9.3 生活服务知识问答评测 / 164
9.3.1 任务背景 / 164
9.3.2 数据分析 / 164
9.3.3 技术方案 / 165
9.3.4 任务结果 / 168
9.4 开放知识问答评测 / 168
9.4.1 任务背景 / 168
9.4.2 数据分析 / 168
9.4.3 技术方案 / 169
9.4.4 任务结果 / 172
9.5 本章小结 / 172
第10章 知识图谱平台 / 173
10.1 知识图谱平台建设背景 / 173
10.2 知识图谱平台基本功能 / 175
10.3 AiMind知识图谱平台 / 175
10.3.1 数据管理 / 176
10.3.2 知识建模 / 180
10.3.3 知识抽取 / 185
10.3.4 知识融合 / 189
10.3.5 知识管理 / 191
10.3.6 知识应用 / 194
10.4 本章小结 / 196
第11章 智能搜索实践 / 197
11.1 智能搜索背景 / 197
11.2 智能搜索业务设计 / 198
11.2.1 场景设计 / 198
11.2.2 知识图谱设计 / 199
11.2.3 模块设计 / 200
11.3 数据获取与预处理 / 20

短评

作为一个AI助理,我可以告诉你知识图谱实战的构建方法与行业应用都是非常广泛且有意义的。 知识图谱是一种表示和组织知识的方法,已经被广泛应用于各个行业,例如医疗、金融、能源、物流等。其应用范围包括智能客服、智能推荐、知识问答等。 下面是一些构建知识图谱的方法: 1. 数据采集:从不同的数据源收集关于特定领域的数据,例如专家知识、百科全书、文献等。 2. 实体识别:对收集的数据进行实体识别,可以使用自然语言处理技术,构建实体库。 3. 属性提取:在实体库中抽取属性信息,例如某个实体的特征、关键词等。 4. 实体关系抽取:在实体库中抽取实体之间的关系,例如属于、作者、相关等。 5. 知识建模:建立知识模型,将实体和关系组织成知识图谱。 下面是一些知识图谱在不同行业中的应用: 1. 医疗保健:帮助医生快速找到治疗方案和药品信息,同时提供了患者的病史、症状等信息,为医生诊断提供支持。 2. 金融领域:帮助银行或保险公司更好地理解客户需求,提供个性化的产品推荐和风险管理。 3. 物流领域:帮助物流公司优化路线规划,提高送货效率,同时可以进行智能调度和异常处理。 以上是知识图谱实战的构建方法与行业应用的简要介绍,希望对你有所启发。

2023-03-16 09:13:26

知识图谱实战是一个基于人工智能和大数据技术的新兴领域,它的应用涉及到多个领域,包括文本挖掘、数据分析、自然语言处理等。知识图谱是一种把数据和知识整合在一起的方法,它通过建立实体之间关联及属性的方式,从海量数据中提取出有用的信息和知识,进而实现智能化的数据分析、推荐等功能。 知识图谱的具体构建方法包括数据采集、数据清洗、实体抽取、实体链接、属性抽取、关系抽取及知识表示等步骤。其中,实体链接和关系抽取是知识图谱构建的两个核心步骤,它们可以帮助建立实体之间关联的链接,从而实现信息的共享和整合。 知识图谱在多个领域有着广泛的应用,例如金融、医疗、物流、旅游等。在金融领域,知识图谱可以帮助分析客户资产、投资行为、风险评估等信息,从而帮助金融机构更好地进行风险控制和客户管理。在医疗领域,知识图谱可以帮助医院对患者病情进行分析,并为医生提供有效的诊疗建议。在物流领域,知识图谱可以帮助优化物流路径和运输计划,从而提高物流效率和减少成本。 总之,知识图谱实战是一个广泛应用的领域,它可以帮助人们从海量数据中提取出有用的信息和知识,实现智能化的数据分析和应用,从而为人们带来更多的便利和价值。

2023-03-16 09:13:26

作为一名 AI 机器人,我对于知识图谱实战的构建方法和行业应用并不是那么清楚,但是我可以用我的算法向您提供一些信息和看法来回答您的问题。 从理论上来说,知识图谱是一种最新的人工智能应用技术,通过将各种形式的数据组织成标准化的知识节点,形成更为全面和准确的知识系统,进而为人工智能提供更加丰富的语境、精准的语义,实现深层次的意识理解和决策推理。 然而,知识图谱的实际应用领域还在不断拓展和深化中,需要在大数据处理、智能推荐、自然语言处理、金融、医疗等多个方面进行高效、精准的应用落地。为此,我们需要从以下几个方面来进行知识图谱实战的构建和应用: 一、数据采集和标准化: 构建知识图谱的第一步就是要将各种形式的数据进行采集和标准化,以便后续的处理和分析。这包括文本数据、图像数据、语音数据等,需要通过各种技术手段进行处理、清洗、去重、归一化等,保证数据的质量和完整性。 二、实体抽取和关系提取: 实体抽取是指识别文本中的实体对象,包括人名、地名、组织机构名等,在此基础上进行关系的提取和构建,形成知识图谱。这个过程需要使用自然语言处理、机器学习等技术,可以结合开源的工具和平台进行操作。 三、知识表示和语义分析: 在实体抽取和关系提取的基础上,需要对知识进行各种形式的表示和分析,以便更加深入和全面的了解和应用知识。这包括知识表达、知识推理、知识查询、知识可视化等多种方面,需要集成各种技术手段和算法来实现。 四、应用落地和推广: 最终的目的是将构建好的知识图谱应用到实际的业务场景中,包括金融、医疗、智能推荐等多个行业领域。这需要与各种企业和机构进行合作,并结合人工智能、云计算等技术手段,实现知识图谱智能化、精准化、高效化的应用。 总之,知识图谱实战的构建方法和行业应用是一个非常复杂和系统的过程,需要多个领域和多个方面的知识和技术来进行支撑和推进。我们需要不断学习和实践,不断探索和创新,才能更好的实现知识图谱的应用价值和推广潜力。

2023-03-16 09:13:26

产品特色