本文作者为东南大学漆桂林老师,首发于知乎专栏知识图谱和智能问答


前面一篇文章“知识图谱之语义网络篇”已经提到了知识图谱的发展历史,回顾一下有以下几点:

1. 知识图谱是一种语义网络,即一个具有图结构的知识库,这里图的节点可以是概念(比如说大学),可以是实例(比如说东南大学),可以是一个literal(比如说一个数字,一个日期,一个字符串),而图的边就是一个关系(比如说漆桂林 就职于 东南大学,这里“就职于”就是一个关系)。

2. 语义网络的表达能力还是很强的,即一阶谓词逻辑可以表达的知识都可以用语义网络来表达。

3. 语义网络可以有逻辑推理能力,而推理可以通过规则来实现,也可以通过父子节点的继承实现。

那么,知识图谱到底有些什么用呢?知识图谱比较适合需要建立数据关联和需要从非结构化数据中转化出结构化数据的场景。下面是几个应用场景(还会持续更新,也欢迎提意见)。

一、语义搜索

知识图谱这个概念是谷歌提出的,谷歌做知识图谱自然是跟搜索引擎相关,即提供语义搜索。这里语义搜索跟传统搜索引擎的区别在于搜索的结果不是展示网页,而是展示结构化知识,如下图(图1)所示:

图1 语义搜索示例

在图1中,当用户输入“jackie chan",搜索引擎可以识别出jackie chan其实就是成龙,而且,会给出成龙的各种属性信息,比如说出生日期、国籍、配偶等。这些都是以前基于关键词的检索做不到的,有了知识图谱以后,就可以即问即答了。点击成龙的配偶“林凤娇”,可以直接进入她的知识卡片,见图2:

图2  语义导航示例

然后还可以继续点击房祖名看他的信息。这里我们可以把成龙、林凤娇、房祖名看出图的节点,成龙跟林凤娇之间有一个关系,即夫妻关系,林凤娇跟房祖名之间有一个关系,即母子关系,这就是成龙家庭的一个小的关系图谱。

二、股票投研情报分析

通过知识图谱相关技术从招股书、年报、公司公告、券商研究报告、新闻等半结构化表格和非结构化文本数据中批量自动抽取公司的股东、子公司、供应商、客户、合作伙伴、竞争对手等信息,构建出公司的知识图谱。在某个宏观经济事件或者企业相关事件发生的时候,券商分析师、交易员、基金公司基金经理等投资研究人员可以通过此图谱做更深层次的分析和更好的投资决策,比如在美国限制向中兴通讯出口的消息发布之后,如果我们有中兴通讯的客户供应商、合作伙伴以及竞争对手的关系图谱,就能在中兴通讯停牌的情况下快速地筛选出受影响的国际国内上市公司从而挖掘投资机会或者进行投资组合风险控制(图3)。

图3 股票投研情报分析

三、公安情报分析

通过融合企业和个人银行资金交易明细、通话、出行、住宿、工商、税务等信息构建初步的“资金账户-人-公司”关联知识图谱。同时从案件描述、笔录等非结构化文本中抽取人(受害人、嫌疑人、报案人)、事、物、组织、卡号、时间、地点等信息,链接并补充到原有的知识图谱中形成一个完整的证据链。辅助公安刑侦、经侦、银行进行案件线索侦查和挖掘同伙。比如银行和公安经侦监控资金账户,当有一段时间内有大量资金流动并集中到某个账户的时候很可能是非法集资,系统触发预警(图4)。

图4  公安情报分析

四、反欺诈情报分析

通过融合来自不同数据源的信息构成知识图谱,同时引入领域专家建立业务专家规则。我们通过数据不一致性检测,利用绘制出的知识图谱可以识别潜在的欺诈风险。比如借款人张xx和借款人吴x填写信息为同事,但是两个人填写的公司名却不一样, 以及同一个电话号码属于两个借款人,这些不一致性很可能有欺诈行为 (图5)。

图5 反欺诈情报分析

五、面向多源异构关系数据的自然语言问答

现在很多企业都有自己的数据库,而且这些数据库因为不是同一批人构建的,所以维护数据库的成本很高,访问数据库也很不方便,而且数据库之间的关联也很难发现。通过构建一个本体(该本体可以是从数据库的schema抽取后,然后通过人工来修改得到),然后构建本体和数据库的schema的映射以及数据之间的匹配,就可以方便的实现数据的集成和数据的语义关联,并且可以利用构建的本体和通过本体集成得到的知识图谱来对自然语言做解析,从而将自然语言查询直接转化为SQL去查数据库,并且给出答案,答案可以是用图表的方式来给出。下面给出一个例子(图6):

图6  数据库集成和问答系统示例


如用户提问“龙蟠路高铁南站出口2013年8月1日经过的本田车辆有哪些”,系统直接给出结果。


六、面向知识图谱的智能问答

最近几年,问答(Question answering)重新受到广泛的关注,主要原因还是因为有IBM Watson的出现(见The AI Behind Watson - The Technical Article)。Watson虽然号称可以做很多领域(比如说法律有ROSS ROSS and Watson tackle the law - Watson),但是事实上,Watson最早提出的时候只是为智力竞赛节目Jeopardy(Jeopardy! Official Site | Jeopardy.com,类似开心辞典和一站到底)定制的,类似下面这种:

Category: General Science


Clue: When hit by electrons, a phosphor gives off electromagnetic energy in this form.


Answer: Light (or Photons)

也就是说,问题会有一些分类,然后出题的人会给出一些暗示(Clue),做题的人或者机器根据这些暗示给出答案。

Watson的问答系统采用了wikipedia和DBpedia、Yago等半结构化数据以及图谱数据,但是更多的还是从文本中提取各种证据(evidence)来回答。IBM Watson系统架构见下图(图7)。

图7  IBM Watson系统架构

IBM Watson系统被神化成可以在任何领域适用,导致只要做问答相关项目,都容易被挑战跟Watson有什么差异。事实上,Watson系统和很多人工智能系统一样,是高度定制化的,当然,相关技术确实是可以用到多个领域,但是需要有一定的变化。

东南大学认知智能研究所借鉴了Watson技术,启动了一个佛学考试机器人项目,旨在回答佛学相关问题。为了做这个系统,需要先构建一个佛学知识图谱,通过图谱和佛学相关的网页,利用问答技术解题。考试题目例子如下:

1.僧伽是①涅槃义②和合众③杀贼义。

2.「诸行无常、诸法无我、涅盘寂静」称为①三种无常②三法印③三乘道。

3.人生最大的错误是①杀生②妄语③邪见。

下面是系统的截屏:

七、辅助判案

知识图谱技术可以帮助我们快速构建一个法律知识图谱,目前还缺乏法律知识图谱的理论工作。跟其他领域的知识图谱相比,法律知识图谱需要考虑法律的逻辑,下面就是一个法律知识图谱的片段:

从上面这个例子可以看出,每一个犯罪行为都有主体、客体、主观要件和客观要件,我们就需要从文本中去抽取这些信息,从而形成一个关于犯罪行为的图谱,而通过对海量判决书的挖掘,可以建立犯罪行为之间的关联,比如说,防卫过当和故意伤害之间有一个关联,即误判为的关系。通过这个图谱,给定一个判决书,可以辅助法官判的一个案件是否有误判,是否需要补充信息。

致谢:感谢王昊奋博士对本文部分内容的建议。


OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

漆桂林 | 知识图谱的应用相关推荐

  1. 干货 知识图谱研究青年学者研讨会在清华大学顺利召开刘知远 报告题目:大规模知识图谱表示学习的研究趋势与挑战

    2015年6月27日,中国中文信息学会青年工作委员会系列学术活动??知识图谱研究青年学者研讨会在清华大学FIT大楼多功能报告厅召开.本次活动由青工委和中文信息学会语言与知识计算专委会联合举办,旨在推动 ...

  2. 研讨会 | 知识图谱助力图书馆知识管理与智慧服务研讨会

    知识图谱是大数据时代重要的知识表示方式之一,也是人工智能技术的重要支撑,在智能检索.数据分析.自动问答.知识推荐.知识管理等领域有着广泛的应用前景,为知识创新管理带来了新机遇.由于知识图谱实现了对象识 ...

  3. 漆桂林 | 人工智能的浪潮中,知识图谱何去何从?

    本文转载自公众号:AI科技大本营. 近年来,随着人们对 AI 认知能力的积极探索,知识图谱因其表达能力强.拓展性好,基于知识进行推理等优势得到了学界与业界的高度关注.知识图谱,旨在描述客观世界概念.实 ...

  4. 人工智能 漆桂林_领域专家走进平安科技(PA Tech),共议知识图谱为医疗AI赋能路径...

    [科技讯]4月25日消息,近日,平安科技(PA Tech)邀请国内知识图谱领域领军人物与领域专家,共同探讨知识图谱领域的最新发展与远景,以及在医疗健康.保险等产业领域的落地运用. 知识图谱是一种大规模 ...

  5. 一站式了解多模态、金融、事理知识图谱构建指南 | AI ProCon 2020

    整理 | 许爱艳 出品 | AI科技大本营(ID:rgznai100) [导读]7 月 3-4 日,由 CSDN 主办的第三届 AI 开发者大会(AI ProCon 2020)在线上举行.本次大会有超 ...

  6. 谁能解答我对知识图谱的上百个疑问?

    近日,我们采访了东南大学认知智能研究所所长漆桂林教授和复旦大学知识工场实验室负责人肖仰华教授,围绕知识图谱这两年在研究与产业应用道路上的一些进展与仍面临的问题.漆桂林教授提到,近两年,知识图谱的研究在 ...

  7. 人工智能的浪潮中,知识图谱何去何从?

    漆桂林认为,目前知识图谱整个领域最关注的问题还是如何能够高效.低成本构建知识图谱,而这个问题对于研究人员来说,仍是一个非常大的挑战,比如现在大家都在关注如何在少量甚至无标注场景下进行知识图谱构建. 记 ...

  8. 转载 干货 | 陪伴我学习NLP、知识图谱的那些资源(教程+书籍+网站+工具+论文...可以说很全面了)

    https://blog.csdn.net/guleileo/article/details/81140179 干货 | 陪伴我学习NLP.知识图谱的那些资源(教程+书籍+网站+工具+论文...可以说 ...

  9. 干货 | NLP、知识图谱教程、书籍、网站、工具...(附资源链接)

    来源:人工智能头条 本文多资源,建议阅读收藏. 本文整理了关于 NLP 与知识图谱的众多参考资源,涵盖内容与形式非常丰富. [ 导读 ]本文作者一年前整理了这份关于 NLP 与知识图谱的参考资源,涵盖 ...

最新文章

  1. 复习计算机网络day1-计算机网络的初步了解
  2. 学习python一开始枯燥_编程零基础应当怎样开始学python?他说,看这三个经典方法...
  3. 百篇大计敬本年之C++坎坷之路 —— Warning:will be initialized after [-Wreorder]
  4. 构建高性能ASP.NET应用的12点建议
  5. 不正确的c语言语句是,最基本的C语言语句是( )
  6. Java实现冒泡排序及其优化
  7. Kappa电商负责人顾皓澜:电商业务一直保持盈利
  8. Web Storage中的sessionStorage和localStorage
  9. DeepLearning - Forard Backward Propogation
  10. element ui下拉框实现
  11. ffmpeg推拉流优化方案
  12. 9.深入浅出:集成运放内部电路分析——参考《模拟电子技术基础》清华大学华成英主讲
  13. openGauss数据库日志管理指导
  14. 假设检验实例(python)
  15. java交通调度,java毕业设计_springboot框架的的车辆调度管理系统
  16. FPGA采集AD7606串行输源码加讲解
  17. 手机2020 QQ 群文件下载存储路径
  18. 蓝桥杯青少年创意编程 C++组 国赛(第11届、第12届、第13届)
  19. Windows下faceswap的安装
  20. 面试专家职位面试官会问什么

热门文章

  1. 从网上看到的很搞笑的东西
  2. boost.asio防止恶意空连接的方法
  3. C语言中字符型和字符串型的对比
  4. 如何学好单片机?​嵌入式第一门课
  5. 陆奇给工程师们的5个建议
  6. Linus Torvalds:我们都老了,但Linux维护者真的很难找
  7. 分享一个非常 nice 的工具
  8. STM32F7xx —— CAN通信
  9. Pandas使用小技巧
  10. 决策树——CART和模型树