点击上方,选择星标置顶,每天给你送干货

阅读大概需要8分钟

跟随小博主,每天进步一丢丢

报道:新智元

来源:专知

编辑:元子

知识图谱是当下的研究热点。最近18位学者共同撰写了一篇《知识图谱》综述论文,讲述了知识图谱的创建、丰富、质量评估、细化和发布的方法,有130页pdf,547篇参考文献。「新智元急聘主笔、编辑、运营经理、客户经理,添加HR微信(Dr-wly)或扫描文末二维码了解详情。」

地址:

https://arxiv.org/abs/2003.02320

在本文中,我们对知识图谱进行了全面的介绍,在需要开发多样化、动态、大规模数据收集的场景中,知识图谱最近引起了工业界和学术界的极大关注。在大致介绍之后,我们对用于知识图谱的各种基于图的数据模型和查询语言进行了归纳和对比。我们将讨论schema, identity, 和 context 在知识图谱中的作用。我们解释如何使用演绎和归纳技术的组合来表示和提取知识。我们总结了知识图谱的创建、丰富、质量评估、细化和发布的方法。我们将概述著名的开放知识图谱和企业知识图谱及其应用,以及它们如何使用上述技术。最后,我们总结了未来高层次的知识图谱研究方向。

知识图谱的优势

尽管“知识图谱”一词至少从1972年就开始出现在文献中了[440],但它的现代形式起源于2012年发布的谷歌知识图谱[459],随后Airbnb[83]、亚马逊[280]、eBay[392]、Facebook[365]、IBM[123]、LinkedIn[214]、微软[457]、优步[205]等公司相继发布了开发知识图谱的公告。事实证明,学术界难以忽视这一概念的日益普及: 越来越多的科学文献发表关于知识图谱的主题,其中包括书籍(如[400]),以及概述定义(如[136])的论文,新技术(如[298,399,521]),以及对知识图谱具体方面的调查(如[375,519])。

所有这些发展的核心思想是使用图形来表示数据,通常通过某种方式显式地表示知识来增强这种思想[365]。结果最常用于涉及大规模集成、管理和从不同数据源提取价值的应用场景[365]。在这种情况下,与关系模型或NoSQL替代方案相比,使用基于图的知识抽象有很多好处。图为各种领域提供了简洁而直观的抽象,其中边捕获了社会数据、生物交互、书目引用和合作作者、交通网络等[15]中固有实体之间的(潜在的循环)关系。图允许维护者推迟模式的定义,允许数据(及其范围)以比关系设置中通常可能的更灵活的方式发展,特别是对于获取不完整的知识[2]。与(其他)NoSQL模型不同,专门的图形查询语言不仅支持标准的关系运算符(连接、联合、投影等),而且还支持递归查找通过任意长度路径[14]连接的实体的导航运算符。标准的知识表示形式主义——如本体论[66,228,344]和规则[242,270]——可以用来定义和推理用于标记和描述图中的节点和边的术语的语义。可伸缩的图形分析框架[314,478,529]可用于计算中心性、集群、摘要等,以获得对所描述领域的洞察。各种表示形式也被开发出来,支持直接在图上应用机器学习技术[519,527]。

总之,构建和使用知识图谱的决策为集成和从不同数据源提取价值提供了一系列技术。但是,我们还没有看到一个通用的统一总结,它描述了如何使用知识图谱,使用了哪些技术,以及它们如何与现有的数据管理主题相关。

教程目标:全面介绍知识图谱

本教程的目标是全面介绍知识图谱: 描述它们的基本数据模型以及如何查询它们;讨论与schema, identity, 和 context相关的表征;讨论演绎和归纳的方式使知识明确;介绍可用于创建和充实图形结构数据的各种技术;描述如何识别知识图谱的质量以及如何改进知识图谱;讨论发布知识图谱的标准和最佳实践;并提供在实践中发现的现有知识图谱的概述。我们的目标受众包括对知识图谱不熟悉的研究人员和实践者。因此,我们并不假设读者对知识图谱有特定的专业知识。

知识图。“知识图谱”的定义仍然存在争议[36,53,136],其中出现了一些(有时相互冲突的)定义,从具体的技术建议到更具包容性的一般性建议;我们在附录a中讨论了这些先前的定义。在这里,我们采用了一个包容性的定义,其中我们将知识图谱视为一个数据图,目的是积累和传递真实世界的知识,其节点表示感兴趣的实体,其边缘表示这些实体之间的关系。数据图(又称数据图)符合一个基于图的数据模型,它可以是一个有向边标记的图,一个属性图等(我们在第二节中讨论具体的替代方案)。这些知识可以从外部资源中积累,也可以从知识图谱本身中提取。知识可以由简单的语句组成,如“圣地亚哥是智利的首都”,也可以由量化的语句组成,如“所有的首都都是城市”。简单的语句可以作为数据图的边来积累。如果知识图谱打算积累量化的语句,那么就需要一种更有表现力的方式来表示知识——例如本体或规则。演绎的方法可以用来继承和积累进一步的知识(例如,“圣地亚哥是一个城市”)。基于简单或量化语句的额外知识也可以通过归纳方法从知识图谱中提取和积累。

知识图谱通常来自多个来源,因此,在结构和粒度方面可能非常多样化。解决这种多样性, 表示模式, 身份, 和上下文常常起着关键的作用,在一个模式定义了一个高层结构知识图谱,身份表示图中哪些节点(或外部源)引用同一个真实的实体,而上下文可能表明一个特定的设置一些单位的知识是真实的。如前所述,知识图谱需要有效的提取、充实、质量评估和细化方法才能随着时间的推移而增长和改进。

在实践中 知识图谱的目标是作为组织或社区内不断发展的共享知识基础[365]。在实践中,我们区分了两种类型的知识图谱:开放知识图谱和企业知识图谱。开放知识图谱在网上发布,使其内容对公众有好处。最突出的例子——DBpedia[291]、Freebase[51]、Wikidata[515]、YAGO[232]等——涵盖了许多领域,它们要么是从Wikipedia[232,291]中提取出来的,要么是由志愿者社区[51,515]建立的。开放知识图谱也在特定领域内发表过,如媒体[406]、政府[222,450]、地理[472]、旅游[11,263,308,540]、生命科学[79]等。企业知识图谱通常是公司内部的,并应用于商业用例[365]。使用企业知识图谱的著名行业包括网络搜索(如Bing[457]、谷歌[459])、商业(如Airbnb[83]、亚马逊[127、280]、eBay[392]、Uber[205])、社交网络(如Facebook[365]、LinkedIn[214])、金融(如埃森哲[368]、意大利银行[32][326]、彭博[326]、Capital One[65]、富国银行[355])等。应用包括搜索[457,459],推荐[83,205,214,365],个人代理[392],广告[214],商业分析[214],风险评估[107,495],自动化[223],以及更多。我们将在第10节中提供更多关于在实践中使用知识图谱的细节。

课程其余部分结构

  1. 第2节概述了图形数据模型和可用于查询它们的语言。

  2. 第3节描述了知识图谱中模式、标识和上下文的表示形式。

  3. 第四节介绍了演绎式的形式主义,通过这种形式主义,知识可以被描述和推导出来。

  4. 第5节描述了可以提取额外知识的归纳技术。

  5. 第6节讨论了如何从外部资源中创建和丰富知识图谱。

  6. 第7节列举了可用于评估知识图谱的质量维度。

  7. 第8节讨论知识图谱细化的各种技术。

  8. 第9节讨论发布知识图谱的原则和协议。

  9. 第10节介绍了一些著名的知识图谱及其应用。

  10. 第11节总结了知识图谱的研究概况和未来的研究方向。

  11. 附录A提供了知识图谱的历史背景和以前的定义。

  12. 附录B列举了将从论文正文中引用的正式定义。


投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

【知识图谱】史上最全《知识图谱》2020综述论文,18位作者, 130页pdf相关推荐

  1. 《知识图谱》2020综述论文,18位作者, 130页pdf,547篇参考文献

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :arvix.2003.02 ...

  2. 大数据系列sql基础知识(史上最全,收藏起来)

    大数据系列文章,从技术能力.业务基础.分析思维三大板块来呈现,你将收获: 1. 提升自信心,自如应对面试,顺利拿到实习岗位或offer: 2.掌握大数据的基础知识,与其他同事沟通无障碍: 3. 具备一 ...

  3. python基础知识资料包-Python基础知识总结——史上最全系列

    一.数据类型 1.可变数据类型 a.列表(list) 列表的系列函数: ①append():元素的追加,在列表的末尾添加新的值 列表名.append(新增的值) ②insert(下标,值):在指定下标 ...

  4. 史上最全java架构师技能图谱(下)

    "java架构史上最全技能图谱分为上下两篇,这是java架构史上最全图谱下篇,包含: 大数据以及性能.设计模式.UML.中间件.分布式集群.负载均衡.通讯协议.架构设计等技术图谱等章节. 如 ...

  5. python bool 转vc int_史上最全的 Python 3 类型转换指南

    史上最全的 Python 3 类型转换指南-1.jpg (13.76 KB, 下载次数: 0) 2018-8-21 17:35 上传 int 支持转换为 int 类型的,仅有 float.str.by ...

  6. 史上最全《知识图谱》2020综述论文!!!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 知识图谱是当下的研究热点.最近18位学者共同撰写了一篇<知识图谱>综述 ...

  7. 史上最全IT架构师技术知识图谱

    本文是多年来积累和收集的知识技能图谱,极力推荐分享给身边的技术人儿,希望这份技术知识图谱能够帮助到每一位奋斗在技术路上的小伙伴. 下面是多年来积累和收集的知识技能图谱,有的是原创总结的最佳实践,有的是 ...

  8. 史上最全java架构师技能图谱(上)

    java架构师最全技能图谱上篇,包含:数结构算法.java进阶.web开发.框架与工具四大技能图谱. 下篇将包含大数据以及性能.设计模式.UML.中间件.分布式集群.负载均衡.通讯协议.架构设计等技术 ...

  9. 史上最全JVM重点知识总结

    史上最全JVM重点知识总结 基于<深入了解java虚拟机>相关章节进行地重点知识归纳,同时面向企业面试,给出常见面试问题解析及自己的见解,如果有不正确的地方欢迎大佬们指正. 文章目录 1. ...

  10. 史上最全 | HBase 知识体系吐血总结

    史上最全 | HBase 知识体系吐血总结 本文转载大鱼的文章,原文地址:史上最全 | HBase 知识体系吐血总结 (qq.com) 如有侵权请私信删除: HBase 涉及的知识点如下图所示,本文将 ...

最新文章

  1. 友元类实例:日期类 学生类
  2. matlab中添加0向量,如何把在matlab中把a=0:0.1:pi变成列向量啊?
  3. 数据纪实|颜强:疫情下的中国制造
  4. 单个接口添加超时时间_SpringBoot使用Guava令牌桶对接口限流
  5. PHP Module
  6. sql server累计求和函数_SQL基础--SQL高级功能
  7. 人生苦短,我用python——当我在玩python的时候我玩些什么 -
  8. 重磅!2020年国家科技奖受理项目出炉,含钟南山院士团队项目!
  9. linux运行欧陆风云,Arm linux启动分析(1)
  10. linux下的僵尸进程 - Zombie
  11. python是否安装numpy_python 怎么查看安装numpy的版本
  12. 山东大学单片机原理与应用实验 3.8 ADC0808/9信号采集实验
  13. mysql 支持嵌套查询吗_【转】MySql 嵌套查询
  14. PHP调用芝麻商家平台(获取芝麻分)
  15. Warbler, A Little Birdie To Introduce Your Rails App To Java
  16. 470计算机毕业设计
  17. 一款功能强大的Web接口和网页测试工具
  18. iOS 监听手机屏幕旋转
  19. 系统监控——prometheus(普罗米修斯)的部署
  20. ODBC in Win7

热门文章

  1. hdu 1520 Anniversary party(第一道树形dp)
  2. 表单元素内容禁用拼写检查
  3. 使用框架开发的优势和劣势
  4. swing JTable
  5. 2017-2018-1 点集拓扑
  6. Linux命令行学习日志-ps ax
  7. Android中经常使用的工具类02
  8. 浅谈OWASP TOP 10
  9. c#面试3(选择题)
  10. 第一次用Axure~