本文转载自公众号:DI数据智能


Learning to Complete Knowledge Graphs with Deep Sequential Models

作者:郭凌冰、张清恒、胡伟、孙泽群、瞿裕忠

单位:南京大学

供稿:胡伟

引用

L. Guo, Q. Zhang, W. Hu, Z. Sun, & Y. Qu. Learning to complete knowledge graphs with deep sequential models. Data Intelligence 1(2019), 224-243. doi: 10.1162/dint_a_00016


文章总结

知识图谱通常会使用三元组来记录数以亿计的真实世界事实,这些三元组可写成 (h, r, t) 的形式,其中 ht表示实体,r表示 ht之间的关系。当前的知识图谱还远未包含所有知识,所以需要知识图谱补全任务。现有工作关注的是一类被称为实体预测(也称链接预测)的任务,其要求根据给定的 (h, r, ?) 或 (?, r, t) 来预测对应的 th,从而补全知识图谱中的三元组。

尽管之前的模型已在实体预测上取得了良好的表现,但它们仍不够实用。假设有一个模型可以基于给定的关系 r而有效地补全一个实体 h。但是如果不提供任何关系,那么这个模型就无法补全 h,因为它无法获知用于完善这个实体的关系。实际上,知识图谱的底层数据模型并不允许任何不完整的元组 (h, r) 存在。

循环神经网络(RNN)是一种神经序列模型,在语言建模、机器翻译等许多自然语言处理任务上取得了优良的效果。知识图谱中的三元组可被近似看作是一个长度为3的简单句子。但是,我们依然面临着以下建模难题:

(1)三元组不是自然语言。它们是用一种固定的表达方式 (h, r, t) 建模的复杂结构。这样短的序列可能不足以为预测提供足够的上下文信息。同时,由于路径数量巨大,构建有价值的长序列又具有很高的成本,难度也大。

(2)在三元组中,关系和实体是以固定顺序出现的两种不同类型的元素。将它们视为同类型元素很可能是不合适的。

为解决上述问题,本文提出了一种适于知识图谱的深度序列模型DSKG (a deep sequential model),其中使用了一种新型结构的 RNN。本文的主要贡献包括:

  • 提出了一种新的知识图谱补全方法,通过扩展多层RNN将知识图谱建模成长度为3的序列。提出了3种不同策略来集成RNN单元,并通过实验展示了它们的不同特点。

  • 设计了两种新的知识图谱补全任务,分别称为关系预测和三元组预测,作为实体预测任务的补充。关系预测仅输入头实体(或尾实体)来预测关系,而三元组预测则仅输入头实体来预测整个三元组。

  • 实验结果显示,在实体预测基准测试集上,本文方法能够取得当前先进的结果。同时,方法也在新的关系预测和三元组预测任务上展现出较高的潜力。


作者简介

郭凌冰是南京大学计算机科学与技术系的硕士研究生。他于2016年获得河南大学计算机专业的学士学位。他的研究兴趣为知识图谱补全。

张清恒是南京大学计算机科学与技术系的硕士研究生。他于2017年获得河海大学计算机专业的学士学位。他的研究兴趣为知识图谱嵌入。

胡伟是南京大学计算机软件新技术国家重点实验室、计算机科学与技术系的副教授。他分别于2005年和2009年获得东南大学计算机专业的学士学位和博士学位。他的研究兴趣包括知识图谱、数据集成和智能软件。

孙泽群是南京大学计算机科学与技术系的博士研究生。他于2016年获得河海大学计算机专业的学士学位。他的研究兴趣为实体对齐。

瞿裕忠是南京大学计算机软件新技术国家重点实验室、计算机科学与技术系的教授。他分别于1985年和1988年获得复旦大学数学专业的学士学位和硕士学位,于1995年获得南京大学计算机专业的博士学位。他的研究兴趣包括语义网、智能问答和Web软件新技术。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 | 基于深度序列模型的知识图谱补全相关推荐

  1. 论文浅尝 | 可建模语义分层的知识图谱补全方法

    本文转载自公众号:PaperWeekly. 论文作者:蔡健宇,中国科学技术大学,研究方向:知识图谱 近些年,知识图谱(Knowledge Graph)在自然语言处理.问答系统.推荐系统等诸多领域取得了 ...

  2. 论文浅尝 | 用于低资源条件下知识图谱补全的关系对抗网络

    论文作者: 邓淑敏,浙江大学在读博士,研究方向为低资源条件下知识图谱自动化构建关键技术研究. Ningyu Zhang, Shumin Deng, Zhanlin Sun, Jiaoyan Chen, ...

  3. 论文浅尝 | 基于超平面的时间感知知识图谱嵌入

    链接:http://talukdar.net/papers/emnlp2018_HyTE.pdf 本文主要关注 KG embedding 中三元组成立的时间有效性问题,比如三元组(Cristiano ...

  4. 论文浅尝 | 基于多模态关联数据嵌入的知识库补全

    链接:https://arxiv.org/pdf/1809.01341.pdf 动机(摘要) 当前的知识库补全的方法主要是将实体和关系嵌入到一个低维的向量空间,但是却只利用了知识库中的三元组结构 (& ...

  5. 论文浅尝 - ACL2020 | IntKB: 一种交互式知识图谱补全框架

    笔记整理 | 谭亦鸣,东南大学博士 来源:  ACL 2020 链接:https://www.aclweb.org/anthology/2020.coling-main.490.pdf 资源:http ...

  6. 论文浅尝 | 基于深度强化学习将图注意力机制融入知识图谱推理

    论文笔记整理:陈名杨,浙江大学直博生. Introduction 知识图谱(KGs)在很多NLP的下游应用中起着越来越重要的作用.但是知识图谱常常是不完整的,所以解决知识图谱补全的任务也非常重要.主要 ...

  7. 论文浅尝 | Data Intelligence 已出版的知识图谱主题论文

    本文转载自公众号:DI数据智能.   知识图谱被称为人工智能的基石,它的前身是语义网,由谷歌在2012年率先提出,用于改善自身的搜索业务.Data Intelligence执行主编.东南大学计算机科学 ...

  8. 论文浅尝 | 区分概念和实例的知识图谱嵌入方法

    链接:https://arxiv.org/pdf/1811.04588.pdf 知识图谱的表示学习最近几年被广泛研究,表示学习的结果对知识图谱补全和信息抽取都有很大帮助.本文提出了一种新的区分概念和实 ...

  9. 论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

    论文链接:https://arxiv.org/pdf/1805.09927.pdf 来源:ACL2018 Motivation: 远程监督是以一种生成关系抽取训练样本的方法,无需人工标注数据.但是远程 ...

最新文章

  1. 前端笔记之NodeJS(三)Expressejs模板引擎请求识别
  2. 【Android NDK 开发】NDK 交叉编译 ( Ubuntu 中交叉编译动态库 | Android Studio 中配置使用第三方动态库 )
  3. 4.12—002—周五
  4. easyuI企业管理系统-实战三 添加功能
  5. python编码-python中处理中文编码问题
  6. php与mysql基础教程第二版_PHP 和 MySQL 基础教程(二)
  7. C++中未初始化的bool值的问题
  8. 狂团KtAdmin框架正式免费开源发布,助力独立版SAAS系统快速开发
  9. 3dmax:3dmax动画栏(加载动画【IK计算器、约束、变换控制器、参数编辑器、关联参数、骨骼工具】、关键帧动画【修改关键帧、运动面板、曲线编辑器】、控制器动画【控制器指定】)之详细攻略
  10. python 如何判断一个三位数是不是水仙花数
  11. java手机连点脚本_自动连点器app下载 自动连点器(屏幕点击器) for Android v1.0 安卓版 下载-脚本之家...
  12. 记2019届阿里校招第一面
  13. 国外免费电子书资源下载
  14. 怎么在matlab画双坐标,如何利用matlab的plotyy函数画双坐标图??
  15. FX5U编程常用特殊软元
  16. building workspace js validation
  17. 人脸检测通用评价标准
  18. Python是什么?Python基础教程400集大型视频,全套完整视频赠送给大家
  19. 【正则】二代身份证正则表达式
  20. PV、UV、VV、IP的区别

热门文章

  1. InterDev 调试错误信息: Unable to set server into correct debugging state automatically....的解决办法...
  2. Postgres主进程文件—postmaster.pid
  3. c/c++整理--c++面向对象(2)
  4. 三极管的“非教科书式”解析,什么正偏、反偏都统统滚蛋!
  5. 为什么需要超过48k的采样音频?
  6. python逆序数的程序_计算逆序数(归并法)程序问题 (Python)
  7. idea spring tomcat启动失败_技术篇 | 实用IDEA插件和工具系列
  8. 简单线性回归(Simple Linear Regression)和多元线性回归(Multiple Regression)学习笔记
  9. php开发环境 ubuntu,Ubuntu配置PHP开发环境
  10. ipconfig不是内部或外部_晶振有什么作用,如何选择合适的晶振,为什么有时候用内部晶振?...