论文笔记整理:陈名杨,浙江大学在读博士生,主要研究方向为知识图谱表示学习。


论文来源:ICML 2020

Introduction

当前在知识图谱上(KnowledgeGraph,KG)进行关系预测的很多方法都依靠在对知识图谱中的实体和关系都学习一个潜在的表示(Latent Representation)也就是嵌入(Embedding)。但是这种方法一般来说有两个缺点,第一,这一类基于嵌入的方法并没有显式对捕获知识图谱中的规则;第二,这一类方法需要对所有的实体都学习一个表示,仅仅局限于transductive的设定,也就是说,只能对训练集中见过的并且已经学习过表示的实体进行关系预测,而无法在inductive的场景,也就是归纳式的场景下,对在训练集中没有见过的实体进行关系预测。这篇论文提出一种基于图神经网络(Graph Neural Network,GNN)的关系预测框架Graph Inductive Learning(GraIL)来解决在知识图谱上进行归纳式关系预测的问题。

下面图1中对transductive和inductive的推理进行举例,简单来说inductive可以处理在训练的时候没有见过的实体而transductive则不行。

图1 Transductive和Inductive推理举例

那么如何才能进行归纳式的关系推理。换一个角度看,关系推理可以是一个逻辑归纳的问题,也就是如何从已有的知识图谱中归纳出关系并且在预测的时候利用关系。下图2中是一个规则的示例。当模型可以捕获到规则的信息,那么就可以对没有见过的实体进行关系预测了。

图2 规则示例

Method

模型设计的是让该模型可以捕获到KG中潜在的规则,而不用对每一个实体学习一个专门的表示。这里的假设是对于两个需要被预测关系的目标节点(目标实体),它们之间的路径包含了被预测关系的信息。整个模型分为三个步骤

1.对于两个目标关系,采样出它们之间的周围局部路径图结构;

2.对局部图中的节点的表示进行初始化,初始化中包含了相关的结构信息;

3.利用图神经网络进行消息传递,利用得到的节点表示和整个局部图表示进行关系预测。

图3是模型整体示例,下面将对每个步骤进行解释。

图3 模型整体示例

子图挖掘(SubgraphExtraction)。对两个目标节点,取它们周围k-hop的周围子图,然后对两个子图求交集,最终去掉独立的点以及与两个点距离大于k的点。这样的操作可以得到在两个目标节点距离最长k+1的所有路径作为子图。

节点标签(NodeLabeling)。图神经网络的操作一般需要节点具有特征表示作为初始化,但在这里假设没有任何KG的特征表示。这里通过度量每个点和目标节点的距离对节点进行表示,例如对于目标节点为u, v的子图,其中的一点i,用一个元组(d(i, u), d(i, v))表示,其中d(. , .)表示两点最短距离。特别的u, v两点分别以(0, 1),(1, 0)进行表示。节点的初始化特征表示就用对该特征的one-hot编码进行表示。

利用图神经网络打分(GNNScoring)。这里借鉴了R-GCN的方法来建模对多关系图的消息传递,区别在于增加了一个注意力机制,该注意力机制不仅仅和两个相邻节点以及它们之间的关系有关,也和需要被预测的目标关系有关。最终利用两个目标节点的表示,整个图的表示,以及被预测被预测关系的表示,对该目标节点之间具有该目标关系进行打分,得分最高的目标关系为被预测关系。

Experiments

作者在本文中将该方法和一些其他可以利用与归纳式关系预测场景的方法在标准数据集上进行对比,得到如下结果。

同时作者也在transductive的场景下进行实验,将该模型和一般的KGE模型进行融合说明其方法带来的提升。

同时,作者还对模型进行消融实验(AblationStudy)来说明各部分的有效性。

Conclusion

这篇文章提出了一种模型可以解决在知识图谱下的归纳式关系预测(InductiveRelation Prediction)。区别于一般的基于嵌入的方法,该方法并不是对每一个实体学习一个表示,则可以处理没有见过的实体。文章的实验证明了作者的观点,inductive relation prediction的方法也有很多值得挖掘的地方。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 - ICML2020 | 基于子图推理的归纳式关系预测相关推荐

  1. 论文浅尝 | GraphSAINT—基于图采样的归纳学习方法

    论文笔记整理:杨海宏,浙江大学博士生,研究方向为开放世界下的多语言知识问答. 1. 简介 受显存的因素限制,应用图神经网络于大规模图学习任务上面临"邻居爆炸(Neighbor Explosi ...

  2. 论文浅尝 | AMUSE: 基于 RDF 数据的多语言问答语义解析方法

    来源:ISWC 2017 链接:https://link.springer.com/content/pdf/10.1007%2F978-3-319-68288-4.pdf 本文主要关注基于RDF数据的 ...

  3. 论文浅尝-综述 | 基于强化学习的知识图谱综述

    转载公众号 | 人工智能前沿讲习 论文来源:https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.20211264 摘要:知识图谱是一种用图结构建模事物及事物 ...

  4. 论文浅尝 - IJCAI2020 | KGNN:基于知识图谱的图神经网络预测药物与药物相互作用...

    转载公众号 |  AI TIME 论道 药物间相互作用(DDI)预测是药理学和临床应用中一个具有挑战性的问题,在临床试验期间,有效识别潜在的DDI对患者和社会至关重要.现有的大多数方法采用基于AI的计 ...

  5. 论文浅尝 - WSDM20 | 基于弱监督及逐步推理的多关系知识图谱问答

    论文笔记整理:刘晓臻,东南大学计算机科学与工程学院本科生. 来源:WSDM '20 链接:https://dl.acm.org/doi/abs/10.1145/3336191.3371812 动机 知 ...

  6. 论文浅尝 - AAAI2021 | 基于对比学习的三元组生成式抽取方法

    作者 | 叶宏彬,浙江大学博士研究生,研究方向:知识图谱.自然语言处理 接收会议 | AAAI2021 论文链接 | https://arxiv.org/pdf/2009.06207.pdf 摘要 在 ...

  7. 论文浅尝 - ICML2020 | 对比图神经网络解释器

    论文笔记整理:方尹,浙江大学在读博士,研究方向:图表示学习. Contrastive Graph Neural Network Explanation 动机与贡献 本文主要关注图神经网络的解释性问题, ...

  8. 论文浅尝 - CVPR2020 | 基于网格特征的可视问答系统

    论文笔记整理:李爽,天津大学. 链接:https://arxiv.org/pdf/2001.03615v1.pdf 动机 随着"自下而上"注意力的普及,基于边界框(或区域)的视觉特 ...

  9. 论文浅尝 | 为基于知识库的问答构建形式查询生成

    论文笔记整理:刘晓臻,东南大学计算机科学与工程学院本科生. Citation: H.Zafar, G. Napolitano, and J. Lehmann. Formal query generat ...

最新文章

  1. 【整合篇】Activiti业务与流程的整合
  2. Python的设计定位
  3. 华为机考回忆版(三:自己的)
  4. Oracle Code登录北京 代码盛宴邀你high起来|免费报名
  5. 解决Gradle生成Eclipse支持后,发布到Tomcat丢失依赖jar包的问题
  6. Java并发系列—并发编程挑战
  7. ASPEN hysys焓值、熵值转化换算
  8. Labview程序优化
  9. 百亿级全网舆情分析系统存储设计
  10. Mac电脑如何新建txt文档?
  11. 【Office 365 2108更新】
  12. win7字体_潇洒个性艺术!100款英文手写签名字体
  13. 【WPS】您选定的文件类型不支持包含多份工作表的工作簿。
  14. LeetCode-Hot100-无重复字符的最长子串
  15. qt实现扫雷游戏一:算法实现
  16. 大一上学期C语言不熟知识点学习总结
  17. POI删除Excel中数据有效性
  18. java learn 日期
  19. PHP png合并到jpg,合并jpg的png并保持与php的透明度
  20. 线性代数——坐标系空间转换

热门文章

  1. CYQ.DBImport 数据库反向工程及批量导数据库工具 V2.0 发布[增加批量导出数据库脚本及数据库设计文档]...
  2. 排序 八种经典排序算法
  3. Linux内核设计的艺术
  4. mysql中定时任务_mysql中定时任务的用法
  5. NILMTK——经典数据集REDD介绍和使用
  6. vue里实现同步执行方法_vue中的watch方法 实时同步存储数据
  7. mysql连接池_数据库技术:数据库连接池,Commons DbUtils,批处理,元数据
  8. 完善获取数据库数据的写法
  9. 论文阅读 - Group Normalization
  10. LeetCode 2207. 字符串中最多数目的子字符串(前缀和)