论文浅尝 | 动态知识图谱对齐
论文笔记整理:谭亦鸣,东南大学博士生
来源:AAAI‘21
链接:https://ojs.aaai.org/index.php/AAAI/article/view/16585
概述
本文提出了一种动态图谱(KG)对齐方法,在“动态”(即图谱可能随时间更新)的设定下,作者认为该任务的难点在于实体embedding的更新,因为KG更新后拓扑结构也会随之变化,而实体embedding与图谱结构高度相关。所提方法DINGAL-系列的核心思路是将KG表示学习使用的GCN参数矩阵视作特征转换操作,从而减少转换和聚合过程间的耦合。在与现有的14个方法在DBP15K数据集上的对比结果表明,论文方法取得不错性能,且提升了对齐速度。
背景与动机
这篇论文定义的实体对齐任务目标是将不完整的KG之间通过建立链接,获得一个完整KG的过程(如图1)。作者表示,现有对齐方法普遍假定KG是静态的,而事实上KG应该是处于一个更新和发展的过程中。基于此,论文提出了一个扩展的对齐任务:动态图谱对齐。
贡献
作者总结其贡献如下:
1.定义了动态图谱对齐问题,并第一个展开研究2.提出了新的算法,DINGAL系列,包括DINGAL-B(静态对齐)和GINGAL-O以及GINGAL-U面向动态对齐3.实验对比现有14种对齐模型取得了性能超越,并且系列算法取得了更快的运行速度
方法
图2给出了本文算法的描述,B算法用最初KG得到embedding,O和U的主要区别在于O沿用了B算法预训练参数对图谱更新后受到影响的节点作表示学习。而U则使用了一个全新的锚链接来更新参数。
图3给出了传统GCN过程,一个聚合-再-转换的函数。节点首先聚合它的邻居特征,然后这些特征通过一个线性转换矩阵投影到隐空间。
在传统方式下随KG结构变化来动态更新图谱embedding要求变化最好只发生在受影响的一小部分节点上。解决方向在于切断图谱拓扑结构与GCN参数矩阵之间的耦合。
作者首先将节点嵌入矩阵通过线性转换投影到一个隐空间,然后基于L聚合邻居节点的特征。DINGAL-B的流程如图4所示,对于任一实体的输入特征X,首先进入一个拓扑不变mask门M(公式2),该公式表示Hadamard乘积,用于确定特征不同维度的重要性(类似注意力机制)。
接着mask门的输出被输入到一个GCN层(公式3)
同时这个GCN层输出和mask门的输出一同输入到highway门(公式4)
最终网络的输出为:
接着使用以下的公式来衡量两个节点的距离:
对于DINGAL-O,首先保留了B方法的所有参数,在动态更新中更新那些受到影响的实体embedding。单跳受影响实体被定义为新实体(新增实体)和老实体(增加删除边操作),不考虑删除的实体,因为它们不参与动态对齐。图5给出了一个受影响节点划定的例子。
在O方法中,受影响更新的实体embedding的获取方式如公式8:
La表示局部拉普拉斯矩阵,来自全局L矩阵,La的范围由受影响的一跳邻居的size决定。
实验
实验使用的数据集是DBP15K,包含三种语言对,覆盖15K预对齐实体。
静态实验还是沿用DBP15K的常规切分测试集
动态实验,作者随机将DBP15K里的对齐对切分为三个动态时间步。在对于开始时间t0,KG移除3000个对齐的实体对以及链接到它们的边。对于任何不属于ground-truth的实体,如果它由于时间的变化而成为一个孤立的实体,它就会被删除。在时间步t1,1500个对齐的对以及与其链接的孤立实体将在t0被添加到KG对,这将在时间步t1形成新的KG对。
数据集评价指标为Hits@1和Hits@10
主要实验结果如下:(表1消融分析,w/o highway门,mask门,以及单层网络的效果),从结果看起来highway门是性能提升的主要原因
表2和3是动态对齐实验结果
作者也给出了结果,论述实验时间效率上所提方法相比已有方法有明显效率提升。
OpenKG
OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。
点击阅读原文,进入 OpenKG 网站。
论文浅尝 | 动态知识图谱对齐相关推荐
- 论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述
随着监督学习在机器学习领域取得的巨大发展,如何减少人工在样本方面的处理工作,以及如何使模型快速适应层出不穷的新样本,成为亟待解决的问题.零样本学习(Zero-Shot Learning, ZSL)的提 ...
- 论文浅尝 | 「知识图谱」领域近期值得读的 6 篇顶会论文
本文转载自公众号:PaperWeekly. CIKM 2017 ■ 论文 | Hike: A Hybrid Human-Machine Method for Entity Alignmentin La ...
- 论文浅尝 - ICLR2020 | 知识图谱中数值规则的可微学习
论文笔记整理:许泽众,浙江大学博士研究生.研究方向:知识图谱,规则挖掘等. 论文链接:https://openreview.net/pdf?id=rJleKgrKwS 本文解决的是规则的学习问题,学习 ...
- 论文浅尝 - ESWA | 知识图谱的自动扩充方法
论文笔记整理:谭亦鸣,东南大学博士. 来源:ESWA141(2020) 链接:https://www.sciencedirect.com/science/article/abs/pii/S095741 ...
- 论文浅尝 \ 联合知识图谱实例和本体概念的通用表示学习
论文笔记整理:周虹廷,浙江大学研究生.研究方向:知识图谱,图表示学习等. 论文链接: http://web.cs.ucla.edu/~yzsun/papers/2019_KDD_JOIE.pdf 本文 ...
- 论文浅尝 | 解决知识图谱补全中的长尾关系和不常见实体问题
论文笔记整理:汪寒,浙江大学硕士. 链接:https://www.aclweb.org/anthology/P19-1024.pdf 动机 KG的分布遵循长尾分布,大部分关系只有很少的三元组,且大体趋 ...
- 论文浅尝 | 利用知识图谱嵌入和图卷积网络进行长尾关系抽取
论文笔记整理:王狄烽,南京大学硕士,研究方向为关系抽取.知识库补全. 链接:https://arxiv.org/pdf/1903.01306.pdf 发表会议:NAACL2019 动机 现有的利用远程 ...
- 论文浅尝 | 从知识图谱流中学习时序规则
论文笔记整理:汪寒,浙江大学硕士,研究方向为知识图谱.自然语言处理. 链接:http://ceur-ws.org/Vol-2350/paper15.pdf 动机 知识图谱是现在十分流行的数据管理方式, ...
- 论文浅尝 | 对于知识图谱嵌入表示的几何形状理解
论文链接:http://anthology.aclweb.org/attachments/P/P18/P18-1012.Presentation.pdf 发表会议:ACL 2018 摘要 知识图谱的嵌 ...
最新文章
- 300秒搞定第一超算1万年的计算量,量子霸权时代已来?
- 找回丢失的mysql root 用户密码
- 皮一皮:落伍了落伍了
- QOS是什么?(Quality of Service,服务质量)
- php 命名空间 create_function,PHP create_function()注入命令执行漏洞
- ICS SIP Call移植
- 大剑无锋之mysql列转行【面试推荐】
- python自然语言处理评论_python自然语言处理——学习笔记:Chapter3纠错
- 生成javascript正则表达式语法图
- java网页快照_java网页快照-网页转存为图片
- HTML Img(Type)
- TokenInsight:反映区块链行业整体表现的TI指数较昨日同期上涨2.62%
- Extjs核心概念之Store
- Embeded linux之地址映射
- 2012服务器在IIS部署的SLL(https)网址谷歌浏览器无法访问的问题解决
- 计算机word简历制作教程,用word制作个人简历的方法
- DS_PTA18 图4 哈利·波特的考试
- MongoDB特点和使用场景
- 仿照登录界面实现网站的注册
- 【管理心得之八】通过现象看本质,小王和小张谁更胜任?
热门文章
- Linux文件夹权限如何更改?
- pthread_join()函数理解
- 手机充电IC设置电流与实测电流不一致问题剖析
- 由c语言转向c++,我们需要做什么?
- 啥叫旁路电容?啥叫去耦?可以不再争论了吗
- 基于STC89C52的韦根数据接收
- Bootloader传参数到Kernel
- 本地html页面传递表单值,js实现两个页面表单传值并接收
- Datawhale组队-Pandas(下)时序数据(打卡)
- java调用sql返回list_Spring JdbcTemplate实现有java.sql.ResultSet结果集返回的存储过程调用 | 学步园...