笔记整理:张清恒,南京大学计算机科学与技术系,硕士研究生。


论文链接:https://people.eng.unimelb.edu.au/jianzhongq/papers/AAAI2019_EntityAlignment.pdf

发表会议:AAAI 2019

摘要

近来,针对跨知识图谱(KGs)的实体对齐任务,研究者提出并改进了多种基于embedding的模型。这些模型充分利用实体与实体之间的关系以得到实体之间的语义相似度,换言之,这些模型更关注于关系三元组(relationship triple)。本文发现KG中存在着大量的属性三元组(attribute triple),本文提出的模型利用属性三元组生成 attributecharacter embeddings,使其帮助不同KG中的实体映射到同一空间中。与此同时,模型还使用传递规则进一步丰富三元组。实验结果表明,相比于现有方法,本文提出的模型在实体对齐任务上取得了较大的提升。

模型介绍

1. 概览

如图1所示,该模型由三个核心部分组成,分别是谓词对齐(predicate alignment)、嵌入学习(embedding learning)和实体对齐(entity alignment)。

2. Predicate Alignment

该模块通过重命名潜在对齐的谓词将两个KG合并成一个KG。通过计算谓词的名称(URI的最后一部分)相似度,发现潜在对齐的谓词对,然后使用统一的命名格式将其重命名。例如,将对其的谓词对,“dbp:bornIn”和“yago:wasBornIn”重命名成“:bornIn”。

3. Embedding Learning

3.1 Structure Embedding

Structureembedding模块采用TransE实现,与TransE不同的是,模型希望更关注

已对齐的三元组,也就是包含对齐谓词的三元组。模型通过添加权重来实现这一目的。Structure embedding的目标函数如下:

其中,count(r) 是包含的三元组的数量,表示合并之后的三元组集合。

3.2 Attribute Character Embedding

structure embedding 一样,attribute character embedding 也借鉴了 TransE 的思想,把谓词作为头实体与属性值之间的转换媒介。但与 structure embedding 不同的是,对于相同含义的属性值,在不同的KG中表现形式存在差别。因此,本文提出了三种属性值组合函数。在组合函数编码属性值之后,模型希望属性三元组满足 h+r≈f_a(a),其中 f_a(a) 是组合函数,表示属性值的字符串 a={c_1,c_2,c_3,…,c_t}。三种组合函数如下:

1. Sum compositional functionSUM

2. LSTM-based compositional functionLSTM

3. N-gram-based compositional functionN-gram

Attribute character embedding 模块的目标函数如下:

3.3 Joint Learning of Structure Embedding and Attribute Character Embedding

本文提出的模型旨在使用attribute character embedding h_ce 帮助structure embedding h_se 在同一向量空间中完成训练,联合训练的目标函数如下:

本文提出的模型的整体目标函数如下:

4. Entity Alignment

在经过上述训练过程之后,来自不同KG的相似的实体将会有相似的向量表示,因此可通过获得潜在的实体对齐对。此外,模型设定相似度阈值来过滤潜在实体对齐对,得到最终的对齐结果。

5. Triple Enrichment via Transitivity Rule

本文发现利用传递关系可以丰富三元组,从而提升实体对齐效果。给定三元组 〈h_1,r_1,t〉 和三元组 〈t,r_2,t_2,可将 作为头实体 h_1 h_2 尾实体的关系,使其满足

实验分析

1. 数据集

本文从 DBpedia (DBP)、LinkedGeoData (LGD)、Geonames (GEO) 和 YAGO 四个 KG 中抽取构建了三个数据集,分别是DBP-LGDDBP-GEODBP-YAGO。具体的数据统计如下:

2. 实体对齐结果

本文对比了三个相关的模型,分别是 TransEMTransE JAPE。试验结果表明,本文提出的模型在实体对齐任务上取得了全面的较大的提升,在三种组合函数中,N-gram函数的优势较为明显。此外,基于传递规则的三元组丰富模型对结果也有一定的提升。具体结果如下:

3. 基于规则的实体对齐结果

为了进一步衡量 attribute character embedding 捕获实体间相似信息的能力,本文设计了基于规则的实体对齐模型。本实验对比了三种不同的模型:以label的字符串相似度作为基础模型;针对数据集特点,在基础模型的基础之上增加了坐标属性,以此作为第二个模型;第三个模型是把本文提出的模型作为附加模型,与基础模型相结合。具体结果如下:

4. KG补全结果

本文还在KG补全任务上验证了模型的有效性。模型主要测试了链接预测和三元组分类两个标准任务,在这两个任务中,模型也取得了不错的效果。具体结果如下:



OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法相关推荐

  1. 论文浅尝 | 基于属性嵌入的知识图谱实体对齐

    论文笔记整理:王中昊,天津大学硕士,方向:自然语言处理. 来源:AAAI2019 论文链接: https://doi.org/10.1609/aaai.v33i01.3301297 概述 知识图谱之间 ...

  2. 论文浅尝 | 基于文本关联的知识图谱的无监督嵌入增强

    来源:IJCAI2019 论文链接: https://www.ijcai.org/proceedings/2019/0725.pdf 概述 知识图谱嵌入是从多关系数据中提取数据的工具,最近的嵌入模型对 ...

  3. 论文浅尝 | 基于属性embeddings的跨图谱实体对齐

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识库问答. 来源:AAAI 2019 链接:https://aaai.org/ojs/index.php/AAAI/article/view/3798 ...

  4. 论文浅尝 | 基于开放世界的知识图谱补全

    Citation: Baoxu Shi and Tim Weninger (2017). Open-World Knowledge Graph Completion 6, AAAI 2018 传统的知 ...

  5. 论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

    本文转载自公众号:专知. [导读]知识图谱一直是研究热点,研究者近年来广泛关注知识图谱嵌入(Knowledge Graph Embedding,简称KGE)方法,在保留语义的同时,将知识图谱中的实体和 ...

  6. 论文浅尝|简单高效的知识图谱表示学习负样本采样方法

    笔记整理 | 陈名杨,浙江大学在读博士生,主要研究方向为知识图谱表示学习 Introduction 研究知识图谱表示学习(KnowledgeGraph Embedding)可以解决当前很多应用的基本问 ...

  7. 论文浅尝 | 记忆推理:最近邻知识图谱嵌入

    笔记整理:孙硕硕,东南大学硕士,研究方向为根因溯源. Citation: Zhang N, Xie X, Chen X, et al. Reasoning Through Memorization: ...

  8. 论文浅尝 | 探索用于归纳型知识图谱补全的关系语义

    笔记整理:徐雅静,浙江大学在读硕士,研究方向为知识图谱的表示学习,零样本学习. KGC指的是在不完整的KG中推理出缺失的实体.以前的多数工作仅仅考虑到直推式场景(实体都存在KG中),不能有效地解决归纳 ...

  9. 论文浅尝 | 利用问题生成提升知识图谱问答

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识库问答. 来源:NLPCC2019 链接:http://tcci.ccf.org.cn/conference/2019/papers/183.pdf ...

最新文章

  1. ORA-27041: unable to open file--恢复被rm意外删除数据文件
  2. Python中生成器generator和迭代器Iterator的使用方法
  3. php时间序列比对,常用在线序列比对工具
  4. 统计php代码执行情况,PHP代码执行函数总结
  5. 吴恩达机器学习4——神经网络
  6. Web开发中最致命的8个小错误
  7. 丢失Android系统库或者Conversion to Dalvik format failed with error 1错误的解决
  8. 如何开发自己的股票软件102
  9. 操作系统与操作系统内核
  10. 单片微型计算机原理及应用考试,单片机原理及应用《微机原理及应用》试卷(A卷)附答案...
  11. 高性能服务器架构拓扑图,某数据中心架构拓扑图.ppt
  12. qt离线下载地址5.14.2
  13. tilemap软件使用_使用Tilemap的等距2D环境
  14. 联通光猫HG2543C1改桥接备忘
  15. Mac电脑如何查看本机网卡mac地址
  16. 教子要过计算机考试吗,[教子有方]高考家长最容易陷入的十大志愿填报误区
  17. 武侠中的基本要素(武侠之奥义)
  18. 如何降低计算机版本,如何在win7系统电脑中将IE浏览器的版本降低
  19. 远程桌面连接是什么?远程桌面连接使用教程
  20. python名字的来历_你知道Python的由来吗

热门文章

  1. boost_1.47在VS2010下的安装
  2. 学习 Linux/C/C++ 必备资料
  3. linux下被遗忘的gpio_keys按键驱动
  4. Android系统充电系统介绍-预防手机充电爆炸
  5. 每日一题(53)—— 评价代码片段
  6. 计量经济学实验报告计算机,计量经济学-实验报告.doc
  7. bootstrap 居中 表格中_使用Twitter Bootstrap在表格单元格中垂直居中
  8. 学生信息系统求助_一个学生信息录入和查询的系统
  9. java程序设计及实践实践代码_杭+新闻:姚争为老师把程序设计讲“活”了,满是代码的枯燥课程被学生“秒杀”...
  10. 【Pytorch神经网络实战案例】26 MaskR-CNN内置模型实现目标检测