引用:Zequn Sun, Wei Hu, Qingheng Zhang, and Yuzhong Qu. 2018. Bootstrapping entity alignment with knowledge graph embedding. In Proceedings of the 27th International Joint Conference on Artificial Intelligence (IJCAI’18). AAAI Press, 4396–4402

原文:https://www.ijcai.org/Proceedings/2018/0611.pdf
源码:作者公开的源码 OpenEA中的源码

1. 摘要

基于嵌入的实体对齐将不同的知识图谱(KG)表示为低维嵌入,并通过测量实体嵌入之间的相似度来找到对齐实体。 现有的方法已经取得了可喜的结果,但是,它们仍然面临着缺乏足够的事先对齐作为标记训练数据的挑战。 在本文中,我们提出了一种基于嵌入的实体对齐的自扩展(bootstrapping)方法。 它迭代地将可能的实体对齐标记为训练数据,用来学习以对齐为导向的KG嵌入。 此外,它采用对齐编辑方法来减少迭代过程中的错误累积。 我们在真实数据集上的实验表明,该方法在实体对齐方面明显优于基于嵌入的最新方法。 提出的面向路线的KG嵌入,自举过程和路线编辑方法均有助于性能的提高。

2. 问题定义

XXXYYY分别为KG1和KG2的实体集。目标是找出A={(x,y)∈X×Y∣xissameasy}A=\{(x,y)\in X\times Y|x\,is\,same \,as \,y\}A={(x,y)X×Yxissameasy}X′X'XY′Y'Y分别为KG1和KG2的中未在对齐实体对中出现的实体集合。
如下公式定义两个实体向量之间的相似度:

sim(.)sim(.)sim(.)表示余弦相似度,σ(.)\sigma(.)σ(.)表示sigmoid函数。根据最大化相同实体之间相似度之和,选择最优的实体嵌入,其公式如下:

其中LxLxLx表示YYY中与x等价关系的实体,1[.]1[.]1[.]表示当[]内的条件满足时取1,否则取0。

3. 方法

3.1. AlignE

3.1.1. 目标函数

AlignE将KG1和KG2 嵌入到统一向量空间,并使用翻译模型定义三元组(h,r,t)(h,r,t)(h,r,t)的距离函数:

基于该距离函数提出目标函数:

3.1.2. ϵ\epsilonϵ 截断均匀抽样法

提出ϵ截断均匀抽样法\epsilon 截断均匀抽样法ϵ来生成负样本。该方法不同于以往的随机抽样替换,而是取sss个与正样本三元组中实体最相似的实体作为候选实体,其中s=ceil((1−ϵ)×N),ϵ∈[0,1)s=ceil((1-\epsilon)\times N),\epsilon \in[0,1)s=ceil((1ϵ)×N),ϵ[0,1),相似度的计算依然使用余弦相似度。该抽样方法使得表示学习模型能够更好地区分两个相似的三元组(一个为正样本,另一个为根据该抽样法得到的负样本)。

3.1.3. 参数交换(parameter swapping)

提出参数交换(parameter swapping)策略,利用对齐实体对,使用其中一个KG的实体向量替换另一个KG三元组中的对齐实体,以达到扩充正样本的目的,其公式如下:

3.2. BootEA

3.2.1. Bootstrapping方法

在每一轮迭代中,选择若干个置信度较高(全局最高)的对齐实体对添加到训练集中。第ttt轮迭代中,新增的实体对齐按照如下目标进行选择:

其中Θ(t)\Theta^{(t)}Θ(t)表示第ttt轮迭代中实体的嵌入,ψ(t)(x,y)\psi^{(t)}(x,y)ψ(t)(x,y)为指示函数,指示xxxyyy是否对齐。Yx′Y'_xYx表示xxx的候选集合,Yx′={y∣y∈Y′andπ(x∣y;Θ(t))>γ3)}Y'_x=\{y|y \in Y'\,and\,\pi(x|y;\Theta^{(t)})>\gamma_3)\}Yx={yyYandπ(xy;Θ(t))>γ3)},其中γ3\gamma_3γ3为相似度阈值,相似度超过该值则选入候选集合。作者采用二分图的最大权值匹配算法来实现目标公式(5)。

3.2.2. 对齐编辑方法(alignment editing method)

由于新增的实体对齐不一定是正确的,错误的实体对齐训练样本会误导后续训练过程,因此作者提出了对齐编辑方法:假设KG1中的实体xxx在某两轮迭代中分别与KG2中的实体yyyy′y'y对齐,将yyyy′y'y中与xxx相似度更高的实体作为xxx对齐实体。公式描述如下:

3.2.3. 从整体中学习

定义KG1中实体xxx 的对齐实体yyy的概率分布函数ϕx(y)\phi_x(y)ϕx(y)

根据概率分布函数定义对齐优化目标函数:

结合alignE的目标函数得到BootEA的目标函数:

其中μ2\mu_2μ2为平衡超参。

4 实验

4.1. 数据集

采用DBP15K和DWY100K。

4.2. 实验结果


从数据中可以看出,AlignE比以往的方法好,证明了提出的ϵ截断\epsilon截断ϵ参数交换方法参数交换方法有效。BootEA大大优于AligneE,证明了bootstrapping策略bootstrapping策略bootstrapping对齐编辑对齐编辑能够有效缓解对齐样本数据不足的问题,能够大幅提升实体对齐的精确度。

文章为阅读随笔,如有错误之处请批评指正,感谢您的阅读!

论文简读-BootEA-《Bootstrapping Entity Alignment with Knowledge Graph Embedding》相关推荐

  1. 【实体对齐·BootEA】Bootstrapping Entity Alignment with Knowledge Graph Embedding

    文章目录 0.总结 1.动机 2. 贡献+方法 3.应用场景 4.其他模型 5.数据集 6.效果 以下的是组内比较 BootEA: "Bootstrapping Entity Alignme ...

  2. 实体对齐 算法_[2017]Bootstrapping Entity Alignment with Knowledge Graph Embedding

    模型:BootEA, AlignE AlignE和BootEA几乎一样,但是AlignE没有用bootstrapping Introduction 存在的挑战:1.尽管一个KG的嵌入模式在过去的几年进 ...

  3. 论文笔记006-《Bootstrapping Entity Alignment with Knowledge Graph Embedding》

    更多博客可以关注MyBlog,欢迎大家一起学习交流! 1. 简介 题目:<Bootstrapping Entity Alignment with Knowledge Graph Embeddin ...

  4. 【论文笔记】(VLDB 2020) A Benchmarking Study of Embedding-based Entity Alignment for Knowledge

    A Benchmarking Study of Embedding-based Entity Alignment for Knowledge 论文原文 开发代码 摘要: 实体对齐旨在在不同的知识图谱 ...

  5. 【实体对齐·综述】A Benchmarking Study of Embedding-based Entity Alignment for Knowledge Graphs

    文章目录 模板的简述 简述 1.Introduction 2. preliminatries 2.1 literature review 2.1.1 knowledge graph embedding ...

  6. 《knowledge graph embedding:a survey of approaches and applications》论文阅读

    发表于TKDE 2017. knowledge graph embedding:a survey of approaches and applications abstract 1. introduc ...

  7. 知识图谱论文阅读(十三)【2020 arXiv】Attentive Knowledge Graph Embedding for Personalized Recommendation

    题目: Attentive Knowledge Graph Embedding for Personalized Recommendation 论文链接: 代码链接: 知识图谱特征学习在推荐系统中的应 ...

  8. RKGE:Recurrent Knowledge Graph Embedding for Effective Recommendation 论文

    emm-图片复制过来显示不了(因为我太懒了0.0),要看图的话可以去我的博客瞅瞅,嘿嘿嘿 对了,有些英文短句假如翻译成中文,阅读的时候就太搞脑子了,所以我干脆就不翻译了 这篇论文的模型跟我上一篇发布的 ...

  9. RKGE Recurrent Knowledge Graph Embedding for Effective Recommendation 论文

    Paper-RKGE [ Recurrent Knowledge Graph Embedding for Effective Recommendation ] Abstract 关于KG应用于推荐,现 ...

  10. SSP: Semantic Space Projection for Knowledge Graph Embedding with Text Descriptions 论文读书笔记

    SSP: Semantic Space Projection for Knowledge Graph Embedding with Text Descriptions 论文读书笔记 1. Motiva ...

最新文章

  1. linux c段错误,Linux C中段错误
  2. VS如何在一个项目中添加多个包含main函数的源文件并分别调试运行
  3. php pdo 预处理删除,PHP PDO扩展整理,包括环境配置\基本增删改查\事务\预处理
  4. 有哪些相见恨晚的运动常识
  5. PHP_框架储备资料
  6. 文件已被占用的解决方法
  7. 几款用于防破解的软件
  8. 支付宝第三方登录接口调用
  9. Aras Innovator: 如何在Form中放入图片
  10. java如何爬取qq音乐_爬取QQ音乐
  11. 以太网服务器怎么改成无线网,win10 以太网显示无线wifi名称怎么改
  12. linux误删 bin目录,记linux下rm误删bin文件的解决方式
  13. 光伏板怎么申请ASTM E108阻燃测试?
  14. 基于python的flask框架自动回复抖音私信
  15. 回车换行符 crlf 那点事
  16. 基金、社保和QFII等机构的重仓股排名评测
  17. 眼部结构+糖尿病视网膜病变+黄斑病变学习
  18. echarts图表自适应(窗口大小变化时echarts图表重新渲染)
  19. 今天高考╮(╯▽╰)╭
  20. HTTP协议之multipart/form-data请求分析

热门文章

  1. vue的自定义指令 - Directive
  2. linux下imwbr1进程,清除挖矿程序(imWBR1,ddg,wipefs),亲测可用
  3. 加州大学欧文分校计算机排名,美国加州大学伯克利分校计算机专业排名
  4. HDR:Recovering High Dynamic Range Radiance Maps from Photographs
  5. java 括号匹配_Java解决括号匹配算法问题
  6. AMD CPU 开启Android Studio emulator虚拟机
  7. html+圆角六边形,CSS3 圆角六边形
  8. SV-- event(二)
  9. java为什么被开发者_Spring为何受到Java开发者的青睐?Spring是如何简化Java开发的?...
  10. 域名解析不生效,中科三方带你定位!