论文链接:http://nlp.csai.tsinghua.edu.cn/~lyk/publications/aaai2015_transr.pdf
代码链接:https://github.com/mrlyk423/relation_extraction
参考文档:https://blog.csdn.net/qq_36426650/article/details/103357256
论文来源:2015 AAAI

导读

TransH在TransE基础上做出的改进,提高了知识表示的效果,在一定程度上解决了复杂关系的处理,同时在链接预测、三元组分类和关系抽取任务上相比传统的方法(距离模型、非结构模型、单层神经网络、双线性模型等)达到最优,然而TransH也存在一定的问题。TransR作者发现TransH模型虽然有效的处理了复杂语义关系表示,但两个实体仍然处于相同的语义空间,因此不能够充分表示实体与关系的语义联系。

1、引言

知识图谱的完成可以实现目标实体之间的链接预测。本文我们研究了知识图谱表征的方法。最近TransE和TransH模型通过将关系视为一种从头实体到尾实体的翻译机制来获得实体和关系的表征。事实上一个实体可能有多个不同方面(特征),关系可能关注实体不同方面的特征,公共的实体特征空间不足以表征。本文,我们提出TransR模型构建实体和关系表征,将实体空间和关系空间相分离。然后我们以这种方式训练表征向量:首先通过将实体映射到关系空间中,其次在两个投影实体之间构建翻译关系。实验中,我们在三个任务上完成了验证,分别是链接预测、三元组分类和关系抽取。实验效果表明相比之前的基线模型,包括TransE和TransR,得到了一定的提升。

完善的知识图谱旨在预测给定两个实体对的关系,即链接预测,期现如今面临的挑战包括(1)图谱中的结点包含不同类型和属性的实体、(2)边表示不同类型的关系。对于知识补全,我们不仅仅只是判断实体对是否存在关系,也需要预测具体的关系类。基于此,传统的链接预测方法则无法实现链接预测。最近一种新提出的表示学习是指将实体和关系嵌入到连续的向量空间中。
  
  TransE和TransH模型是基于这种表示学习。TransE在word2vec的启发之下,通过构建简单的语义表示 h+r≈th+r\approx th+r≈t实现训练,TransH则基于TransE基础上能够对复杂关系进行表示。不过这两个模型均是假定实体和关系是在同一个语义空间中。作者提出一种新的策略,将实体和关系分别映射到不同的语义空间中,分别为entity space(实体空间)和relation space(关系空间)。
  
  TransR的主要思路如图所示:

 假设实体对 (h,r,t)(h,r,t)(h,r,t) ,首先根据当前的关系rrr 将头尾实体分别映射到关系空间中 hr,trh_r,t_rhr​,tr​,然后在关系空间中建模 hr+r≈trh_r+r\approx t_rhr​+r≈tr​。

  另外,在特定的关系下,实体对通常表现出不同的模式,因此不能单纯的将关系直接与实体对进行操作。我们通过将不同的头尾实体对聚类成组,并为每个组学习不同的关系向量来扩展TransR,称为基于聚类的TransR (CTransR)。

2、TransR模型详解

TransR模型:设实体对 (h,r,t)(h,r,t)(h,r,t)的表征分别为 h,t∈Rk\mathbf{h},\mathbf{t}\in\mathbb{R}^kh,t∈Rk,r∈Rd\mathbf{r}\in\mathbb{R}^dr∈Rd,其中 k≠dk\ne dk​=d。对于每个关系 rrr 给定映射矩阵M∈Rk×d\mathbf{M}\in\mathbb{R}^{k\times d}M∈Rk×d,则有:hr=hMr\mathbf{h}_r=\mathbf{h}\mathbf{M}_rhr​=hMr​,tr=tMr\mathbf{t}_r=\mathbf{t}\mathbf{M}_rtr​=tMr​。得分函数定义为 fr(h,t)=∣∣hr+r−tr∣∣22f_r(h,t)=||\mathbf{h}_r+\mathbf{r}-\mathbf{t}_r||_2^2fr​(h,t)=∣∣hr​+r−tr​∣∣22​。约束条件为 ∣∣h∣∣2≤1||\mathbf{h}||_2\leq1∣∣h∣∣2​≤1,∣∣r∣∣2≤1||\mathbf{r}||_2\leq1∣∣r∣∣2​≤1,∣∣t∣∣2≤1||\mathbf{t}||_2\leq1∣∣t∣∣2​≤1,∣∣hMr∣∣2≤1||\mathbf{h}\mathbf{M}_r||_2\leq1∣∣hMr​∣∣2​≤1,∣∣tMr∣∣2≤1||\mathbf{t}\mathbf{M}_r||_2\leq1∣∣tMr​∣∣2​≤1。

CTransR模型:受到piecewise linear regression(分段线性回归)的启发。

  • (1)首先将输入示例分为多个组。对于特定的关系 rrr ,所有的实体对 (h,t)(h,t)(h,t) 可被聚类到多个簇中,每个簇中的实体对可被认为与关系 rrr 有关。
  • (2)为每个簇对应的关系向量rc\mathbf{r}_crc​表征,并得到对应的 Mr\mathbf{M}_rMr​ ,然后将每个簇中的头实体和尾实体映射到对应关系空间中 hr,c=hMr\mathbf{h}_{r,c}=\mathbf{h}\mathbf{M}_rhr,c​=hMr​, tr,c=tMr\mathbf{t}_{r,c}=\mathbf{t}\mathbf{M}_rtr,c​=tMr​。得分函数定义为 fr(h,t)=∣∣hr,c+rc−tr,c∣∣22+α∣∣rc−r∣∣22f_r(h,t)=||\mathbf{h}_{r,c}+\mathbf{r}_c-\mathbf{t}_{r,c}||_2^2+\alpha ||\mathbf{r}_c-\mathbf{r}||_2^2fr​(h,t)=∣∣hr,c​+rc​−tr,c​∣∣22​+α∣∣rc​−r∣∣22​

TransR和CTransR的区别在于两者的关系空间不同,前者只有一个关系空间,亦即对所有的关系都在同一个空间中;后者则是根据不同的关系,对属于同一个关系的所有实体对聚集在一个簇中,每个关系代表不同的空间
  
损失函数:损失函数与之前的一样:L=∑(h,r,t)∈S∑(h′,r,t′)∈S′[γ+fr(h,t)−fr(h′,t′)]+L=\sum_{(h,r,t)\in S}\sum_{(h',r,t')\in S'}[\gamma + f_r(h,t)-f_r(h',t')]_+L=(h,r,t)∈S∑​(h′,r,t′)∈S′∑​[γ+fr​(h,t)−fr​(h′,t′)]+​作者指出训练策略与负样本构建则与TransH一样,因此在此不做详细讲解。

3、实验

实验主要包括三个任务,实验的具体细节与TransH相同 ,不做详细介绍。

3.1、链接预测


3.2、三元组分类

3.3、关系抽取

4、总结

本文作者提出的TransR和CTransR模型可以将相同关系的三元组映射到对应关系的空间中,有效的对三元组进行语义表示,在包括链接预测、三元组分类和关系抽取任务上均实现最好效果。作者提出三个未来工作,包括:

  • (1)利用推理信息增强图谱的表征;
  • (2)探究文本与图谱的表示模型;
  • (3)基于CTransR,研究更复杂的模型。

TransR模型巧妙的借鉴了TransH模型的空间投影想法,更细致的将不同的关系作为不同的投影空间,试想一下,每个三元组中的两个实体之所以在同一个三元组,很大程度上是因为两个实体的某些特性符合当前的关系,而这些特性在这个关系所在的语义空间中满足一定的规律,亦即 hr+r≈trh_r+r\approx t_rhr​+r≈tr​。

TransR还有一些缺点。例如引入的空间投影策略增加了计算量、头尾实体一同投影到关系空间,而未考虑到头尾实体的不同语义类型、仅将实体投影到关系空间中还不够完全提高语义表能力等。TransD模型试图改进这些不足之处。

TransR:实体和关系分开嵌入(知识图谱嵌入)2015 AAAI相关推荐

  1. 论文浅尝 | PairRE: 通过成对的关系向量实现知识图谱嵌入

    笔记整理:黎洲波,浙江大学硕士,研究方向为自然语言处理.知识图谱. 研究背景 知识图谱因其在问答.语义解析和命名实体消歧等任务取得了良好的效果而受到广泛关注,而大部分知识图谱都存在不全和缺失实体链接的 ...

  2. ACL 2020 | 用于链接预测的开放知识图谱嵌入

    ©PaperWeekly 原创 · 作者|舒意恒 学校|南京大学硕士生 研究方向|知识图谱 当前大量的知识图谱都是通过文本直接构建的.由于当前的知识图谱构建方法的局限性,其中难免包含对同一实体或关系的 ...

  3. 论文浅尝 - ACL2020 | 用于链接预测的开放知识图谱嵌入

    本文转载自公众号:PaperWeekly. 作者:舒意恒,南京大学硕士,研究方向:知识图谱. 当前大量的知识图谱都是通过文本直接构建的.由于当前的知识图谱构建方法的局限性,其中难免包含对同一实体或关系 ...

  4. 【自然语言处理】【知识图谱】MTransE:用于交叉知识对齐的多语言知识图谱嵌入

    MTransE:用于交叉知识对齐的多语言知识图谱嵌入 <Multilingual Knowledge Graph Embeddings for Cross-lingual Knowledge A ...

  5. Ampligraph——基于tensorflow的python库,可用于知识图谱嵌入和链接预测

    目录 一.AmpliGraph 1.介绍 2.特点 3.模块 4.安装AmpliGraph 二.API接口 1.数据 2.模型 3.评估 4.发现 5.其他实用函数 三.实例代码 1.训练和评估嵌入模 ...

  6. 知识图谱嵌入的Translate模型汇总(TransE,TransH,TransR,TransD)

    点击上方"AI公园",关注公众号,选择加"星标"或"置顶" 作者:Xu LIANG 编译:ronghuaiyang 导读 一文打尽图嵌入Tr ...

  7. 知识图谱嵌入的Translate模型汇总(TransE,TransH,TransR,TransD

    一文打尽图嵌入Translate模型,各种模型的动机,优缺点分析. 本文对知识图谱嵌入/知识表示的转换模型进行了简要的总结.你可以从TensorFlow-TransX中找到开源的TensorFlow代 ...

  8. 论文浅尝 | 区分概念和实例的知识图谱嵌入方法

    链接:https://arxiv.org/pdf/1811.04588.pdf 知识图谱的表示学习最近几年被广泛研究,表示学习的结果对知识图谱补全和信息抽取都有很大帮助.本文提出了一种新的区分概念和实 ...

  9. 论文浅尝 | 对于知识图谱嵌入表示的几何形状理解

    论文链接:http://anthology.aclweb.org/attachments/P/P18/P18-1012.Presentation.pdf 发表会议:ACL 2018 摘要 知识图谱的嵌 ...

  10. 论文浅尝 | 基于超平面的时间感知知识图谱嵌入

    链接:http://talukdar.net/papers/emnlp2018_HyTE.pdf 本文主要关注 KG embedding 中三元组成立的时间有效性问题,比如三元组(Cristiano ...

最新文章

  1. 再次修订后的版本。。。。。。1.0(发布版,射线求交三角形)
  2. r语言把两个折线图图像放到一个图里_图像相似度度量
  3. ACE反应器(Reactor)模式
  4. python os模块system_Python如何使用OS模块调用cmd
  5. 截取最后一个下划线前面的字符
  6. Yii 2.0: yii2-highcharts-widget创建饼状图
  7. 强化学习《基于价值 - Dueling Q-Learning》
  8. 4. 哪些视图中的数据不可以增删改操作?_MySQL之视图
  9. python3读取linux文件,Python3读取文件小技巧
  10. 桌面环境选择_如何在 Ubuntu 20.04 LTS 上安装深度(Deepin)桌面环境 | Linux 中国
  11. 如何使用微软官方工具MediaCreationTool来制作Windows10启动盘
  12. 软件测试 -- 软件缺陷记录的5C原则
  13. 【文化课每周学习记录】2019.3.10——2019.3.16
  14. CESM mpirun noticed that process rank 1 with PID 0 on node ubuntu exited on signal 11
  15. android 后台监听按键,Android监听home键的方法详解
  16. DDoS防御服务器应该如何选择?
  17. 深度学习实战(七)——目标检测API训练自己的数据集(R-FCN数据集制作+训练+测试)
  18. office:word在编辑内容时反应迟钝的解决办法
  19. Linux:试管中的生命
  20. Linux计划任务篇

热门文章

  1. Redis有哪几种数据淘汰策略?
  2. spark反压速率计算
  3. 一个简单的Kafka Flink Rabbitmq Demo
  4. Dubbo消费者代理的调用
  5. python遗传算法有多慢_遗传算法框架GAFT优化小记
  6. 使用this调用已有的有参构造函数_JavaScript 中的 this 的几种使用场景
  7. redis专题:redis面试题汇总
  8. 工厂模式(简单工厂模式)快速理解
  9. 一文学会JVM常见参数设置+调优经验(JDK1.8)
  10. SpringBoot 精通系列-创建SpringBoot的入门项目