https://arxiv.org/pdf/1705.02426.pdf

本文的主要创新点就是把类比推理应用到 KG embedding 中,通过对模型的 score function 添加某些约束来捕获 KG 中类比结构的信息,进而优化 KG 中实体和关系的 embedding 表示,并在 FB15K WN18 数据集上达到 state-of -the-art 性能。

Analogical Structure

什么是类比结构?以 word embedding中最著名的一句话为例,man is to king as woman is to queen,用 abcd 分别表示 man, king, woman, queen 四个实体,用 r r' 表示 crown male->female 关系,这就可以得到四个三元组

可视化一下,就可以得到一个平行四边形结构,捕获这个结构的信息也就是本文的 motivation,且更复杂的类比结构的基本组成单元就是这个平行四边形结构。

对于线性映射来说,一个理想的特性,就是所有有相同起点和终点的有向图,都形成了所谓的compositional equivalence,在上图中就是,且若关系集合R中任意两个关系都满足compositionalequivalence,则称R是一个commutingfamily

Method

本文将关系 r 视为线性映射,即给定三元组 (s,r,o),作者希望对于所有有效的三元组,都能满足,满足的程度就用一个 score function 表示,模型的目标就是学到恰当的 v W,来让这个 score function 给有效的三元组高分,无效的三元组低分。为什么用线性映射而不用transE那样的加法映射呢?作者的看法是,用矩阵定义的线性映射表达能力比用向量定义的加法映射更强。

为了捕获 KG 中类比结构的信息,本文在objective function上加入了 Normal Matrix compositional equivalence 的约束,而后者就是,即在线性映射上的具体实现,最后得到的 objective function 就是

Why Normal Matrix

引理1,对于任意实正规矩阵 A,存在一个实正交矩阵 Q 和分块对角矩阵 B,满足 A=QBQT,其中 B 的每个对角块要么是个实数,要么是个2维实矩阵,x y都是实数。这个引理表明任意一个实正规矩阵都可以分块对角化。

引理2,若一系列实正规矩阵组成了一个 commuting family,那么它们可以用同一个 Q 分块对角化。这个引理表明,若一个稠密关系矩阵集合{Wr}相互可交换,那么就可以同时被分块对角化成一个稀疏矩阵集合{Br}。

结合以上两个性质,可以对 score function 进行推导,过程如下

即对于任意目标函数7的解 (v*,W*) ,都有对应的 (u*,B*) 满足

目标函数简化成了这个样子,其中 B表示对角线上有n个实数的m阶对角方阵。

Unified View of Representative Methods

作者也证明了本文模型是 unified method,以 DistMult为例,它的 score func

实际上这就是 n=m ANALOGY版本,其中

Experiments

实验用的数据集是FB15KWN18,作者用了19baseline做对比,metrics用的也是常用的MRRHits@k。由下表可以知道FB15K的关系数非常多,因此对其建模也更难,KG中包含的类比结构也更多,而在这个数据集上,ANALOGY的表现超过了所有baseline模型,这证明了捕获类比结构信息的作用。

而下图则表明在所有指标上,ANALOGY的表现都超过了 DistMult,ComplExHolE,且这三个是ANALOGY的特例。

论文笔记整理:汪寒,浙江大学硕士,研究方向为知识图谱,自然语言处理。


OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 | 利用类比推理优化知识图谱向量表示相关推荐

  1. 论文浅尝 | 基于置信度的知识图谱表示学习框架

    本文转载自公众号:PaperWeekly. 作者丨谢若冰 单位丨腾讯微信搜索应用部 研究方向丨知识表示学习 知识图谱被广泛地用来描述世界上的实体和实体之间的关系,一般使用三元组(h,r,t)(head ...

  2. 论文浅尝 | Rot-Pro:通过知识图谱嵌入中的投影建模关系的传递性

    笔记整理:陈湘楠,浙江大学硕士在读. 研究背景 知识图嵌入模型学习知识图谱中实体和关系的表示,以预测实体之间的缺失链接(关系).它们的有效性深受建模和推断不同关系模式(如对称.不对称.逆向.组合和传递 ...

  3. 论文浅尝 | AAAI2020 - 基于规则的知识图谱组合表征学习

    论文笔记整理:康矫健,浙江大学计算机科学与技术系,硕士研究生. 论文链接:https://arxiv.org/pdf/1911.08935.pdf 发表会议:AAAI 2020 Motivation ...

  4. 论文浅尝 | 重新实验评估知识图谱补全方法

    论文作者:Farahnaz Akrami,美国德州大学阿灵顿分校,博士生. 笔记整理:南京大学,张清恒,硕士生. 链接:https://arxiv.org/pdf/2003.08001.pdf 代码: ...

  5. 论文浅尝 | 打通推荐系统与知识图谱: 第一个公开的大规模链接数据集合

    本文转载自:RUC智能情报站,知乎专栏链接:https://zhuanlan.zhihu.com/RucAIBox 前言:近年来,知识图谱(KB)被广泛应用于推荐系统(RS),但尚未有公开将推荐系统物 ...

  6. 论文浅尝 | 二维卷积知识图谱嵌入

    链接:https://arxiv.org/pdf/1707.01476.pdf 本文主要关注 KG Link prediction 问题,提出了一种多层卷积神经网络模型 ConvE,主要优点就是参数利 ...

  7. 论文浅尝 - 计算机工程 | 大规模企业级知识图谱实践综述

    本文转载自公众号:计算机工程. 大规模企业级知识图谱实践综述 王昊奋, 丁军, 胡芳槐, 王鑫 中文摘要:近年来,知识图谱及其相关技术得到快速发展,并被广泛应用于工业界各种认知智能场景中.在简述知识图 ...

  8. 论文浅尝 | 利用多语言 wordnet 上随机游走实现双语 embeddings

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答. 来源:Knowledge Based System 链接:https://www.sciencedirect.com/science/a ...

  9. 论文浅尝 | 利用指针生成网络的知识图谱自然语言生成

    论文笔记整理:谭亦鸣,东南大学博士,研究方向为知识图谱问答. 来源:Neurocomputing 382: 174-187 (2020) 链接:https://www.sciencedirect.co ...

最新文章

  1. [题解]RGB Substring (hard version)-前缀和(codeforces 1196D2)
  2. 推荐15个高质量学习网站,仅看一眼,就收获满满,赶紧收藏!
  3. mac txt 换行符_推荐两款免费的网页代码编辑器(Win和Mac系统)
  4. R语言基于forestplot包可视化森林图实战详解:美化的森林图:自定义字体设置、置信区间、坐标轴(刻度、标签、范围)、无效线去除、水平线、辅助线、box形状、色彩等
  5. python 解压js压缩的图片_Python解压各种压缩文件总结
  6. Activity栈管理(二):Launch Mode
  7. oracle语句mysql数据库名称_查询oracle数据库中当前数据库所有表的名称
  8. C/C++调用Fortran的使用说明
  9. 客户端登录提示找不到表0
  10. 阿里如何实现100%容器化镜像化?八年技术演进之路回顾 1
  11. 小程序中ajax返回数据,微信小程序调用接口返回数据或提交数据
  12. 3分钟快速presentation
  13. SpringCloud工作笔记103---Mybatis-plus使用注解 @TableField(exist = false) 注明非数据库字段属性
  14. Vagrant:将装在C盘的虚拟机移动到别的目录
  15. MapReduce Design Patterns(6 、Job 链)(十二)
  16. python在linux下打包程序_Python打包程序
  17. 麦克风声源定位原理_关于基于麦克风阵列的声源被动定位系统的设计
  18. android 带箭头的按钮,用Dialog创建带箭头的对话框
  19. 2020年年度总结(致敬自己)
  20. JAVA|圆周长、面积

热门文章

  1. linux top 命令的结果
  2. tcp为什么需要3次握手和3次握手的过程
  3. 推荐Linux内核书籍
  4. C语言系列文章之#和##
  5. 图文|Android 使用Thread 和多线程使用互斥锁
  6. linux c语言内核函数,2014-1-5_linux内核学习(1)_C语言基础
  7. 递归过程中语句执行顺序
  8. 计算机谈音乐薛之谦,明星浮世绘之薛之谦:分析了50多首音乐作品,为其总结了五个特点...
  9. 四、Vue组件化开发学习笔记——父子组件通信,父级向子级传值(props),子级向父级传值(自定义事件),slot插槽
  10. speech production model