知识图谱表示学习(三)
SE、SME、LFM、RESCAL、HOLE

【自然语言处理】【知识图谱】知识图谱表示学习(一):TransE、TransH、TransR、CTransR、TransD
【自然语言处理】【知识图谱】知识图谱表示学习(二):TranSparse、PTransE、TransA、KG2E、TransG
【自然语言处理】【知识图谱】知识图谱表示学习(三):SE、SME、LFM、RESCAL、HOLE
【自然语言处理】【知识图谱】知识图谱表示学习(四):【RotatE】基于复数空间关系旋转的知识图谱嵌入
【自然语言处理】【知识图谱】知识图谱表示学习(五):【PairRE】基于成对关系向量的知识图谱嵌入

一、符号

  • 使用G=(E,R,T)G=(E,R,T)G=(E,R,T)来表示完整的知识图谱,其中E={e1,e2,…,e∣E∣}E=\{e_1,e_2,\dots,e_{|E|}\}E={e1,e2,,eE}表示实体集合,R={r1,r2,…,r∣R∣}R=\{r_1,r_2,\dots,r_{|R|}\}R={r1,r2,,rR}表示关系集合,TTT表示三元组集合,∣E∣|E|E∣R∣|R|R表示实体和关系的数量。
  • 知识图谱以三元组⟨h,r,t⟩\langle h,r,t\rangleh,r,t的形式表示,其中h∈Eh\in EhE表示头实体,t∈Et\in EtE表示尾实体,r∈Rr\in RrR表示hhhttt间的关系。

二、SE

SE(Structured Embedding)\text{SE(Structured Embedding)}SE(Structured Embedding)会将每个实体投影至ddd维向量空间。具体来说,SE\text{SE}SE会为每个关系设计两个矩阵Mr,1,Mr,2∈Rd×d\textbf{M}_{r,1},\textbf{M}_{r,2}\in\mathbb{R}^{d\times d}Mr,1,Mr,2Rd×d,然后使用者两个矩阵将头实体和尾实体投影至相同的语义空间并计算相似度。SE\text{SE}SE的评分函数定义为
E(h,r,t)=∥Mr,1h−Mr,2t∥1\mathcal{E}(h,r,t)=\parallel \textbf{M}_{r,1}\textbf{h}-\textbf{M}_{r,2}\textbf{t}\parallel_1 E(h,r,t)=Mr,1hMr,2t1
其中,h\textbf{h}ht\textbf{t}t都会被投影至相应的关系空间中。

​ 不同于TransE\text{TransE}TransE这样基于翻译的模型,SE\text{SE}SE会将实体建模为嵌入向量,关系建模为投影矩阵

三、SME

​ 不同于SE\text{SE}SESEM(Semantic Matching Energy)\text{SEM(Semantic Matching Energy)}SEM(Semantic Matching Energy)会将实体和关系都看作是低维向量。对于任一三元组⟨h,r,t⟩\langle h,r,t\rangleh,r,th\textbf{h}hr\textbf{r}r会被一个投影函数ggg合并为新嵌入向量Ih,r\textbf{I}_{h,r}Ih,rt\textbf{t}tr\textbf{r}r也同样会被合并It,r\textbf{I}_{t,r}It,r。然后,通过一个point-wise乘积将两个嵌入向量Ih,r\textbf{I}_{h,r}Ih,rIt,r\textbf{I}_{t,r}It,r进行合并,得到整个三元组的评分。SME\textbf{SME}SME提出了两个不同的合并投影函数ggg:

  • 线性形式
    E(h,r,t)=(M1h+M2r+b1)⊤(M3t+M4r+b2)\mathcal{E}(h,r,t)=(\textbf{M}_1\textbf{h}+\textbf{M}_2\textbf{r}+\textbf{b}_1)^\top(\textbf{M}_3\textbf{t}+\textbf{M}_4\textbf{r}+\textbf{b}_2) E(h,r,t)=(M1h+M2r+b1)(M3t+M4r+b2)
    其中,M1h+M2r+b1\textbf{M}_1\textbf{h}+\textbf{M}_2\textbf{r}+\textbf{b}_1M1h+M2r+b1就是Ih,r\textbf{I}_{h,r}Ih,rM3t+M4r+b2\textbf{M}_3\textbf{t}+\textbf{M}_4\textbf{r}+\textbf{b}_2M3t+M4r+b2It,r\textbf{I}_{t,r}It,r

  • 双线性形式
    E(h,r,t)=((M1h⊙M2r)+b1)⊤((M3t⊙M4r)+b2)\mathcal{E}(h,r,t)=((\textbf{M}_1\textbf{h}\odot\textbf{M}_2\textbf{r})+\textbf{b}_1)^\top((\textbf{M}_3\textbf{t}\odot\textbf{M}_4\textbf{r})+\textbf{b}_2) E(h,r,t)=((M1hM2r)+b1)((M3tM4r)+b2)
    其中,(M1h⊙M2r)+b1(\textbf{M}_1\textbf{h}\odot\textbf{M}_2\textbf{r})+\textbf{b}_1(M1hM2r)+b1Ih,r\textbf{I}_{h,r}Ih,r(M3t⊙M4r)+b2(\textbf{M}_3\textbf{t}\odot\textbf{M}_4\textbf{r})+\textbf{b}_2(M3tM4r)+b2It,r\textbf{I}_{t,r}It,r

​ 其中,⊙\odot是element-wise(Hadamard)积;M1,M2,M3,M4\textbf{M}_1,\textbf{M}_2,\textbf{M}_3,\textbf{M}_4M1,M2,M3,M4是投影函数的权重矩阵,b1,b2\textbf{b}_1,\textbf{b}_2b1,b2是偏置。

四、LFM

LFM(Latent Factor Model)\text{LFM(Latent Factor Model)}LFM(Latent Factor Model)是用于建模大型多关系数据集的。LFM\textbf{LFM}LFM是双线性结构,其将实体建模为嵌入向量、关系建模为矩阵。该方法在不同关系间共享相同的隐因子,从而极大的降低计算复杂度。LFM\text{LFM}LFM的评分函数为
E(h,r,t)=h⊤Mrt\mathcal{E}(h,r,t)=\textbf{h}^\top\textbf{M}_r\textbf{t} E(h,r,t)=hMrt
其中,Mr\textbf{M}_rMr是关系rrr的矩阵表示。

五、RESCAL

RESCAL\text{RESCAL}RESCAL是一种基于矩阵分解的知识图谱表示学习。RESCAL\text{RESCAL}RESCAL为了表示知识图谱中的所有三元组,提出了三维张量的方式X⃗∈Rd×d×k\vec{\textbf{X}}\in\mathbb{R}^{d\times d\times k}X

Rd×d×k,其中ddd是实体的维度,kkk是关系的维度。在三维张量X⃗\vec{\textbf{X}}X

中,前两个mode分别表示头、尾实体,第三个mode表示关系。X⃗\vec{\textbf{X}}X

中的每个分量都代表对应的三元组是否存在。例如,若三元组⟨ithentity,mthrelation,jthentity⟩\langle ith \;entity,mth\;relation,jth\;entity\rangleithentity,mthrelation,jthentity在训练集中存在则X⃗ijm=1\vec{\textbf{X}}_{ijm}=1X

ijm
=
1
,否则X⃗ijm=0\vec{\textbf{X}}_{ijm}=0X

ijm
=
0

​ 为了捕获所有三元组的内在结构,提出一个称为RESCAL\text{RESCAL}RESCAL的张量分量模型。设X⃗={X1,…,Xk}\vec{\textbf{X}}=\{\textbf{X}_1,\dots,\textbf{X}_k\}X

={X1,,Xk},那么对于每个slice Xn\textbf{X}_nXn,其rrr秩分解为
Xn≈ARnA⊤\textbf{X}_n\approx\textbf{AR}_n\textbf{A}^\top XnARnA
其中,A∈Rd×r\textbf{A}\in\mathbb{R}^{d\times r}ARd×rrrr维的实体表示,Rn\textbf{R}_nRn则是第nnn个关系rrr个隐组件的交互。该分解的形式与LFM\text{LFM}LFM非常类似,但是RESCAL\text{RESCAL}RESCAL不但能优化正三元组,也能同时优化不存在的三元组,即X⃗ijm=0\vec{\textbf{X}}_{ijm}=0X

ijm
=
0

​ 基于这个张量分量的假设,RESCAL\text{RESCAL}RESCAL的损失函数定义为
L=12(∑n∥Xn−ARnA⊤∥F)+12λ(∥A∥F2+∑n∥Rn∥F2)\mathcal{L}=\frac{1}{2}\Big(\sum_n\parallel\textbf{X}_n-\textbf{AR}_n\textbf{A}^\top\parallel_F\Big)+\frac{1}{2}\lambda\Big(\parallel\textbf{A}\parallel_F^2+\sum_n\parallel\textbf{R}_n\parallel_F^2\Big) L=21(nXnARnAF)+21λ(AF2+nRnF2)
其中,第2项是正则化项,λ\lambdaλ是超参数

六、HOLE

RESCAL\text{RESCAL}RESCAL虽然在多关系数据集上表现的很好,但是计算复杂度太高。为了提高RESCAL\text{RESCAL}RESCAL的效率,提出了其增强版本HOLE(Holographic Embeddings)\text{HOLE(Holographic Embeddings)}HOLE(Holographic Embeddings)

HOLE\text{HOLE}HOLE利用了一种称为“循环关联”(circular correlation)的操作来生成组合表示,其类似于联合存储中的holographic模型。循环关联操作★:Rd×Rd→Rd\bigstar:\mathbb{R}^d\times\mathbb{R}^d\rightarrow\mathbb{R}^d:Rd×RdRd介于实体hhhttt之间
h★tk=∑i=0d−1hit(k+i)modd\textbf{h}\bigstar\textbf{t}_k=\sum_{i=0}^{d-1}h_it_{(k+i)mod\;d} htk=i=0d1hit(k+i)modd
上图展示了这个操作的简单例子。

​ 三元组⟨h,r,t⟩\langle h,r,t\rangleh,r,t的概率定义为
P(ϕr(h,t)=1)=Sigmoid(r⊤(h★t))P(\phi_r(h,t)=1)=\text{Sigmoid}(\textbf{r}^\top(\textbf{h}\bigstar\textbf{t})) P(ϕr(h,t)=1)=Sigmoid(r(ht))
​ “循环关联”操作能够带来许多优点:(1) 不同于乘或者卷积的操作,循环关联是不具有交换性的(例如h★t≠t★h\textbf{h}\bigstar\textbf{t}\neq\textbf{t}\bigstar\textbf{h}ht=th),其能够建模知识图谱中的非对称关系;(2) 循环关联的计算复杂度低。此外,“循环关联“操作还能够利用快速傅里叶变换进行进一步的加速。

引用文献

[1]. Zhiyuan Liu, Yankai Lin and Maosong SUn. Representation Learning for Natural Language Processing.

【自然语言处理】【知识图谱】知识图谱表示学习(三):SE、SME、LFM、RESCAL、HOLE相关推荐

  1. 《知识图谱》赵军 学习笔记

    知识图谱读书笔记 文章目录 知识图谱读书笔记 一. 概述 1.1 什么是知识图谱 1.2 知识图谱发展历程 1.3 知识图谱类型 1.4 知识图谱生命周期 知识体系构建 知识获取 知识融合 知识存储 ...

  2. 【自然语言处理】【知识图谱】MTransE:用于交叉知识对齐的多语言知识图谱嵌入

    MTransE:用于交叉知识对齐的多语言知识图谱嵌入 <Multilingual Knowledge Graph Embeddings for Cross-lingual Knowledge A ...

  3. 知识图谱应用——煤矿安全知识图谱构建技术研究学习

    一.研究背景 煤矿安全领域存在着结构化.半结构化以及非结构化等不同种类的数据格式,不同的存储及关联方式,导致煤矿安全领域数据呈现海量离散低效的特点,数据无法被有效地运用起来.构建一个逻辑清晰.覆盖范围 ...

  4. 论文浅尝 | AAAI2020 - 基于生成对抗的知识图谱零样本关系学习

    论文笔记整理:耿玉霞,浙江大学直博生.研究方向:知识图谱,零样本学习等. 来源:AAAI2020 论文链接:https://arxiv.org/pdf/2001.02332.pdf 本文是发表在AAA ...

  5. 基于生成对抗的知识图谱零样本关系学习 AAAI2020

    论文来源:AAAI 2020 论文链接:https://arxiv.org/pdf/2001.02332.pdf 本文是发表在AAAI2020上的一篇基于生成对抗网络进行知识图谱零样本关系学习的文章. ...

  6. 阿里P8架构师制作的24张前端全栈知识图谱,堪称完美学习宝典

    学习一门新技术的时候,最大的苦恼之一,大概就是不知道从何入手. 典型的情况是,你大概知道学会以后,这门技术可以帮你解决什么问题.但是,怎么才能学会.循序渐进的学习路线是什么.学习范围有多大的深度和广度 ...

  7. 【自然语言处理】【知识图谱】SEU:无监督、非神经网络实体对齐超越有监督图神经网络?

    SEU:从对齐到分配----简单有效的无监督实体对齐 <From Alignment to Assignment:Frustratingly Simple Unsupervised Entity ...

  8. 智源论坛 | 知识与认知图谱(5月30日,活动报名)

    活动亮点 智源论坛,AI技术前沿精粹尽览 独家经验分享,顶尖学者零距离 探讨前沿技术,亦分享职业经验 助你成为更好的研究者.工程师 活动报名及报告摘要请扫描文末二维码,或点击"阅读原文&qu ...

  9. 知识工场 | 知识图谱暑假班开始报名啦!

    知识图谱作为大数据时代重要的知识表示方式之一,已经成为人工智能领域的一个重要支撑.8月25日-27日,"复旦大学知识工场实验室"与"上海财经大学信息管理与工程学院&quo ...

最新文章

  1. 报错解决:ERROR: Failed to format E:; DiskPart errorlevel -2147212243.
  2. LIVE 预告 | 达摩院王玮:超大规模中文理解生成联合模型PLUG
  3. String in Java
  4. C#开发笔记,点点细微,处处真情,记录开发中的痛点
  5. (四)训练用于口罩检测的YOLOv5模型
  6. java addall 不能传null_null 之AddAll、Add和Boolean
  7. python人脸融合_用Python玩人脸融合,想知道你未来孩子的长相?(附代码)
  8. f分布表完整图_标准正态分布函数数值表怎么查?(加完整分布函数表)
  9. 【字符串】【KMP模板--最小循环节总结】
  10. 贪吃蛇c语言代贴吧,【图片】C语言小游戏~贪吃蛇【c语言吧】_百度贴吧
  11. cmd 编译class 文件
  12. mysql 表继承_如何在数据库中表示继承?
  13. 联邦贸易委员会:大数据带来的歧视风险
  14. fabric1.4 baas平台以及运维管理sdk
  15. 【论文学习】基于区块链的档案数据保护和共享方法
  16. 请简述Spring MVC的执行流程
  17. ue4当中材质自定义uv和多套uv
  18. 10个免费音效素材下载网站,下载超方便还能免费商用!
  19. 图片转ICO工具新版本(支持更多图片格式,支持更多分辨率,原生更快)
  20. Echarts饼图实现颜色渐变

热门文章

  1. 上位机plc编程入门_plc编程入门-看完你就懂了
  2. ubuntu22.04和ubuntukylin22.04下载安装
  3. 三维浏览软件-JT2GO / 3D Model Viewer JT2GO
  4. 涵洞CAD系统必须实现的功能
  5. bootstrap自学总结不间断更新
  6. 【LeetCode】第374题——猜数字大小(难度:简单)
  7. 微生物组学测序十大错误认知
  8. Mybatis 之 二级缓存
  9. 《国家宝藏》甘肃省博物馆专场:杜淳、黄轩演绎丝路传奇
  10. 超详细Office Online Server部署