方法

本文方法主要有两部分组成。(1)将知识图谱用带权重的文本特征进行拓展,然后利用随机游走生成集合序列输入到skipgram模型,从而生成KB空间。(2)将text转化为KB中的entity可以通过一个multi-sence监督模型(lstm+消歧机制),将每一个text生成一个KB空间的点。

实体向量的文本特征

对于KB空间,我们将根据Perozzi et al. (2014)提出的通用方法,我们从KB中手工收集一个随机游走的集合,作为skipgram模型的输入。对于一个随机游走的序列n1,n2 ,...,nT,和上下文窗口大小c,skipgram模型将最大化下面这个函数

因此,如果拓扑结构中两个节点相近,则两个向量也比较近。虽然这样的拓扑结构允许点之间相似性的比较,但是并不能直接用于与text to entity的任务,原因是在KB图中形成的社区(以及由此产生的向量空间的拓扑结构)主要反映的是特定于领域的层次结构和本体关系,而这些关系并不一定是通过引用实体的文本表示来体现的。因此,对于所提议的方法,一个重要的问题是如何在两个表示(embedding)之间提供有意义的联系,以便有效地将一种text转换成entity。

在本文中,我们用文本特征(textual features)链接KG中的每一个点。文本特征与实体之间的边都有权重表示文本特征对实体的重要性。对于每一个实体,我们收集KG本身和BabelNet英语部分中所有可以描述该实体的文本表述。文本表述可以认为是短文档,表述中的每一个词都具有一个tf-idf的值,从而形成实体的文本特征集。

只是图谱将以下述方式进行扩充:Tc是实体c的文本特征集,对于Tc中任意的t,我们增加一条边(t,c),且权重为tf-idfc(t)

。与Perozzi et al. (2014)使用均匀分布的采样策略相比,本文定义随机游走的过程如下:给定一个随机游走的起点n,其实体邻居集为cn={t1,t2,...,tN},文本特征集合Tn={t1,...,tM}。因此,随机游走序列的下一个节点将通过下诉公式得到

如果λ=0时,随机游走序列将仅从实体节点集合中获得,因此随机游走序列只包含实体节点。这将与Perozzi et al. (2014)提出的Deepwalk相同;如果λ=1时,效果将不那么直观。由于文本特征只与实体节点相连接,如果当前的节点是文本特征节点,则下一个节点将实体集合Cn中采样。因此当λ=1产生的随机游走路径将是实体节点和文本也正节点交替出现。λ取0-1之间的值,将在上述两种情况进行调整。具体情况如下图所示

A multi-sense LSTM

本文提出一个text-to-entity 的神经网络框架,目标是给定一个text,在KB空间中产生一个点,找到最近的entity或者concept。模型通过训练扩展知识图谱的文本和实体向量。我们的结构对语义歧义是铭感的。所以需要一个消除歧义的机制。具体的网络结构如下图:

网络结构有一个普通的embedding层,一个词义消歧层和两个LSTM网络将text编码为KG空间的向量。最终的目标就是MSE,如下。

N为训练样本的个数,x为输入的文本,y为目标实体的向量,f为上述的网络。为了解决词的歧义,每一个词都有一个generic embedding 和 k sense embeddings。sense embeddings可以认为是词在训练集中不同使用的类心,在训练过程中动态更新。此外,每一个词还有一个context embedding,有其上下文词的generic embedding平均得到。在已知context embedding的条件下,每一个sense embedding sij的概率如下,其中s‘ij = tanh(W sij+U ci),W,U和U'为attentional network的参数

sij的更新如下,最终attention的输出为sij与其概率的加权和,然后作为LSTM的输入。

LSTM的输入:context embedding,sense embedding加权和,generic embedding,所以如下图:

个人理解:

  1. 加入文本信息,增加知识库中的实体通过文本特征的链接,从而增大知识库的稠密度。并且,从某种程度上加大实体之间的相似度。(本来知识库中两个实体不连接,现在可能通过相同的文本特征链接在一起,使其相似性更进一步)
  2. 利用random walk 采样出序列
  3. 利用skigram模型,学习实体的向量表示
  4. 利用神经网络模型,将text进行向量表示,与3中得到的实体向量进行向量表示,学习出text的三种embedding
  5. 利用word的embedding,通过网络,得到textembedding,选择与其最近的entity embedding,则改entity即为所求

Mapping Text to Knowledge Graph Entities using Multi-Sense LSTMs相关推荐

  1. SSP: Semantic Space Projection for Knowledge Graph Embedding with Text Descriptions 论文读书笔记

    SSP: Semantic Space Projection for Knowledge Graph Embedding with Text Descriptions 论文读书笔记 1. Motiva ...

  2. 《knowledge graph embedding:a survey of approaches and applications》论文阅读

    发表于TKDE 2017. knowledge graph embedding:a survey of approaches and applications abstract 1. introduc ...

  3. [转发]知识图谱 (Knowledge Graph) 专知 荟萃

    知识图谱 (Knowledge Graph) 专知 荟萃 入门学习 大规模知识图谱技术 王昊奋 华东理工大学 [http://history.ccf.org.cn/sites/ccf/xhdtnry. ...

  4. HAKE笔记:Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction

    原文:Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction 代码:https://github.com/MIR ...

  5. cs224w(图机器学习)2021冬季课程学习笔记12 Knowledge Graph Embeddings

    诸神缄默不语-个人CSDN博文目录 cs224w(图机器学习)2021冬季课程学习笔记集合 文章目录 1. Heterogeneous Graphs and Relational GCN (RGCN) ...

  6. Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction论文阅读笔记

    我的博客链接 0. 前言 1. 作者试图解决什么问题? 作者想在KGE中对语义层级(semantic hierarchies)进行建模. 2. 这篇论文的关键元素是什么? semantic hiera ...

  7. 论文笔记:Sequence-to-Sequence Knowledge Graph Completion and QuestionAnswering

    Sequence-to-Sequence Knowledge Graph Completion and Question 备注:ACL 2022 Main Conference 链接:https:// ...

  8. 学习Knowledge Graph Embedding Based Question Answering代码笔记

    前言 最近被导师安排学习一下[Knowledge Graph Embedding Based Question Answering] 这篇paper,这篇paper的重点在于运用了Knowledge ...

  9. 尝试阅读和理解 PairRE: Knowledge Graph Embeddings via Paired Relation Vectors

    文章提出面临的问题 Since most knowledge graphs suffer from incompleteness, predicting missing links between e ...

  10. 【企业数智化转型】知识图谱(Knowledge Graph)

    关键词:基于行为的学习,基于知识的学习,商业智能,工业4.0,知识图谱,企业图谱, 图数据库, 图计算引擎, 数据可视化 应用场景:征信.风控.问答.医疗.能源.舆情.反欺诈.市场营销.社交网络.企业 ...

最新文章

  1. poj-1031-fence(不是我写的,我只是想看着方便)
  2. OpenCV基本绘图
  3. 2019春第四周作业软件
  4. 计算机系统优化的目的和原理,优化原理
  5. Silverlight中摄像头的运用—part2
  6. 多Kinect下WaitNoneUpdateAll老是报错,烦躁……
  7. OJ1055: 兔子繁殖问题(C语言计算斐波那契数列/“兔子数列”)
  8. 使用 jQuery Mobile 与 HTML5 开发 Web App (八) —— jQuery Mobile 工具栏
  9. mysql触发器的简单入门(二)
  10. 《统计学习方法》P179页10.22前向后向算法公式推导
  11. 樊昌信 通信原理第七版 第十一章 思考题答案
  12. GetData Graph Digitizer软件的使用方法
  13. 开发工具总结(8)之图文并茂全面总结上百个AS好用的插件(下)
  14. 【贝尔链创始人Vincent: 区块链不仅是技术革命 更是认知革命】
  15. excel不使用科学计数法
  16. 39岁java程序员,失业中,看不到希望,很迷茫,路在何方?
  17. 十年前加入互联网改变世界,十年后加入顶级微信团队一起炸屎
  18. 互联网+大赛作品_“颂中国力量 绘美好梦想”全市中小学生互联网+书画大赛作品展示(四)...
  19. 第15章-4~6 装配体静力学分析经验技巧总结篇 (工作原理的简化、约束、预紧力、载荷、后处理)高效修改接触对、suppress(抑制)、多工位(多步计算)的螺栓预紧力设置
  20. regopenkeyexfailed什么意思_外置网卡驱动安装出现RegOpenKeyEx Failed,怎么回事?

热门文章

  1. Unity 异步加载场景
  2. LINUX下查看CPU使用率的命令[Z]
  3. java基础-- 集合框架入门 及 List集合
  4. easyUI 之datagrid 在前端自定义排序
  5. Objective-C的动态特性
  6. HDU 2815 扩展baby step giant step 算法
  7. 页面上拖动图片进行排序
  8. 【整理】牛客网编程题-前端篇(入门难度)
  9. 【CV学习笔记】图像的计算
  10. 【干货笔记】Generating Question-Answer Hierarchies阅读笔记