https://arxiv.org/abs/1809.09414

论文研究背景

两个“不可避免” 知识图谱在构建中不可避免的引入噪声和冲突 基于知识图谱的任务假设知识图谱中的知识是完全正确的,不可避免的会带来潜在的偏差

两个“挑战” 对于KG中的一条知识,特别是来自专业领域的知识,没有经过实践检验或没有严格的数学证明,很难清楚地确定是否正确。 知识图谱中的实体之间存在着错综复杂的关系,不同实体之间可以发生相同的关系,多个关系可以同时关联到同一个实体 。

本文想要建立一个知识图谱三元组可信度度量模型 , 量化知识图谱的语义正确性和所表达事实的真实程度。模型是一个神经网络结构 它综合三元组中的内部语义信息和KG的全局推理信息, 实现实体级、关系级、KG全局级三个层次上的可信性度量和融合。

[实体层面]实体对之间可能存在关系吗?

本文根据资源分配的思想,提出了一种算法ResourceRank。

算法思想:如果实体对(h,t)之间的关联更强,更多的资源会在图中从头部h通过所有关联路径传递到尾部t。 聚合到t的资源数量巧妙地表示了从h到t的关联强度。

算法主要包括三个步骤: ①构建以头部实体h为中心的有向图。 ②迭代图中资源的流向直到收敛并计算出尾部实体t的资源保留值。 ③综合其他特征并输出(h, ?,t)的可能性。

基于PageRank算法模拟资源流动直至分布稳定。尾部实体上的资源值为R(t|h)计算如下:

我们构造一个特征向量V。经过激活函数后,向量被转化为一个概率值RR(h,t),表示头实体h和尾实体t之间可能存在一种或多种关系的可能性:

[关系层面]关系r是否会发生实体对(h,t)之间?

上述估计器只能测量实体对之间发生不确定关系的可能性,而不能测量是哪种关系。

受词嵌入空间中的平移不变性现象的启发,将KG中的关系视为实体之间的某种平移; 即关系向量r作为头实体嵌入h和尾实体嵌入t之间的转换操作。

比如:一个值得信赖的三元组(h,r,t),应该满足h + r ≈ t。(TransE)

算法主要包括2个步骤: ①利用表示学习技术实现实体或关系的低维分布式表示。②使用修改后的sigmoid函数将E(h,r,t)转换为实体对(h,t)构成关系r的概率。

δr是一个与关系r相关的阈值 λ是一个用于平滑的超参数,可以随着模型训练动态调整。

[KG全局层面]KG中的相关三元组能否推断三元组是值得信赖的?

受“社会身份”理论的启发,做一个比喻:将KG视为一个社会群体,其中每个三元组都是一个个体。其他个体对目标个体(目标三元组)的认同程度反映了目标个体是否能恰当地融入社会(KG)。

我们设计了一个可达路径推理算法来满足它。从头实体到尾实体之间存在大量的多步路径,这些路径表明了三元组之间的语义相关性和复杂的推理模式。

可达路径选择:在大规模的KG中,与三元组相关联的可达路径的数量可能是巨大的。对所有路径进行权衡是非常消耗资源的。同时,并不是所有的路径都是有意义和可靠的。

可达路径表示:选择路径后,需要将每条路径映射为低维向量,以便后续计算。我们考虑路径中整个三元组,不仅包括关系,还包括头、尾实体,每个三元组的三个元素的嵌入被连接成一个单元。

我们使用RNNs来学习路径中包含的语义信息。RNN层通过考虑从s1到st的前向信息对st进行编码。 我们使用输出向量ht的值来表示每条路 径的语义信息,缝合输出的ht将topk条路径中的h拼接在一 起形成一个向量 。

融合三个估计器得到最终的三元组置信度

将前面三部分的输出拼接成每个三元组s=(h,r,t)的特征向量f(s)。

向量f(s)将输入到融合器中,并通过多个隐藏层进行转换。输出层是一个二元分类器,将y=1的标签分配给真元组,将y=0的标签分配给假元组。

 噪声/错误从哪来?

考虑到现实世界中大多数错误来自相似实体之间的误解的经验。

将正三元组中的一个实体或关系被三元组集合中的另一个实体或关系随机替换,确保替换后生成的负三元组不在三元组集合中。

实验结果

 

虽然是很多年前的文章了,但是用作三元组的质检还是一个很好的思路,考虑了三个方面的置信度检测,并且整个部分是非耦合的,可解释性也比较好。

GitHub地址:

https://github.com/TJUNLP/TTMF

论文阅读《Triple Trustworthiness Measurement for Knowledge Graph》相关推荐

  1. 《基于卷积神经网络的深度迁移学习,用于燃气轮机燃烧室的故障检测》论文阅读

    目录 突出 抽象 引言 1.1动机 1.2文献综述获得的结论 1.3贡献 1.4组织 2方法 2.1燃汽轮机组故障知识共享 2.2迁移学习 2.3 基于卷积神经网络的深度迁移学习 2.4用于燃气轮机燃 ...

  2. 基于卷积神经网络和投票机制的三维模型分类与检索 2019 论文笔记

    作者:白静 计算机辅助设计与图形学学报 1.解决的问题 由于三维模型投影得到的视图是由不同视点得到,具有相对独立性,这种像素级的融合运算并没有直接的物理或者几何意义,更有可能造成图像有益信息淹没和混淆 ...

  3. TextCNN——基于卷积神经网络的文本分类学习

    1.CNN基础内容 CNN的全称是Convolutional Neural Network,是一种前馈神经网络.由一个或多个卷积层.池化层以及顶部的全连接层组成,在图像处理领域表现出色. 本文主要学习 ...

  4. 读懂深度迁移学习,看这文就够了 | 赠书

    百度前首席科学家.斯坦福大学副教授吴恩达(Andrew Ng)曾经说过:迁移学习将是继监督学习之后的下一个促使机器学习成功商业化的驱动力. 本文选自<深度学习500问:AI工程师面试宝典> ...

  5. 一种基于卷积神经网络的图像去雾研究-含matlab代码

    目录 一.绪论 二.去雾卷积网络 2.1 特征提取 2.2 多尺度映射 2.3 局部均值 2.4 非线性回归 三.实验与分析 四.Matlab代码获取 一.绪论 雾是一种常见的大气现象,空气中悬浮的水 ...

  6. 机械臂论文笔记(一)【基于卷积神经网络的二指机械手 抓取姿态生成研究 】

    基于卷积神经网络的二指机械手 抓取姿态生成研究 论文下载 摘要 第1章 绪论 1.1 抓取生成国内外研究现状 1.1.1已知物体抓取生成 1.1.2相似物体抓取生成 1.1.3 未知物体抓取生成 1. ...

  7. 毕业设计 - 基于卷积神经网络的乳腺癌分类 深度学习 医学图像

    文章目录 1 前言 2 前言 3 数据集 3.1 良性样本 3.2 病变样本 4 开发环境 5 代码实现 5.1 实现流程 5.2 部分代码实现 5.2.1 导入库 5.2.2 图像加载 5.2.3 ...

  8. 基于卷积神经网络与迁移学习的油茶病害图像识别

    基于卷积神经网络与迁移学习的油茶病害图像识别 1.研究思路 利用深度卷积神经网络强大的特征学习和特征表达能力来自动学习油茶病害特征,并借助迁移学习方法将AlexNet模型在ImageNet图像数据集上 ...

  9. Python深度学习实例--基于卷积神经网络的小型数据处理(猫狗分类)

    Python深度学习实例--基于卷积神经网络的小型数据处理(猫狗分类) 1.卷积神经网络 1.1卷积神经网络简介 1.2卷积运算 1.3 深度学习与小数据问题的相关性 2.下载数据 2.1下载原始数据 ...

  10. 基于卷积神经网络实现图片风格的迁移 1

    卷积神经网络详解 一.实验介绍 1.1 实验内容 Prisma 是最近很火的一款APP,它能够将一张普通的图像转换成各种艺术风格的图像.本课程基于卷积神经网络,使用Caffe框架,探讨图片风格迁移背后 ...

最新文章

  1. MYSQL注入天书之前言
  2. 苹果后门、微软垄断与Linux缺位
  3. git pull 显示的冲突---解决办法git stash
  4. 避免button处理事件过程中 点击按钮触发事件的方法
  5. bzoj3110 [Zjoi2013]K大数查询
  6. java main传入参数_Main方法中传入参数
  7. sencha touch 彩色图标按钮(button+ico)
  8. css不继承上级样式_CSS基础知识(一)
  9. 电子元件 —— 二极管
  10. 力扣-111. 二叉树的最小深度
  11. NPM 上传自己的包
  12. XSD文件与XML文件有什么关系
  13. 如何下载没有水印的小咖秀和晃咖视频?教你个超级简单的方法
  14. 服务器交换机在机柜位置,1米2米1.2米机柜22u24u网络服务器交换机图腾机柜
  15. linux 中 lrwxrwxrwx是什么意思?
  16. 使用密码字典 和 Python自带的pywifi模块穷举WIFI密码
  17. VASP计算笔记_弹性常数计算
  18. 2021大厂Android面试经历,吐血整理
  19. 多麦克风做拾音的波束_【语音交互】先从麦克风阵列聊起
  20. winbox配置静态IP上网步骤

热门文章

  1. 苹果机器学习博客姗姗来迟,不过第一篇文章就给紧缺训练数据的研究者们发糖...
  2. 如果房贷被拒了怎么办?
  3. opencv c++ Harris角点检测、shi-tomasi角点
  4. 【Python】windows下Eclipse中安装集成webpy框架
  5. UIP协议栈笔记·一
  6. 多维多重背包问题_多重背包问题
  7. Java分页查询详解
  8. Programing Exercise 4:Neural Networks Learning
  9. python科学计算主要学什么_以下哪些是python常用的科学计算库?_学小易找答案
  10. 折纸问题(规律题)(map的使用)