作者丨谢若冰

单位丨腾讯微信搜索应用部

研究方向丨知识表示学习

知识图谱被广泛地用来描述世界上的实体和实体之间的关系,一般使用三元组(h,r,t)(head entity, relation, trail entity)的形式来存储知识,其中蕴含的知识数量巨大且时常更新。

目前,人工标注已经不能满足知识图谱更新和增长的速度,但自动化构建知识图谱的过程中往往容易引入一些噪声和冲突。

由于大多数传统知识表示学习(Knowledge, Representation Learning, KRL)方法都假设现有知识图谱中的知识是完全正确的,因此会带来潜在误差。

于是,如何从带有噪声或冲突的知识图谱中学习到更好的知识表示向量,同时又能够发现已有知识图谱中可能存在的错误,就成为了亟需解决的问题

来自清华大学/腾讯的谢若冰研究员,清华大学的刘知远老师,腾讯的林芬研究员和林乐宇研究员,在即将发表于 AAAI 2018 的论文《Does William Shakespeare REALLY Write Hamlet? Knowledge Representation Learning with Confidence》中,提出了一种新的基于置信度的知识表示学习框架(confidence-aware KRL framework,CKRL),能够发现知识图谱中潜在的噪声或冲突,同时更好地从中学习知识表示

作者在 CKRL 模型中主要参考了 TransE 的思路,使用了平移假设(translation-based assumption),并增加了三元组置信度(triple confidence)的概念。整体能量方程如下:

其中,基于平移假设,有:

对于 triple confidence,作者设计了三种模式,分别是 Local Triple Confidence,Prior Path Confidence 以及 Adaptive Path Confidence,基于平移假设,使用三元组的实体、关系,以及实体之间的路径的向量信息,综合对三元组的置信度进行动态调整与学习。

具体地,对于使用 path 的置信度,作者假设如果 (h,r,t) 中 h,t 有越多包含较多信息流的路径,并且这些路径的向量表示与 r 越相似,那么 (h,r,t) 三元组的置信度越高。

整个训练过程中,知识表示和三元组的置信度在能量函数指导下相互影响并动态优化,最终得到考虑置信度的知识表示,并能基于此知识表示完成知识表示学习和知识图谱噪声探测等任务。

在学习的过程中,作者使用了 margin-base score function 进行学习,希望正例得分能够高于负例得分。需要注意的是,由于作者使用的是三元组的向量信息,所以三元组的置信度会在训练过程中发生动态变化。

低置信度的三元组在学习中会相应收到打压,最终使得带有噪声的知识图谱中的知识表示向量能够学得更好,同时减少噪声和错误带来的影响。

CKRL 模型在 noise detection、knowledge graph completion 和 triple classificaiton 三个任务上都取得了较好的结果,同时该模型的思想还可以直接扩展至知识构建环节中,在自动构建方法情境下,帮助建立更加精准的知识图谱。

作者的话

本文是作者在清华大学硕士期间以及在腾讯微信搜索应用部期间完成的工作,在知识表示学习框架中引入了基于结构信息的置信度的概念,能够同时提升知识表示学习和知识图谱噪声探测的效果

作者之前的多篇工作致力于融合多源信息提升知识表示性能,但在知识驱动的实际任务中也存在很多诸如噪声等现实问题。本次工作即是在知识图谱置信度上的一次初步探索,相关思路也可以引入知识构建等知识工程其它环节

点击以下标题查看相关内容:

  • 多源信息表示学习在知识图谱中的应用

  • 「知识表示学习」专题论文推荐 | 每周论文清单

#榜 单 公 布 #


2017年度最值得读的AI论文 | NLP篇 · 评选结果公布

2017年度最值得读的AI论文 | CV篇 · 评选结果公布

我是彩蛋

 解锁新功能:热门职位推荐!

PaperWeekly小程序升级啦

今日arXiv√猜你喜欢√热门职位

找全职找实习都不是问题

 解锁方式 

1. 识别下方二维码打开小程序

2. 用PaperWeekly社区账号进行登陆

3. 登陆后即可解锁所有功能

 职位发布 

请添加小助手微信(pwbot01)进行咨询

长按识别二维码,使用小程序

*点击阅读原文即可注册

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 查看论文 & 源代码

AAAI 2018论文解读 | 基于置信度的知识图谱表示学习框架相关推荐

  1. 论文浅尝 | 基于置信度的知识图谱表示学习框架

    本文转载自公众号:PaperWeekly. 作者丨谢若冰 单位丨腾讯微信搜索应用部 研究方向丨知识表示学习 知识图谱被广泛地用来描述世界上的实体和实体之间的关系,一般使用三元组(h,r,t)(head ...

  2. AAAI 2018论文解读 | 基于文档级问答任务的新注意力模型

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  3. 论文浅尝 | BoxE:一种基于Box的知识图谱表示学习模型

    笔记整理 | 耿玉霞,浙江大学直博生.研究方向:知识图谱,零样本学习等. 论文链接:  https://arxiv.org/pdf/2007.06267.pdf 本文是发表在NeurIPS 2020上 ...

  4. 【浙江大学】一个开源的知识图谱表示学习框架

    一.NeuralKG:一个开源的知识图谱表示学习框架 OpenKG地址:openkg.cn/tool/neuralkg GitHub地址:github.com/zjukg/neuralkg Gitee ...

  5. 今晚直播 | AAAI 2018论文解读:零资源机器翻译的最新进展

    「PhD Talk」是 PaperWeekly 的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义 ...

  6. ACL 2018论文解读 | 基于排序思想的弱监督关系抽取选种与降噪算法

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  7. 直播实录 | AAAI 2018论文解读:零资源机器翻译的最新进展

    本文为 4 月 11 日,香港大学博士生--陈云博士在第 26 期 PhD Talk 中的直播分享实录. 4 月 11 日晚,来自香港大学的博士生陈云现身 PaperWeekly 斗鱼直播间,向大家介 ...

  8. CVPR 2018论文解读 | 基于域适应弱监督学习的目标检测

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  9. 直播 | CIKM 2021论文解读:基于广群的知识图谱表示学习统一模型框架

    「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和 ...

最新文章

  1. TLD文件中body-content四种类型(能力工场)
  2. Java读写二进制数据
  3. Windows SDK 非模态对话框的消息处理
  4. main 函数解析(二)—— Linux-0.11 学习笔记(六)
  5. mysql as tmp,启动mysql时显示:/tmp/mysql.sock 不存在的解决办法
  6. Java 反射机制和动态代理是基于什么原理,了解过吗?
  7. memcpy和strcpy函数
  8. 设计导航网站|解决寻找合适的字体麻烦
  9. AD19 add pins to nets错误_NGINX 502 Bad Gateway错误疑难解答
  10. 【less-24】基于SQLI的二次注入
  11. 第三方支付处理厂商软件有漏洞,日本美容零售商Acro 10万支付卡信息遭攻击
  12. struts2 jsp提交对象数据要这么干
  13. 使用border制作的css三角形
  14. JavaScript 封装对象与强制类型转换
  15. 计算机未来发展情况作文,未来的计算机作文600字|未来的计算机作文
  16. Markdown安装,破解,修改中文
  17. Arcgis一些操作
  18. 再次风靡春节的《熊出没》,究竟下了哪些硬功夫?
  19. 基于5g的交通运输_一种基于5G的智慧交通基础服务平台
  20. 计算机网络技术文档心得,计算机网络技术学习心得体会.docx

热门文章

  1. vue创建脚手架 cil
  2. centos图形界面的开启和关闭
  3. 大数据技术之Stome 概念
  4. django - 替换admin的textarea为 富文本
  5. SqlParameter的作用与用法
  6. 【数据库】如何解决数据库附加失败问题
  7. ibatis和myibatis
  8. 奥运年08/07/19我正式加入博客园,开始.net的新征程^-^
  9. oledb 访问接口sqlncli10返回了消息 没有活动事务_这样理解分布式事务你是不是就会懂了?...
  10. 我的世界java和pe版_《我的世界》pe版不一样的方块世界