本文内容源自往期「论文浅尝」,由 PaperWeekly 精选并重新排版整理,感谢 PaperWeekly。


ISWC 2018

■ 链接 | http://www.paperweekly.site/papers/1912

■ 源码 | https://github.com/quyingqi/kbqa-ar-smcnn

■ 解读 | 吴桐桐,东南大学博士生,研究方向为自然语言问答

概述

随着近年来知识库的快速发展,基于知识库的问答系统(KBQA )吸引了业界的广泛关注。该类问答系统秉承先编码再比较的设计思路,即先将问题和知识库中的三元组联合编码至统一的向量空间,然后在该向量空间内做问题和候选答案间的相似度计算。该类方法简单有效,可操作性比较强,然而忽视了很多自然语言词面的原始信息。

因此,本文提出了一种 Attentive RNN with Similarity Matrix based CNN(AR-SMCNN)模型,利用 RNN 和 CNN 自身的结构特点分层提取有用信息。

文中使用 RNN 的序列建模本质来捕获语义级关联,并使用注意机制同时跟踪实体和关系。同时,文中使用基于 CNN 的相似矩阵和双向池化操作建模数据间空间相关性的强度来计算词语字面的匹配程度。

此外,文中设计了一种新的实体检测启发式扩展方法,大大降低了噪声的影响。文中的方法在准确性和效率上都超越了 SimpleQuestion 基准测试的当前最好水平。

模型

模型如上图所示,假设单关系问题可以通过用单一主题和关系论证来查询知识库来回答。因此,只需要元组(s,r)来匹配问题。只要s和r的预测都是正确的,就可以直接得到答案(这显然对应于o)。

根据上述假设,问题可以通过以下两个步骤来解决:

1. 确定问题涉及的 Freebase 中的候选实体。给定一个问题 Q,我们需要找出实体提及(mention)X,那么名称或别名与实体提及相同的所有实体将组成实体候选 E。现在 E 中的所有实体都具有相同的实体名称,因此我们暂时无法区分他们。具体地,模型中将命名实体识别转换成了基于 Bi-LSTM 完成的序列标注任务。

2. 所有与 E 中的实体相关的关系都被视为候选关系,命名为 R。我们将问题转换为模式 P,它是通过用 <e> 替换问题中的提及而创建的。为了找出与问题真正相关的关系,我们将 P 与 R 中的每个关系进行比较并对它们进行评分,然后将得分最高的关系作为最终结果。

为了更好地进行关系匹配,模型从单词字面表达和语义两个层面对自然语言进行了建模。具体操作如下图所示:

图中所示的 AR-SMCNN 模型,输入是经替换 mention 后的问题模版(pattern)P 和候选关系 rk。

模型左边的部分是结合了 attention 机制的 BiGRU,用于从语义层面进行建模。右边的部分是 CNN 上的相似性矩阵,用于从字面角度进行建模。最终将特征

论文浅尝 | 从 6 篇顶会论文看「知识图谱」领域最新研究进展 | 解读 代码相关推荐

  1. 从 6 篇顶会论文看「知识图谱」领域最新研究进展 | 解读 代码

    ISWC 2018 ■ 链接 | http://www.paperweekly.site/papers/1912 ■ 源码 | https://github.com/quyingqi/kbqa-ar- ...

  2. 专题解读 |「知识图谱」领域近期值得读的 6 篇顶会论文

    本期内容选编自微信公众号「开放知识图谱」. CIKM 2017 ■ 论文 | Hike: A Hybrid Human-Machine Method for Entity Alignmentin La ...

  3. 论文浅尝 | 「知识图谱」领域近期值得读的 6 篇顶会论文

    本文转载自公众号:PaperWeekly. CIKM 2017 ■ 论文 | Hike: A Hybrid Human-Machine Method for Entity Alignmentin La ...

  4. 「知识图谱」领域近期值得读的 6 篇顶会论文

    CIKM 2017 论文 | Hike: A Hybrid Human-Machine Method for Entity Alignmentin Large-Scale Knowledge Base ...

  5. 论文浅尝 | PairRE: 通过成对的关系向量实现知识图谱嵌入

    笔记整理:黎洲波,浙江大学硕士,研究方向为自然语言处理.知识图谱. 研究背景 知识图谱因其在问答.语义解析和命名实体消歧等任务取得了良好的效果而受到广泛关注,而大部分知识图谱都存在不全和缺失实体链接的 ...

  6. 论文浅尝 | 利用机器翻译和多任务学习进行复杂的知识图谱问答

    笔记整理 | 谭亦鸣,东南大学博士生. 来源:EACL'21 链接:https://www.aclweb.org/anthology/2021.eacl-main.300.pdf 概述 知识图谱问答过 ...

  7. 论文浅尝 - IJCAI | Knowledge is NOT always you need: 外部知识注入预训练模型的利与弊...

    转载公众号 | 浙大KG 论文题目:Drop Redundant, Shrink Irrelevant: Selective Knowledge Injection for Language Mode ...

  8. 论文浅尝 - AAAI2020 | 多轮对话系统中的历史自适应知识融合机制

    论文笔记整理:潘锐,天津大学硕士. 链接:https://www.aaai.org/ojs/index.php/AAAI/article/view/6425 来    源:AAAI 2020 论文简介 ...

  9. 论文浅尝 - SIAM ICDM 2020 | 基于图时空网络的知识引导的诊断预测

    论文笔记整理:吴锐,东南大学硕士. 来源:SIAM ICDM 2020 论文下载地址: https://epubs.siam.org/doi/abs/10.1137/1.9781611976236.3 ...

最新文章

  1. java布局工具,Java Swing:库,工具,布局管理器
  2. web 平台搭建-LNMP-源码包(CentOS-6)
  3. 正确重置MySQL密码
  4. jquery radiobutton使用
  5. 小白学开发(iOS)OC_ SEL数据类型(2015-08-10)
  6. 对象的可访问性(C++)
  7. MacOS 开发 —后台启动程序
  8. html如何设置按钮背景为透明,css 设置按钮(背景色渐变、背景色透明)
  9. 工业云计算技术在工业自动化系统中的作用
  10. 设置Android应用全屏显示(隐藏手机状态栏)
  11. 1146 mysql_MySQL错误处理--1146错误
  12. 前端常见面试题 —— BFC是什么?
  13. 使用ansys workbench 的LSDYNA模块研究碰撞的接触设置
  14. 计算机系统缺什么安装CAD闪退咋办,CAD2016闪退怎么解决Win7
  15. Android警告信息:Use Autofill
  16. select下拉选项禁用
  17. 多线程分批次查询数据
  18. Python量化分析(1)——Tushare的使用介绍
  19. OC--category(类目、分类、类别)
  20. 不务正业之音乐节奏灯

热门文章

  1. gcc和g++有什么区别?
  2. 马上工作了,想问下要注意哪些问题?
  3. MATLAB —— 绘图
  4. 每日一题(40)—— 字符串常量
  5. 每日一题(11)—— 结构体大小
  6. IDEA中中文乱码问题解决方案
  7. node : 无法将“node”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。
  8. ubuntu php 解析,ubuntu运行后台php服务详解
  9. LeetCode 1991. 找到数组的中间位置(前缀和)
  10. LeetCode 1855. 下标对中的最大距离(双指针)