论文笔记整理:邓淑敏,浙江大学在读博士,研究方向为低资源条件下知识图谱自动化构建关键技术研究。


论文链接:https://openreview.net/pdf?id=SygWvAVFPr

Demo链接: https://demo.allennlp.org/reading-comprehension

代码链接: https://nitishgupta.github.io/nmn-drop/

这篇文章解决的任务是复杂问题问答,比如回答“谁在第二节比赛中得到最高分?”类似的问题。解决这个任务需要:理解问题->在蕴含答案的文本中做信息抽取à符号推理,所以问题的难点也显而易见:(1)理解问句语义,将复杂问题拆分成简单问题;(2)文本理解,理解文本中实体、关系和事件等;(3)进行推理,比如判断大小,计数等。传统的方法比如语义解析,或者pipeline的模型,要么需要基于结构化或半结构化数据去做,要么在子任务中依赖更多的监督信号,这对复杂问题问答任务来说都很难实现。因此这篇文章提出用神经模块网络去解决这个问题,先将问题解析成logicalform,然后在文本中运行可执行的模块。这里的模块可看成用于推理的可学习的函数。

模块概览

复杂问题问答包含的推理可分为两大类:自然语言推理和符号推理。自然语言推理可以看成是文本信息抽取的过程,符号推理就是基于抽取出的结构化知识进行推理判断。这两大类推理中定义的模块如上图所示。

下面看一个用神经模块网络解复杂问题问答的例子。

第一步:将问题解析成logicalform。

将问题解析成logicalform

第二步:在蕴含答案的文本中执行模块。

模块运行的最终结果

执行第一个模块:find(),找出得分这个实体

执行第二个模块:find-num(),找出得分的数值

执行第三个模块:max-num(),找出最大的得分值

执行第四个模块:extract-argument(),找出得到最大得分的人,这个模块类似于事件抽取中的argumentextraction

那接下来的问题就在于,如何组合这些模块,以及如何学习出这些模块。组合这些模块目前主要用一些seq-to-seq的模型,至于学习这些模块,下面给出学习find()模块的示例。

问题的嵌入用Q表示,蕴含答案的文本嵌入用P表示,find(Q)->P,输入问句的tokens,输出蕴含答案的文本中和输入tokens相同或相似的token分布,如下图所示

find(Q)->P示例

具体做法就是先计算一个“问题-蕴含答案文本”的相似度矩阵

然后按行标准化S,得到“问题-蕴含答案文本”的权重矩阵

最后得到蕴含答案文本的token权重分布:

其他模块的做法这里就不赘述了,可以参见原文。

本文的实验用了DROP数据集(https://www.aclweb.org/anthology/N19-1246.pdf),实验结果如下

实体预测的实验结果比较

由于篇幅限制省略了一些细节,如果大家对这篇文章的工作感兴趣,可以阅读原文,也欢迎一起交流。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 - ICLR 2020 | 用于文本推理的神经模块网络相关推荐

  1. 论文浅尝 | ICLR 2020 - 一文全览知识图谱研究

    本文转载自公众号: AI科技评论 作者 | Michael Galkin 编译 | 贾伟 ICLR 2020 正在进行,但总结笔记却相继出炉.我们曾对 ICLR 2020 上的趋势进行介绍,本文考虑的 ...

  2. 论文浅尝 | ICLR 2020 - 图神经网络的预训练策略

    论文笔记整理:杨帆,浙江大学计算机学院. 动机 现有的用于图结构的预训练方法要么只关注node-level,导致在图表示空间没有区分度,要么只关注graph-level,导致在节点表示空间没有区分度. ...

  3. 论文浅尝 | 面向时序知识图谱推理的循环事件网络

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识库问答. 来源:arXiv (short version accepted at ICLR 2019Workshop on Representati ...

  4. 论文浅尝 | 一种用于多关系问答的可解释推理网络

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答. 来源:COLING 2018 链接:https://www.aclweb.org/anthology/C18-1171 问题背景与 ...

  5. 论文浅尝 | ICLR2020 - 基于组合的多关系图卷积网络

    论文笔记整理:吴锐,东南大学计算机学院硕士. 来源:ICLR 2020 链接:https://arxiv.org/pdf/1911.03082.pdf 动机 目前针对于GCN的研究大多数都关注在学习无 ...

  6. 论文浅尝 - WWW2020 | 生成多跳推理问题以改善机器阅读理解能力

    论文笔记整理:谭亦鸣,东南大学博士生. 来源:WWW 2020 链接: https://dl.acm.org/doi/pdf/10.1145/3366423.3380114 概述 这篇论文关注的任务是 ...

  7. 论文浅尝 | HEAD-QA: 一个面向复杂推理的医疗保健数据集

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识库问答. 来源:ACL2019 本文构建了一个面向复杂推理任务的多选问答数据集 HEAD-QA,该数据集中的问题来自一个西班牙的医疗保健专业测试,对 ...

  8. 论文浅尝 | 时序与因果关系联合推理

    论文笔记整理:李昊轩,南京大学硕士,研究方向为知识图谱.自然语言处理. 来源:ACL2018 链接:https://www.aclweb.org/anthology/P18-1212 动机 理解事件之 ...

  9. 论文浅尝 | 用增强学习进行推理:问答与知识库完善(KBC)

    本文转载自公众号:程序媛的日常. 利用知识库.知识图谱来完善问答系统,有非常广阔的实际应用场景.当用户提出一个问题时,有时候仅用知识库中的某一个三元组事实(fact triple)即可回答.但当问题比 ...

最新文章

  1. PCA主成分分析以及Python实现(阅读笔记)
  2. 使用jquery的getJSON从服务器端获得数据
  3. C语言读取txt文档中的数据
  4. LeetCode 1954. 收集足够苹果的最小花园周长(数学)
  5. echarts图使用tab和下拉切换
  6. 学习opencv之cvtColor
  7. mysql导入报错1071_导入sql文件报错:1071 Specified key was too long; max key length is 767 bytes...
  8. TLS1.3---密钥的计算
  9. 经典作品推荐CLANNAD(含下载、汉化、周边和攻略,真正全语音)
  10. 每天15分钟中度或快步走以燃烧100卡路里的热量
  11. MySQL基础学习笔记——关于KEY的说明
  12. 抗混叠滤波及折叠频率
  13. 快速上手 ClickHouse
  14. Unity——螺旋运动
  15. 首富马斯克裁员大反转。
  16. 帆软认证报表工程师(FCRA)考试考题(我的错题记录)
  17. LittlevGL初体验
  18. POX及组件启动分析
  19. 4G 模块HTTP连接Web Server 提交数据到PHP
  20. 计算机系统实验:模型机(十六)另一篇?

热门文章

  1. C++11 新特性 —— 关键字noexcept
  2. Redis源码分析之小型测试框架testhelp.h和redis-check-aof.c日志检测
  3. UDT源码剖析(六):UDT::socket()过程代码注释
  4. mysql开启慢查询日志及查询--windows
  5. 为何要使用docker
  6. html判断坐标,js判断鼠标位置是否在某个div中的方法
  7. 微电子科学与工程要学计算机吗,微电子科学与工程专业就业前景如何 有前途吗...
  8. getmodifiers java_java – getModifiers()方法如何计算多个修饰符的值?
  9. JS面向对象——class定义类、类的构造函数、实例方法、访问器方法、静态方法、继承、super、多态
  10. HDFS Java API 实践