目录

  • 简介
  • 动机
  • 贡献
  • 方法
  • 实验

简介

本文面向机器阅读理解问题(Machine Reading Comprehension),作者来自微软研究院。
下载链接

动机

现有的方法可以分为两类:单步推理(Single turn)、多步推理(multiple turns)。多步推理是由单步推理衍生而来,单步推理又可以看做是多步推理的特例(turn=1)。这两种方法的共同点是,推理轮数固定,这不符合人类的阅读行为。人会根据当前是否得到了足够的信息,决定中止阅读或继续阅读。本文基于此动机,提出ReasoNet,可以动态决定推理轮数。

贡献

  1. 将强化学习和多步推理结合,可动态终止推理过程。
  2. 实验结果较好,是SOTA模型。

方法

本文方法的整体架构如下图所示。按照原文的划分,主要包括5个部分,下面一一介绍。

  • Memory
    是一个外部库,M={mi}i=1...DM=\{m_i\}_{i=1...D}M={mi​}i=1...D​,用于生成attention。
  • Attention
    通过隐状态和外部库,得到当前时间步的attention,xt=fatt(st,M;θx)x_t=f_{att}(s_t,M;\theta_x)xt​=fatt​(st​,M;θx​)
  • Internel State
    每个时间步的隐状态,通过RNN得到,st+1=RNN(st,xt;θs)s_{t+1}=RNN(s_t,x_t;\theta_s)st+1​=RNN(st​,xt​;θs​)
  • Termination Gate
    终止门,用于判断当前时间步是否终止,tt∼p(⋅∣ftg(st;θtg))t_t \sim p(·|f_{tg}(s_t;\theta_{tg}))tt​∼p(⋅∣ftg​(st​;θtg​)),ttt_ttt​是一个二值随机变量,当它是true时,终止。
  • Answer
    当tt=truet_t=truett​=true时,得到answer,at∼p(⋅∣fa(st;θa))a_t \sim p(·|f_a(s_t;\theta_a))at​∼p(⋅∣fa​(st​;θa​))

整个Inference过程如算法1所示:

在模型的优化过程中,梯度计算公式为:

上式中,bTb_TbT​一般是预设的值bT=Eπ[rT]b_T=E_{\pi}[r_T]bT​=Eπ​[rT​],并根据bT=λbT+(1−λ)bTb_T=\lambda b_T+(1-\lambda)b_TbT​=λbT​+(1−λ)bT​不断更新,被称作reward baseline(奖励基线),用于在强化学习任务中降低方差。但是在本文中,作者发现,这么做收敛很慢,因为bTb_TbT​不能捕获dynamic termination behavior。作者将梯度计算公式改为:

其中,bbb的计算公式为:

作者还说了,使用rTb−1\frac{r_T}{b}-1brT​​−1代替rT−br_T-brT​−b能够更快的收敛。

实验

在两个数据集上的实验结果:

在CNN数据集上, termination step的分布情况:

KDD 2017 《ReasoNet: Learning to Stop Reading in Machine Comprehension》论文笔记相关推荐

  1. Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记

    Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪 ...

  2. CVPR 2017 CFNet:《End-to-end representation learning for Correlation Filter based tracking》论文笔记

    理解出错之处望不吝指正. 本文模型叫做CFNet.作者在论文中提到,以前的工作只是将CF应用到了预训练的CNN特征上,并没有实现端到端的CNN-CF的结合.本文的主要贡献就是:推导了CF的可微闭合解, ...

  3. CCL: Cross-modal Correlation Learning With Multigrained Fusion by Hierarchical Network 论文笔记

    摘要&introduction 大多数现有的基于深度神经网络(DNN)的方法采用两阶段学习框架:第一个学习阶段是为每个模态生成单独的表示,第二个学习阶段是利用跨模态相关学习跨模态公共表示. 现 ...

  4. Communication-Efficient Learning of Deep Networks from Decentralized Data 论文笔记

      本文出自论文Communication-Efficient Learning of Deep Networks from Decentralized Data,本文提出了一种基于迭代模型平均的深层网 ...

  5. Multimodal Machine Learning: A Survey and Taxonomy多模态综述论文笔记

    文章目录 第一遍:快速预览,把握概要 1. 仔细阅读标题.摘要和简介. 1 INTRODUCTION 2. 先忽略内容,读一读文章中的每个小标题. 3. 如果有数学内容,先大致浏览,确定其理论基础. ...

  6. 《Curriculum-Meta Learning for Order-Robust Continual Relation Extraction》论文笔记

    Curriculum-Meta Learning for Order-Robust Continual Relation Extraction 这篇文章的阅读方式尝试用沐神建议的方法进行~ 1. Ab ...

  7. 《Guiding Deep Learning System Testing using Surprise Adequacy》论文笔记

    Guiding Deep Learning System Testing using Surprise Adequacy 原文:Guiding Deep Learning System Testing ...

  8. CVPR 2018 LSART:《Learning Spatial-Aware Regressions for Visual Tracking》论文笔记

    理解出错之处望不吝指正. 本文模型叫做LSART.本模型主要分为两条线:(1).Spatial-Aware KRR:(2).Spatial-Aware CNN. Spatial-Aware KRR:K ...

  9. CVPR 2017 《Deep Feature Flow for Video Recognition》论文笔记

    本学弱喜欢在本子上记笔记,但字迹又丑. 望看不懂我的字的大佬不要喷我,看得懂的大佬批评指正.

最新文章

  1. linux设置nexus开机自启动_在linux中使用nexus搭建maven私服
  2. python3 清除asyncio队列 方法
  3. day3 python 函数
  4. php email 发送,php 发送 Email
  5. 网络存储 linux 访问,Linux基础教程学习笔记28——使用Samba访问网络存储
  6. php连接mysql数据没反应_PHP mysql 数据库连接时 网页无法显示
  7. 俯视排版类型海报|没思路?试试可临摹PSD分层模板设计吧!
  8. php getlastid,PHP-获取最后一个插入ID
  9. 【Oracle】分区表中索引状态为N/A
  10. 我的世界java出生蘑菇岛,《我的世界》:粉丝强推,出生超巨型蘑菇岛和村庄连在一起...
  11. 在matlab中配置凸优化所需的求解器cvx、mosek之避雷
  12. Java链表——插入和删除
  13. Semi-prime H-numbers(POJ 3292)
  14. 移动端抓包工具spy-debugger使用
  15. 两种方法实现奇数和偶数的和(Java)
  16. win10系统蓝牙耳机的连接与连接后无法听到声音
  17. OpenFeign 简单使用
  18. Jhipster生成前端为Vue的项目引入Element-UI
  19. Unity 瞄准镜实现
  20. linux python 调试_Python安装与环境配置

热门文章

  1. 科大星云诗社动态20210123
  2. 一文读懂汇编程序的多个分段的程序--详解
  3. 实验二 二叉树的操作与实现
  4. 【CyberSecurityLearning 附】python3-requests模块
  5. XCTF-Reverse:simple-unpack
  6. 电路交换网络中,每条电路独占其经过的物理链路。
  7. strtok_r 和 strsep 使用实例
  8. 常用日志门面和日志实现
  9. OpenFeign组件的使用(使用nacos作为服务注册中心)
  10. UNIX再学习 -- 进程间通信之管道