KDD 2017 《ReasoNet: Learning to Stop Reading in Machine Comprehension》论文笔记
目录
- 简介
- 动机
- 贡献
- 方法
- 实验
简介
本文面向机器阅读理解问题(Machine Reading Comprehension),作者来自微软研究院。
下载链接
动机
现有的方法可以分为两类:单步推理(Single turn)、多步推理(multiple turns)。多步推理是由单步推理衍生而来,单步推理又可以看做是多步推理的特例(turn=1)。这两种方法的共同点是,推理轮数固定,这不符合人类的阅读行为。人会根据当前是否得到了足够的信息,决定中止阅读或继续阅读。本文基于此动机,提出ReasoNet,可以动态决定推理轮数。
贡献
- 将强化学习和多步推理结合,可动态终止推理过程。
- 实验结果较好,是SOTA模型。
方法
本文方法的整体架构如下图所示。按照原文的划分,主要包括5个部分,下面一一介绍。
- Memory
是一个外部库,M={mi}i=1...DM=\{m_i\}_{i=1...D}M={mi}i=1...D,用于生成attention。 - Attention
通过隐状态和外部库,得到当前时间步的attention,xt=fatt(st,M;θx)x_t=f_{att}(s_t,M;\theta_x)xt=fatt(st,M;θx) - Internel State
每个时间步的隐状态,通过RNN得到,st+1=RNN(st,xt;θs)s_{t+1}=RNN(s_t,x_t;\theta_s)st+1=RNN(st,xt;θs) - Termination Gate
终止门,用于判断当前时间步是否终止,tt∼p(⋅∣ftg(st;θtg))t_t \sim p(·|f_{tg}(s_t;\theta_{tg}))tt∼p(⋅∣ftg(st;θtg)),ttt_ttt是一个二值随机变量,当它是true时,终止。 - Answer
当tt=truet_t=truett=true时,得到answer,at∼p(⋅∣fa(st;θa))a_t \sim p(·|f_a(s_t;\theta_a))at∼p(⋅∣fa(st;θa))
整个Inference过程如算法1所示:
在模型的优化过程中,梯度计算公式为:
上式中,bTb_TbT一般是预设的值bT=Eπ[rT]b_T=E_{\pi}[r_T]bT=Eπ[rT],并根据bT=λbT+(1−λ)bTb_T=\lambda b_T+(1-\lambda)b_TbT=λbT+(1−λ)bT不断更新,被称作reward baseline(奖励基线),用于在强化学习任务中降低方差。但是在本文中,作者发现,这么做收敛很慢,因为bTb_TbT不能捕获dynamic termination behavior。作者将梯度计算公式改为:
其中,bbb的计算公式为:
作者还说了,使用rTb−1\frac{r_T}{b}-1brT−1代替rT−br_T-brT−b能够更快的收敛。
实验
在两个数据集上的实验结果:
在CNN数据集上, termination step的分布情况:
KDD 2017 《ReasoNet: Learning to Stop Reading in Machine Comprehension》论文笔记相关推荐
- Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记
Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪 ...
- CVPR 2017 CFNet:《End-to-end representation learning for Correlation Filter based tracking》论文笔记
理解出错之处望不吝指正. 本文模型叫做CFNet.作者在论文中提到,以前的工作只是将CF应用到了预训练的CNN特征上,并没有实现端到端的CNN-CF的结合.本文的主要贡献就是:推导了CF的可微闭合解, ...
- CCL: Cross-modal Correlation Learning With Multigrained Fusion by Hierarchical Network 论文笔记
摘要&introduction 大多数现有的基于深度神经网络(DNN)的方法采用两阶段学习框架:第一个学习阶段是为每个模态生成单独的表示,第二个学习阶段是利用跨模态相关学习跨模态公共表示. 现 ...
- Communication-Efficient Learning of Deep Networks from Decentralized Data 论文笔记
本文出自论文Communication-Efficient Learning of Deep Networks from Decentralized Data,本文提出了一种基于迭代模型平均的深层网 ...
- Multimodal Machine Learning: A Survey and Taxonomy多模态综述论文笔记
文章目录 第一遍:快速预览,把握概要 1. 仔细阅读标题.摘要和简介. 1 INTRODUCTION 2. 先忽略内容,读一读文章中的每个小标题. 3. 如果有数学内容,先大致浏览,确定其理论基础. ...
- 《Curriculum-Meta Learning for Order-Robust Continual Relation Extraction》论文笔记
Curriculum-Meta Learning for Order-Robust Continual Relation Extraction 这篇文章的阅读方式尝试用沐神建议的方法进行~ 1. Ab ...
- 《Guiding Deep Learning System Testing using Surprise Adequacy》论文笔记
Guiding Deep Learning System Testing using Surprise Adequacy 原文:Guiding Deep Learning System Testing ...
- CVPR 2018 LSART:《Learning Spatial-Aware Regressions for Visual Tracking》论文笔记
理解出错之处望不吝指正. 本文模型叫做LSART.本模型主要分为两条线:(1).Spatial-Aware KRR:(2).Spatial-Aware CNN. Spatial-Aware KRR:K ...
- CVPR 2017 《Deep Feature Flow for Video Recognition》论文笔记
本学弱喜欢在本子上记笔记,但字迹又丑. 望看不懂我的字的大佬不要喷我,看得懂的大佬批评指正.
最新文章
- linux设置nexus开机自启动_在linux中使用nexus搭建maven私服
- python3 清除asyncio队列 方法
- day3 python 函数
- php email 发送,php 发送 Email
- 网络存储 linux 访问,Linux基础教程学习笔记28——使用Samba访问网络存储
- php连接mysql数据没反应_PHP mysql 数据库连接时 网页无法显示
- 俯视排版类型海报|没思路?试试可临摹PSD分层模板设计吧!
- php getlastid,PHP-获取最后一个插入ID
- 【Oracle】分区表中索引状态为N/A
- 我的世界java出生蘑菇岛,《我的世界》:粉丝强推,出生超巨型蘑菇岛和村庄连在一起...
- 在matlab中配置凸优化所需的求解器cvx、mosek之避雷
- Java链表——插入和删除
- Semi-prime H-numbers(POJ 3292)
- 移动端抓包工具spy-debugger使用
- 两种方法实现奇数和偶数的和(Java)
- win10系统蓝牙耳机的连接与连接后无法听到声音
- OpenFeign 简单使用
- Jhipster生成前端为Vue的项目引入Element-UI
- Unity 瞄准镜实现
- linux python 调试_Python安装与环境配置