作者:Sjw

时间:2021年4月30日

今天要分享的是来自ACL2020的一篇论文,作者是:Hongyu Gong, Yelong Shen, Dian Yu,Jianshu Chen, Dong Yu


目录

1.解决的问题

2.方法

2.1循环机制

2.2基于强化学习的分段策略

3.实验


1.解决的问题

现在的机器阅读理解模型大多数都是使用预训练模型(例如BERT)对文档和问题的联合上下文信息进行编码。但是这些基于transformer架构的模型只能采用固定长度(例如512,文本长度不足会进行填充)的文本作为输入。 需要处理更长的文本输入时,以前的方法通常将它们分成等距的段(比如通过设置滑窗大小为128),并根据每个段独立地预测答案,而不考虑其他段的信息。就像下图这种情况:

设滑窗长度为128,最大句长为512,那么长度为700的本文经过处理后会被切分为3段,第一段为0-512,第二段为128-640,第三段为256-700。

这种情况下,会产生需要预测的答案处在被分割的边界位置,导致丢失用于推理答案的上下文信息,而且片段与片段之间缺乏交互,又丢失了一部分信息。

为了说明上下文信息对答案预测的影响,作者还展示了答案片段的中心位置与文章的中心位置距离对F1值的影响:

可以看到,随着答案片段的中心位置与文章的中心位置的距离增大,F1值有着明显的下降。


2.方法

于是乎,作者就提出了一种更加科学的长文本分段方法,也就是本文要讲的: RCM(recurrent chunking mechanisms)通过强化学习的方式学习分段长度,并使用一种循环机制让片段之间得到交互,为真实答案的预测提供更多的上下文信息。

2.1循环机制

由于该工作是基于BERT等transformer架构的模型进行的,作者取出了每个段落中的[CLS]位置向量作为该段落的语义向量,并在循环机制中进行交互,得到最终生成的向量 。其中 可以为Gated recurrence(GRU)或者LSTM,公式如下:

最后,不管以何种方式,最终都会得到经过不同段交互后的段落语义向量。获取到后就可以计算对该段落是否正确答案的概率估计值,其计算公式如下:

2.2基于强化学习的分段策略

首先简单的介绍一下强化学习。

“强化学习是用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题......强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。”

那对应在本文中,强化学习的环境就是我们的深度学习模型结构,状态是已被分好的段落,动作则为分段时的步长大小和方向。在状态下执行动作的概率为:

针对状态和动作产生的奖励值为,其公式如下。是下一段的奖励值,是之前得出的模型根据段落语义向量得出的对该段落是否正确答案的概率估计值。式子中的第一项是从该段落中提取出正确答案的奖励值。考虑一下,在所有段落中只有一段包含答案,在计算奖励时,不仅要在分对具有答案的段落时进行奖励,还要奖励分对不包含答案的段落,所以要添加后边的一项。通过最大化奖励值,就可以训练分段方法啦。

其中的取值是根据当前段落提取出答案的可能性,其公式如下。可以从公式中看出,的取值是根据模型预测出的真实答案位置概率值计算所得。

最后,将两种方法总结起来,算法整体的结构见下图所示:

分出的段落送入BERT当中经过段落之间的交互后得到,用于Answer Extractor 和 Policy Network。Answer Extractor最终得出评分。Policy Network得出执行动作的概率

3.实验

最后,作者在 CoQA 、 QuAC 和TriviaQA上进行了实验,三个数据集的统计数据如下图所示。

实验的结果如下,可以看到,该方法在较短输入长度上的准确率有着比较大的提升,而在512长度上提升较小。因为CoQA与QuAC的平均长度接近或小于512,大部分文本可能不需要再次分段。而在文本较长的TriviaQA数据集上具有更好的效果。

TriviaQA数据集上的结果

最后附上该论文的代码:

https://github.com/HongyuGong/RCM-Question-Answering.git

论文链接:

https://www.aclweb.org/anthology/2020.acl-main.603/

《Recurrent Chunking Mechanisms for Long-Text Machine Reading Comprehension》--论文分享相关推荐

  1. CVPR 2021论文分享会日程公布!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale学术 活动:CVPR 2021论文分享会 随着人工智能的火热,AAAI.Neu ...

  2. CVPR 2020最佳学生论文分享回顾:通过二叉空间分割(BSP)生成紧凑3D网格

    机器之心发布 机器之心编辑部 在近日举行的 CVPR 2020 大会上,最佳论文.最佳学生论文等奖项悉数公布.加拿大西蒙弗雷泽大学陈之钦(Zhiqin Chen )等人的「BSP-Net」相关研究获得 ...

  3. 4个Keynote、12篇论文分享、40个Poster,CVPR 2021论文分享会全日程公布

    随着人工智能的火热,AAAI.NeurIPS.CVPR 等顶级学术会议的影响力也愈来越大,每年接收论文.参会人数的数量连创新高.但受疫情影响,近两年国外举办的学术会议都转为了线上,无法满足学者们现场交 ...

  4. dbscan论文_论文分享 :Linkage Based Face Clustering via GCN

    本文要解决的问题是人脸聚类,这类任务的目的是将一批无标记的人脸通过聚类使得自同一个人的人脸聚在一起.作者将这个问题转换为链路预测的问题,当两个人脸属于同一个人时,那么他们之间存在一条边.作者发现特征空 ...

  5. 新星云集!CVPR 论文分享会圆桌论坛:计算机视觉科研​之“路”

    微软亚洲研究院 2021 CVPR 论文分享会各个主题已分享完毕 CVPR 2021 目标检测.跟踪和姿态估计最新进展分享 CVPR 2021 机器学习及多模态最新进展分享 CVPR 2021 3D视 ...

  6. CVPR 2021 图像生成最新进展,论文分享会回放

    微软亚洲研究院 2021 CVPR 论文分享会已完美结束.今日起,CV君将根据不同类别的分享主题进行逐一分享,欢迎查收! 首先分享的主题为:图像生成 论文名称 论文一:Information Bott ...

  7. 预告|CVPR 2021 论文分享会日程公布!与计算机视觉领域学者一起收获“立体”参会体验...

    微软亚洲研究院 2021 CVPR 论文分享会将于 4 月 22 日 9:00 至 18:00 在线上举行,对计算机视觉领域感兴趣的你是否已经安排好时间等待各位"大佬"的分享了呢? ...

  8. 预告 | 4月22日,CVPR 2021论文分享会详细介绍,学术新星云集!

    国际计算机视觉与模式识别会议(CVPR)是人工智能领域最有学术影响力的顶级会议之一.根据 CVPR 2021 官方公布的论文收录结果,今年一共有 1663 篇论文被接收,接收率为 23.7%,相较于去 ...

  9. CVPR 2021 论文分享会预告

    CVPR 2021 还有2个月开幕,目前已经有592篇论文公布,占近1/3. 52CV 持续跟踪仓库: https://github.com/52CV/CVPR-2021-Papers 微软亚洲研究院 ...

  10. 计算机视觉研究那些事 |CVPR 2020 论文分享会

    本文转载自微软学术合作. 在以下链接查看 CVPR 2020 线上论文分享会全程回放: https://space.bilibili.com/110487933/channel/detail?cid= ...

最新文章

  1. Java的jar文件安装成windows 服务
  2. java 的继承_关于java中的继承
  3. C++异常 返回错误码
  4. JavaScript内存优化
  5. ubuntu apache 完全删除
  6. tensorflow 安装在Anaconda
  7. gem5源码解读se.py以及simulate.py(一)
  8. SONY α系列(A6000A7)数码微单相机APP破解免付费安装教程
  9. 怎么批量修改pdf文件名
  10. NoWritableEnvsDirError: No writeable envs directories configured.
  11. 解决雷电模拟器一直出现安全证书有问题
  12. oracle校验统一社会信用代码函数
  13. 2019年中国计算机学会(CCF)推荐国际学术会议-计算机网络(2019.04.25)
  14. E-Competitive Seagulls
  15. Codeforces Global Round 8
  16. 计算机专业学习资源合集 | 视频电子书资源
  17. php generator 风雪,PHP 生成器Generator理解
  18. spring cloud: TX-LCN解决分布式事务
  19. java中 SSL认证和keystore使用
  20. spring BeanDefinition接口

热门文章

  1. 一次手机木马的清除记录(手机刷机)
  2. 推荐一下十三款内网穿透工具(超全)
  3. 高考英语50分学计算机,高三英语50分到100分学习窍门
  4. 苹果iOS 8.0正式发布啦
  5. Caporali HSK63A.H80.WE16
  6. 本周最新文献速递20211121
  7. python vimdiff_技巧:Vimdiff 使用
  8. 百万用户同时在线游戏服务器架构实现.doc 基于epoll 通信模型
  9. 什么是人工智能?人工智能如何系统的学习
  10. 手机怎么把照片转JPG格式?这两种方法可以迅速转换