关注上方深度学习技术前沿”,选择“星标公众号”

资源干货,第一时间送达!

转自机器之心

2020 年 2 月 7 日-2 月 12 日,AAAI 2020 将于美国纽约举办。不久之前,大会官方公布了今年的论文收录信息:收到 8800 篇提交论文,评审了 7737 篇,接收 1591 篇,接收率 20.6%。本文介绍了由云从科技与上海交大合作的论文《DCMN+: Dual Co-Matching Network for Multi-choice Reading Comprehension》。

链接:https://arxiv.org/pdf/1908.11511.pdf

在那些寒窗苦读的学生时代,你一定碰见过阅读理解,它需要融会贯通进行主观陈述和作答,是让无数考生头疼的题目。继智能系统在围棋、国际象棋、游戏等领域超越人类后,「阅读理解」也成为了机器的「苦恼」。

在此 AAAI 2020 论文中,云从科技和上海交大针对 RACE 多项选择题提出增强的 DCMN+模型。

据介绍,DCMN+是年初论文作者们提出的 DCMN 增强模型,针对多项选择型机器阅读理解,以大规模预训练模型(如 BERT 等)作为前端编码器,在多个多项选择型机器阅读理解任务(如卡耐基梅隆大学的 RACE)上取得了最先进的水平,另外 DCMN 也适用于其他简单分类任务。

与其他技术相比,其显著特征是双向匹配策略,其他现有模型的匹配策略都是单向的,比如在文章-问题(P-Q)建模时,现有技术只有问题(Q)在文章(P)上的映射匹配,没有文章(P)在问题(Q)上的映射匹配,而 DCMN 则集成了两个方向的匹配信息。此外,还集成了文章中句子筛选-从文章(P)中筛选出与问题相关的句子用于推理,答案选项交互-引入选项之间比较信息两种阅读策略,进一步提升了模型的性能。

以下是对此论文的技术解读。

1 任务描述

本文主要聚焦多项选择型机器阅读理解,它的形式类似于英语考试中的阅读理解(选择题),给定一篇文章,通过阅读并理解文章(Passage),针对提出的问题(Question)从选项中选择正确的答案(Answers)。其中典型的数据集是卡内基-梅隆大学发起的大型深层阅读理解任务数据集 RACE(ReAding Comprehension dataset collected from English Examinations),它来源于中学考试题目的大规模阅读理解数据集,包含了大约 28000 个文章以及近 100000 个问题。除了 RACE,我们还在 SemEval-2018 Task11, ROCStories,MCTest 以及 COIN Task1 等类似多项选择型数据集上测试了我们的模型。

一个典型的多项选择型机器阅读理解的例子

2 模型框架

本文提出的 DCMN+主要包含三个模块:1)文章中句子筛选,从文章(Passage)中筛选出与问题相关的句子用于推理;2)答案选项交互,引入选项之间比较信息;3)双向匹配策略,充分利用 Passage,Question 与 Answers 之间的交互信息,作对称双向匹配。

整体模型框架,三个模块:Sentence Selection, Option Interaction 和 Bidirectional Matching

2.1 编码器

本文直接以预训练完的语言模型作为前端编码器,例如 BERT 以及 XLNet,分别编码 Passage,Question 及 Answers。

2.2 文章句子选择(Passage Sentence Selection)

为从文章中选择出与问题最相关的句子,我们分别计算了文章中每个句子与问题-选项对的相似度,选出最为相关的 K(超参数)个句子,输入到模型的以后部分作为推理依据。具体计算句子间相似度的方式有两种:余弦距离与双线性距离。

余弦距离:逐个计算文章中句子与问题-选项对中单词间的距离,取其平均值作为相似度分数:

双线性距离:通过计算文章句子与问题选项对的双线性匹配分数,然后通过线性降维来得到最后的分数:

2.3 答案选项交互(Answer Option Interaction)

通过引入答案选项之间的比较信息,使得每个答案融入了相对于其他答案的比较信息,从而每个答案选项不在是孤立的,具体计算方式是引入每对选项之间的双线性比较信息,最后使用门控机制与原始的选项信息融合。

2.4 双向匹配策略(Bidirectional Matching)

计算 Passage-Question-Answers 三元组中所有的两两二元组的双向匹配信息,即 P-Q,P-A,Q-A。接下来以 Q-A 之间的匹配方式作为说明:问题及答案选项分别被编码为 H^q 以及 H^a,则 Q-A 间的双向匹配表示 M^qa 可以用以下方式计算:

2.5 目标函数

得到文章,问题,答案选项之间双向匹配表示之后,我们把它们串联起来过一层全连接线性层去预测最后的答案,如果 A^k 是正确的答案选项,Loss 可以计算如下:

3 实验结果

我们在各个多项选择数据集上均取得了最先进的成绩,包括 RACE,SemEval-2018 Task11, ROCStories,MCTest 以及 COIN Task1。

在 RACE 上的结果比较,我们取得了最高的成绩

在 SemEval-2018 Task11, ROCStories,MCTest 以及 COIN Task1 的成绩,我们均取得了最高的成绩

DCMN+模型在 RACE、SemEval-2018 Task11、 ROCStories、MCTest 以及 COIN Task1 不同数据集上均取得了最高成绩。

在 RACE 上的结果比较,取得最高成绩

在 SemEval-2018 Task11, ROCStories,MCTest 以及 COIN Task1 上,也均获得最高成绩

机器也学会如何做「阅读理解」了? 云从科技上交大提出的DCMN+ 模型为你解答!!!...相关推荐

  1. 云从科技上交大提出DCMN+ 模型,在多项阅读理解数据集上成绩领先

    2020 年 2 月 7 日-2 月 12 日,AAAI 2020 将于美国纽约举办.不久之前,大会官方公布了今年的论文收录信息:收到 8800 篇提交论文,评审了 7737 篇,接收 1591 篇, ...

  2. 第一批做「单细胞测序」的人,已经上云了

    1980年,英国生物化学家Frederick Sanger与美国生物化学家Walter Gilbert建立了DNA测序技术并获得诺贝尔化学奖.在此后的40年时间里,测序技术发生了多次革命. 北京大学的 ...

  3. 【NLP】如何利用BERT来做基于阅读理解的信息抽取

    信息抽取 (Information Extraction: IE)是把文本里包含的信息进行结构化处理,变成计算机能够处理的结构,实体抽取.关系抽取.事件抽取等都属于信息抽取的范畴.在NLP领域,信息抽 ...

  4. 阿里巴巴的AI都能做英文阅读理解了 你还不赶快多背几个单词?

    想想最近几年,人工智能都干了些啥事? 下棋.开车.拍照.写诗.做主持人--甚至还领了张身份证! 首获人类公民身份的沙特AI机器人--索菲亚 科学研究日新月异,最近AI所取得最新成果就是:做英文阅读理解 ...

  5. 做「容量预估」可没有true和false

    这里是Z哥的个人公众号 每周五11:45 按时送达 当然了,也会时不时加个餐- 我的第「85」篇原创敬上 随着20年来互联网的蓬勃发展,一个软件系统所要面对的访问压力上限被逐渐提高. 虽然如此,但是那 ...

  6. 【初赛】「阅读程序」题答v1.0

    「阅读程序」题答 核心要义:是设法弄清程序的功能,每个题目的写作目的. 一.方法 1.直接模拟:一般适用于T1.T2中的递归题,计算题等没有算法的题. 2.看出算法直接填:最佳方法.需要较多模板,但耗 ...

  7. 【转】想做「互联网金融」产品经理,如何开始学习?

    最近很多小伙伴来问我一些关于互金产品的问题.因此我决定这篇文章的主题就是「小璋学习法」.对于我是如何学习互联网金融产品的方法做一个总结. 「小璋学习法」这个词是我自造的,算是对我在互联网金融产品学习中 ...

  8. 「学习笔记」品优购项目-上(页面公共部分 )

    「学习笔记」品优购项目-上 品优购项目-上 目标 品优购项目规划 网站制作流程 品优购项目介绍 品优购项目的学习目的 开发工具以及技术栈 开发工具 技术栈 品优购项目搭建工作 创建的文件夹如下(称为项 ...

  9. 比RNN快136倍!上交大提出SRNN,现在RNN也能做并行计算了

    比RNN快136倍!上交大提出SRNN,现在RNN也能做并行计算 论文和开源代码地址: https://arxiv.org/pdf/1807.02291.pdf https://github.com/ ...

最新文章

  1. http://q.cnblogs.com/q/54251/
  2. java的知识点11——面向对象的三大特征之一继承、instanceof 运算符、方法的重写override、Object类基本特性、toString方法
  3. 业务场景是什么意思_深度思考:麦乐积分兑换商城系统业务逻辑
  4. .net面试题目51-100
  5. Visual Guide to NoSQL Systems
  6. 空间说说html,空间说说大全(共100句)
  7. 贝加尔湖,冰雪奇缘之旅
  8. jsp使用rem页面内容不能根据屏幕分辨率自适应_为什么很多web项目还是使用 px,而不是 rem?...
  9. 2.8 循环语句介绍
  10. 大一php,大一总结 - 我的大一 - php中文网博客
  11. 分布式部署OpenDevOps报502错问题解决全过程
  12. 网管系统测试学习——传输网下一代综合网管系统测试
  13. VS与VS Code的区别
  14. Swift学习笔记笔记(七) UIKit常用组件的使用
  15. 几款流行监控系统简介
  16. XML Publisher 模板设计技巧
  17. 无人驾驶汽车系统入门(十九)——分层有限状态机和无人车行为规划
  18. Python爬虫怎样绕过验证码?
  19. fc安卓模拟器_安利一款手机上的红白机模拟器
  20. 数学与泛型编程:高效编程的奥秘 pdf下载_Mac 软件专题:教学参考工具软件-外语/医学/天文/地理/数学等...

热门文章

  1. C#如何判断线程池中所有的线程是否已经完成(转)
  2. 左右上下都能滚动的效果
  3. JFinal Extensions 2.0 发布,JFinal 扩展
  4. C语言库函数大全及应用实例二
  5. sap 成本中心下的po_SAP学习基础篇(23):CO模块-成本中心费用费率计划
  6. python两个集合的交集 合集 差集
  7. 《因果学习周刊》第7期:因果学习中的离线策略评估
  8. 就在明天!对话晶泰科技赖力鹏:AI制药独角兽的崛起之路
  9. Mila唐建团队新作:可迁移、可解释的单细胞RNA测序模型
  10. LIVE 预告 | TransGAN:丢弃卷积,纯Transformer构建GAN网络