NAACL’21 | 来看如何让模型学会因为所以但是如果
文 | Eleanor
编 | 戏
有一些标准考试那是真的难,难到能分分钟教你做人。对于留学党来说,申请法学博士需要 LSAT 考试成绩、申请商学院需要 GMAT 考试成绩。这些标准考试到底有多难,大概考过的都懂8(嘤嘤嘤_(:з」∠)_)
要想在这些考试中取得高分,需要有很强的理解和分析复杂文本的能力。而具体而言,这类复杂文本可以被称作论证文本,英文叫做 Argument。什么是 Argument 呢?最简单的形式,有前提(Premise),有结论(Conclusion) 就叫做 Argument。更复杂的 Argument,按照哲学家图尔敏提出的模型,还能包括数据(Datum)、支撑(Backing)、限定(qualifier)、反驳(rebuttal)等等[3]。
那么,怎么理解和分析 Argument ?那就需要逻辑推理能力了。那那那,如何才能拥有逻辑推理能力?其实就得先学会看文章里的逻辑结构,哪里是前提,哪里是结论,哪里是在表达观点,哪里又是列出证据对观点进行了佐证。这么复杂的任务,人类考生都说难,模型要咋做呢?
今天介绍的这篇被 NAACL 2021 收录的论文提出了一个回答逻辑推理问题的模型。让我们一起来看看它是如何看懂文章中的逻辑结构的吧~
论文题目:
DAGN: Discourse-Aware Graph Network for Logical Reasoning
论文链接:
https://arxiv.org/pdf/2103.14349
Arxiv访问慢的小伙伴也可以在 【夕小瑶的卖萌屋】订阅号后台回复关键词 【0427】 下载论文PDF~
1 论文概述
论文提出了一个解决逻辑推理的问答模型 DAGN。由于这些逻辑推理问题往往不提供任何的逻辑结构的提示,因而为了理解其中的逻辑关系,论文的模型引入了一种新的构建文本的逻辑结构的方法,即利用文本中的篇章关系(Discourse Relation)构建逻辑图。
这一方法的好处是能够捕捉文本级别的关系(Passage-Level Relations),例如句子之间的关系、主句与从句之间的关系、文本片段之间的关系等。如此一来,文本中的前提-结论,证据-观点等等关系,就能反映在逻辑图上了。
这样的建图方式,相比于以往的基于实体关系、句子依存关系的建图方式,显然要更适用于这一类逻辑推理任务。在构建逻辑图之后,模型就能够对文本信息进行类似于数学运算一样的离散化操作了。在这里模型使用了图神经网络来进行图计算,更新之后的图节点特征,反映了逻辑推理下的文本特征。DAGN 长这样:
2 基于篇章关系的逻辑图构建
为了发现文本中的篇章关系,论文参考了大型的篇章关系语料库——宾州篇章树库(Penn Discourse TreeBank, PDTB)[4]。根据 PDTB 的定义,在文本中大致能找到两类篇章关系:一类由文本中的显式连接词(Explicit Connectives) 标记出来;另一类缺乏显式连接词的,需要通过上下文隐式地表明,称之为隐式连接词(Implicit Connectives)。这种隐式的上下文关系往往存在于两个句子之间,或者同一个句子的两个子句之间。根据 PDTB 的定义,论文定义了两类篇章关系的标记:(1)所有在 PDTB 2.0 中被标记的显式连接词(2)几个常用的分句的标点符号(例如:句号,逗号,冒号,分号等)。
在找到文本中所有的篇章关系之后,论文将文本根据篇章关系分割成若干个文本片段。这些文本片段被称为基本篇章单元(elementary discourse units, EDUs),它们作为逻辑推理的基本单元参与到推理的过程中。于是,每一个 EDU 作为逻辑图的一个节点,而篇章关系则作为逻辑图的边。边的类别共两种,一种是显式连接词所代表的关系,另一种是标点符号所代表的关系。边的连接采用最简单有效的方式:每两个在文本中相邻的 EDU 之间以界定它们的篇章关系相连,并且边的连接是双向的。
因而,逻辑图实际上可以看作链状图。实验证明这种简单的构图方式是有效的。建图的例子展示在模型图的第(1)部分。
3 识别篇章关系的图神经网络
首先初始化图节点的特征,由于图节点就是文本中的 EDU,因此需要对 EDU 进行编码。模型首先使用预训练的语言模型获得每一个字符的基于上下文的编码,然后将同一个 EDU 之内的字符编码相加,获得 EDU 的编码。
然后,通过图神经网络进行信息传递的计算,更新图节点的特征。图计算参考了解决数学计算问题的 NumNet[5]。模型首先通过一个线性变换和一个激活层计算每一个图节点的权重 ,然后通过这一权重进行信息传递的计算
一次传递后节点特征的更新为
再经过若干次的信息传递和节点特征更新之后,节点的 EDU 特征与对应位置的初始字符特征相加,最后经过分类器,选择出认为正确的选项。
4 实验验证
模型的验证在两个逻辑推理问答数据集 ReClor 和 LogiQA 上进行。这两个数据集都是多选题的形式,评价指标为的准确率。在表格所展示的实验结果中,DAGN 以 RoBERTa-Large 作为预训练的模型。DAGN 在两个数据集上的实验结果分别如下:
截止到 2020年11月17日,DAGN 在 ReClor 的排行榜上位列第一。
5 消融实验
消融实验部分讨论了建图方式以及图推理计算。实验结果表明,若去掉显式的篇章连接词,只采用分句的标点符号作为界定符,使得逻辑图的节点不再是准确的 EDU ,而是更大单元的句子或者子句时,模型的性能有所下降。
此外,减少边的类别或者改变边的连接方式,对模型性能也有较大影响。尤其是当边的连接方式变为节点之间的全连接时,模型性能显著下降。由此证明,本文的建图方式对于逻辑推理具有比较高的合理性。另一方面,实验结果也表明,如果去掉模型中的图推理部分,模型的性能也会明显下降。
6 总结
论文提出了一个解决逻辑推理的问答模型 DAGN。DAGN 利用文本中的篇章关系构建逻辑图并使用图神经网络进行逻辑推理。建图的方式虽然简单,但是有效。这种利用文本中的篇章关系去表示逻辑关系的思路,非常有意思,说不定可以借鉴到其他问题上~
寻求报道、约稿、文案投放:
添加微信xixiaoyao-1,备注“商务合作”
后台回复关键词【入群】
加入卖萌屋NLP/IR/Rec与求职讨论群
后台回复关键词【顶会】
获取ACL、CIKM等各大顶会论文集!
[1].Yu et al. ReClor: A Reading Comprehension Dataset Requiring Logical Reasoning. In ICLR 2020.
[2].Liu et al. LogiQA: A Challenge Dataset for Machine Reading Comprehension with Logical Reasoning. In IJCAI 2020.
[3].https://en.wikipedia.org/wiki/Stephen_Toulmin.
[4].Prasad et al. The Penn Discourse TreeBank 2.0. In LREC 2008.
[5].Ran et al. NumNet: Machine Reading Comprehension with Numerical Reasoning. In EMNLP 2019.
NAACL’21 | 来看如何让模型学会因为所以但是如果相关推荐
- 第21章 随机波动率模型:无相关性时的微笑曲线
这学期会时不时更新一下伊曼纽尔·德曼(Emanuel Derman) 教授与迈克尔B.米勒(Michael B. Miller)的<The Volatility Smile>这本书,本意是 ...
- 视觉SLAM笔记(21) 双目相机模型
视觉SLAM笔记(21) 双目相机模型 1. 深度确定 2. 景物差异 3. 成像原理 4. 计算困难 1. 深度确定 针孔相机模型描述了单个相机的成像模型 然而,仅根据一个像素,是无法确定这个空间点 ...
- 3D模型学会了「唱、跳、Rap、篮球」,程序员们全沉迷「鸡你太美」
继 B 站之后,GitHub 网友也开始沉迷「鸡你太美」,让 3D 姿态也学会了「唱.跳.Rap.篮球」,而且动作准确度和连贯性似乎一点也不输练习时长两年半的练习生. 看了这段 demo 之后,网友戏 ...
- (21)css3盒模型box-sizing属性
CSS3 中可以通过 box-sizing 来指定盒模型,这样我们就可以设置如何计算一个元素的总宽度和总高度. 1.content-box标准盒模型 Standard 模式:标准模式中,盒子总体大小为 ...
- Altium Designer 21 原理图库元件模型的组成介绍以及简单的电阻电容元件模型的创建
原理图库元件模型的组成介绍: 元件库设计是电子设计中最开始的模型创建,通过元件库编辑器画线.放置管脚.放置矩形等编辑操作创建出需要的电子原理图器件模型. 原理图符号是元件在原理图上的表现形式,主要由元 ...
- 搞算法的仙女妹子,爱了!!
今天这篇文章不谈技术,给大家分享一些干货!首先来聊聊一个AI圈子里画风清奇的公众号 夕小瑶的卖萌屋.公号的作者中不仅妹子居多,颜值能打,而且喜欢将学术研究和大厂业务上线中的收获与读者分享. 卖萌屋的作 ...
- OpenAI教GPT-3学会上网,「全知全能」的AI模型上线了
视学算法报道 编辑:陈萍 它被命名为 WebGPT,OpenAI 认为浏览网页的方式提高了 AI 解答问题的准确性. 如果 AI 学会上网,那么它就拥有了无限获取知识的方式,之后会发生什么就不太好预测 ...
- AI模型看看视频,就学会了玩《我的世界》:砍树、造箱子、制作石镐样样不差...
作者丨陈萍.小舟 来源丨机器之心 <我的世界>里,玩家不一定都是人类,现在 AI 也会玩了. <我的世界>是全球知名度最高的开放世界游戏.小朋友只需观看十分钟的教学视频,就能学 ...
- 英伟达PyTorch优化神器TensorRT重磅更新!10亿参数大模型实时运行,GPT推理加速21倍...
视学算法报道 编辑:好困 小咸鱼 [新智元导读]12月2日,英伟达发布了最新的TensorRT 8.2版本,对10亿级参数模型进行了优化,让实时运行NLP应用成为可能.与原始PyTorch模型 ...
最新文章
- 什么是lamda表达式?
- 新手入门深度学习 | 1-2:编译器Jupyter Notebook
- 通知公告阅读日志构建说明
- JavaScript实现binarySearch二分查找算法(附完整源码)
- 【javascript】操作符:一元操作符
- python计算球坐标系的积分_python – n球面坐标系到笛卡尔坐标系
- 编程语言c 是什么意思,C/C++知识点之C语言中%*s,%*c 是什么意思
- Tomcat下JSP环境的配置
- 谈产品研发项目需求及需求变更管理
- 笔记本电脑如何安装Linux系统
- cocos creator实现读取白鹭movieClip组件(尝试)
- JavaScript——onblur事件失效问题解决方案
- 影视动画特效制作中的光学动作捕捉
- DTL(Django templeate language)
- 用SNMP协议实现系统监控
- 电影点评系统论文java_java电影在线定制影评管理系统
- Google确认Chrome存在严重漏洞,向20亿用户发出警告:你们需立即更新浏览器
- 第五届蓝桥杯 软件类省赛真题 第八题:兰顿蚂蚁
- SpringBoot使用分布式锁
- 神器啊,理工男的春天来了!
热门文章
- 【腾讯优测干货分享】从压测工具谈并发、压力、吞吐量
- 快速替换图片的组合-AE-样片!
- ubuntu安装操作HttpSQS高速队列
- js 获取url的get传值函数
- SQL Server常用的系统存储过程应用实例(转)
- 为什么Linux内核里大量使用goto,而很多书籍却不提倡使用?
- Windows环境下的安装gcc
- php+redis+设置前缀,spring使用Redis自定义前缀后缀名(去掉SimpleKey []+自定义)
- Flink-Java版单词计数(批处理流处理)
- oracle忽略除数为0,ora-01476除数为0的解决办法,oracle中decode()的使用