论文名称:Logic-level Evidence Retrieval and Graph-based Verification Network for Table-based Fact Verification

论文作者:施琦,张宇,尹庆宇,刘挺

原创作者:施琦

论文链接:https://aclanthology.org/2021.emnlp-main.16.pdf

出处:哈工大SCIR

1. 简介

面向表格的事实验证任务的主要目的是根据给定的表格来判断自然语言输入的正确性。如图1所示,不同于其他形式的事实验证系统,表格事实验证任务需要对表格中单元格之间的逻辑关系进行推理,例如“机队数量(number in fleet)最小的所对应的底盘制造商(chassis manufacturer)是斯堪尼亚(scania)”,带有逻辑操作(如“argmax”、”count”)的符号推理在这一任务中起到了非常重要的作用。现有的方法多采用从表格数据中派生出的可执行的逻辑表达式来加强对表格数据的理解。具体来说,这些方法利用弱监督语义解析器为每个候选的逻辑表达式打分,然后选择其中的一个或几个来加强事实验证过程。然而,对于一个逻辑表达式来说,我们只能知道其执行结果和自然语言输入是否一致(label-consistent),而无法判断二者之间是否语义一致(semantic-consistent),故语义解析器中缺少带有有监督标签的逻辑表达式(弱监督语义解析器),从而倾向于选择标签一致的逻辑表达式而不是语义一致的逻辑表达式(伪程序,具有正确返回标签的错误程序),从而不利于对自然语言正确性的验证。理想状态下,利用逻辑表达式的一种相对自然的方式是将它们视为表格的补充证据。换句话说,一些逻辑表达式中包含着必要的逻辑操作,从而可以对表格中观测到的事实进行总结与描述,利用逻辑表达式传达的信息可以更好的理解表格,从而提升表格事实验证任务的性能。本文提出了一种简单有效的范式,利用自动化的方式获取表格中的证据来加强对表格数据的理解,并通过基于图神经网络的方法来对获取到的证据进行建模,在大规模数据集TabFact的实验结果证明了我们提出的方法的有效性。

图1 任务示例

2. 方法

我们的工作将表格事实验证任务定义为了一个证据检索-推理的过程,图2展示了方法的框架,包括程序合成、证据检索以及事实验证三个部分。给定表格和自然语言输入,程序合成模块首先合成具有有效组合的若干逻辑表达式,然后证据检索模块来对这些逻辑表达式进行选择、分解以及过滤,以获取有价值的逻辑表达式作为原始表格数据的补充证据,最后事实验证模型通过表格、自然语言输入以及获取到的逻辑表达式利用基于图神经网络的方法来预测表格与自然语言输入的蕴含关系。程序合成模块我们使用LPA算法[1]来合成,其主要流程是根据表格和自然语言语句进行实体链接,检测语句中所有实体并将其链接到表格中,然后通过在表格上执行子程序并递归存储生成的中间变量的方法来收集一组逻辑表达式。下面我们将主要介绍证据检索以及事实验证模块。

2.1 证据检索

在获得逻辑表达式集合后,我们利用一些简单的规则来获取一些高质量的逻辑表达式作为表格的补充证据:

  • 选择所有返回值为“True”的逻辑表达式,从而确保这些逻辑表达式所传达的语义信息是可以从表格中正确观测到的信息。

  • 拆分一些过于复杂的证据来简化一些过长的逻辑表达式。

  • 对于收集到过多逻辑表达式的例子,去掉其中带有否定含义的逻辑表达式,从而获取语义更相关的证据(例如,队伍的数量是3 vs 队伍的数量不是5)。

通过对表格中包含的信息进行聚合、分解和过滤,我们可以使用这些包含逻辑运算的逻辑表达式来作为表格的补充证据来加强对表格数据的理解。

图2 方法架构

2.2 事实验证

在获取到这些证据后,我们构建一个图来捕捉证据中实体和逻辑函数之间的关系。具体来说,我们保留每个逻辑表达式的结构,自底向上的添加边来学习证据的语义合成性,此外,我们在整个证据集合中具有相同内容的实体节点之间添加边,来将其变为连通图以实现在多个证据之间推理的目的,如图3所示。

图3 模型结构图

之后,我们利用图神经网络来建模图中的节点来学习不同类型节点的重要性并融合邻居节点的信息,从而进行基于图的推理过程,具体方法如下:

不同节点的类型信息按如下方法建模:

此外,观察到,逻辑表达式中有些节点是“工具”节点,其被设计用来在表格上执行,但其本身与输入的自然语言语句之间是语义不相关的(例如, “filter_eq”, “hop”等等),为了更好的利用证据信息,我们设计了一个动态剪枝的方法来自动移除这些节点,如图4所示。具体来说,我们为图中的每个节点打分,然后根据分数以概率θ来移除分数最低的节点,分数的计算方法如下:

最后,如图4所示,我们整合来自原始表格数据以及来自获取的证据的信息,拼接他们的隐层向量,然后利用常规的分类方法来预测其最终的蕴含关系来验证自然语言语句的正确性。

图4 剪枝方法示意图

3. 实验

3.1 数据集

我们在大规模数据集TabFact[1]上进行了实验,其训练集、验证集、测试集大小分别为92283、12792、12779,测试集包含简单与困难两种模式,大小分别为4171和8608,此外还包含一个大小为2K的人工评价集。

3.2 实验结果

实验结果如表1所示,LERGV为我们的模型,其中,Baseline系统分别为:Table-BERT[1]、LPA[1]、LogicalFactChecker[2]、HeterTFV[3]、SAT[4]、ProgVGAT[5]。

表1 实验结果

3.3 消融实验

我们对模型的各组成部分进行了有效性分析,其结果如表2所示。

表2 消融实验

4. 结论

在这项工作中,我们在基于表格的事实验证任务上,提出了一个基于逻辑证据检索和基于图神经验证网络的模型。具体来说,我们将该任务定义为了一个证据检索-推理的框架,通过将逻辑表达式定义为表格的补充证据来加强对表格数据的理解。此外,我们利用逻辑表达式的结构构建了图来捕获实体与逻辑运算之间的关系,并提出了一个基于图的验证网络来对不同来源的信息进行整合。未来工作中,我们将探索利用表格中派生出的证据来进行预训练,从而来实现对表格数据的进一步理解。

参考文献

[1] Chen W, Wang H, Chen J, et al. Tabfact: A large-scale dataset for table-based fact verification. arXiv:1909.02164, 2019.

[2] Zhong W, Tang D, Feng Z, et al. LogicalFactChecker: Leveraging Logical Operations for Fact Checking with Graph Module Network. ACL 2020.

[3] Shi Q, Zhang Y, Yin Q, et al. Learn to combine linguistic and symbolic information for table-based fact verification. COLING 2020.

[4] Zhang H, Wang Y, Wang S, et al. Table fact verification with structure-aware transformer. EMNLP 2020.

[5] Yang X, Nie F, Feng Y, et al. Program Enhanced Fact Verification with Verbalization and Graph Attention Network. EMNLP 2020.

本期责任编辑:冯骁骋

本期编辑:彭 湃


投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易,还望给个在看!

EMNLP'21 | 基于证据检索和图神经验证网络的表格事实验证模型相关推荐

  1. 基于空间方法的图神经网络模型_用于时空图建模的图神经网络模型 Graph WaveNet | 课程上新...

    课程概要 本课程来自集智学园图网络论文解读系列活动. 是对论文<Graph WaveNet for Deep Spatial-Temporal Graph Modeling>的解读. 时空 ...

  2. EMNLP'21 | 基于相似样本检索的在线更新机器翻译系统

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自:AI科技评论 机器翻译指的是使用机器将一种语言的文本翻译成另一种语言的文本.机器 ...

  3. 图神经网路入门(1)

    图神经网络入门(1) 本文主要介绍图神经网路背景和必须的数学知识.下一部分会介绍模型和应用. 1.为什么会出现GCN(图卷积神经网络) 普通卷积网络都是研究的具备欧几里得领域的数据,例如规则的正方形, ...

  4. 【广告技术】使用图神经网络进行信息聚合与推理,解决多证据事实验证问题

    [Wiztalk腾讯广告专场]系列分享来袭,第三期由清华大学计算机系副教授.博士生导师刘知远老师与清华大学计算机系硕士生周界为大家深度介绍 <基于图结构的事实验证>. 从浅显的文本处理走向 ...

  5. 【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 本文由腾讯优图实验室和中科院软件所联合提出.细粒度视觉分类(Fine-Graine ...

  6. 【Pytorch神经网络实战案例】21 基于Cora数据集实现Multi_Sample Dropout图卷积网络模型的论文分类

    Multi-sample Dropout是Dropout的一个变种方法,该方法比普通Dropout的泛化能力更好,同时又可以缩短模型的训练时间.XMuli-sampleDropout还可以降低训练集和 ...

  7. PaddleNLP基于ERNIR3.0文本分类以中医疗搜索检索词意图分类(KUAKE-QIC)为例【多分类(单标签)】

    相关项目链接: Paddlenlp之UIE模型实战实体抽取任务[打车数据.快递单] Paddlenlp之UIE分类模型[以情感倾向分析新闻分类为例]含智能标注方案) 应用实践:分类模型大集成者[Pad ...

  8. 图神经网络应用——基于深度学习的图相似度计算(以SIMGNN为例的保姆级讲解)

    为啥想写这篇文章呢..因为之前提到的图神经网络应用篇鸽了一年多了,把自己的研究方向做一个总结,并向其他同样研究方向的朋友做一个报告,如有错误,敬请指出.而且,这个研究方向人太少了,万望能借此引起更多人 ...

  9. 【Pytorch神经网络理论篇】 26 基于空间域的图卷积GCNs(ConvGNNs):定点域+谱域+图卷积的操作步骤

    图卷积网络(Graph Convolutional Network,GCN)是一种能对图数据进行深度学习的方法.图卷积中的"图"是指数学(图论)中用顶点和边建立的有相关联系的拓扑图 ...

  10. 《Effective Approaches to Attention-based Neural Machine Translation》—— 基于注意力机制的有效神经机器翻译方法

    目录 <Effective Approaches to Attention-based Neural Machine Translation> 一.论文结构总览 二.论文背景知识 2.1 ...

最新文章

  1. centos安装easy_instal
  2. liunx 加入域控_linux下的域控做法
  3. Lazy loading
  4. asp.net mvc连接mysql_ASP.Net MVC连接MySQL和Code First的使用
  5. java的引用传递_Java的值传递和引用传递
  6. CSS样式让一个块在最上层中显示
  7. Hadoop自学笔记(三)MapReduce简单介绍
  8. java webservice 客户端_Java Webservice客户端(最佳方法)
  9. 分享一个自己做的简易敏捷开发管理工具——AgileLite
  10. 蓝桥杯2019年第十届C/C++省赛B组第一题-组队
  11. 87-非阻塞 connect
  12. 三星手机怎么看html5,三星手机查看硬件信息方法
  13. Optimization Week 4: Duality
  14. HTML如何引入md5算法,MD5算法实现
  15. 个人总结-公司业务逻辑如何进行梳理?
  16. calendar -- 日历相关│Python标准库
  17. 用对线阶段数据分析和预测《英雄联盟》的游戏结果
  18. 【今日CV 计算机视觉论文速览 第96期】 8 Apr 2019
  19. 爬取大众点评网的某城市美食店铺数据
  20. SparkSQL比MapReduce快的原因

热门文章

  1. ECMAScript基础语法
  2. 以盛唐气象,浇胸中块垒:熊逸《唐诗50讲》学习笔记汇总
  3. 对yolo与fasterrcnn anchors的理解
  4. VB.NET中DataGridView控件
  5. django安装配置及测试
  6. HTML5--本地存储Web Storage
  7. IEWebBrowser
  8. LeetCode 459. 重复的子字符串(Repeated Substring Pattern)
  9. babel-preset-env使用介绍
  10. python不是内部或外部命令