笔记整理:朱珈徵,天津大学硕士

链接:https://aclanthology.org/2021.acl-long.183.pdf

动机

因果推理旨在理解因果之间的一般因果相关性,对于各种人工智能应用都有很大的价值。先前的研究主要是基于从手工注释的因果事件对中归纳出的知识来推断事件之间的因果关系。然而,关于因果关系的更多证据信息仍未被利用。通过整合这些信息,可以揭示因果关系背后的逻辑规律,提高因果推理系统的可解释性和稳定性。为此,作者们提出了一个事件图知识增强的可解释因果推理框架(ExCAR)。ExCAR首先从大规模的因果事件图中获取额外的证据信息,作为因果推理的逻辑规则。为了学习逻辑规则的条件概率,作者们提出了条件马尔可夫神经逻辑网络(CMNLN),它以端到端可微的方式结合了逻辑规则的表示学习和结构学习。实验结果表明,ExCAR的性能优于以往的SOTA方法。对抗性攻击评估显示ExCAR的稳定性优于基线系统。人工评估结果表明,ExCAR具有良好的可解释性能

亮点

ExCAR的亮点主要包括:

1.提出了一个事件图知识增强的可解释因果推理(ExCAR)框架充分利用证据信息的潜力。给定一个输入事件对,ExCAR首先从大型因果事件图中检索外部证据事件,并将它们之间的因果关系定义为一组逻辑规则;2.进一步提出了一个条件马尔可夫神经逻辑网络(CMNLN),以端到端方式学习逻辑规则的条件因果相关性,以解决事件之间因果关系的不确定。

概念及模型

•背景

因果推理任务可以形式化为一个预测问题:给定一个因果事件对<C,E>,由前提事件和其中一个假设事件组成,预测模型需要预测一个分数来度量事件对的因果关系。

CEG是由作者构建的大规模因果知识库,从该知识库中可以检索出一组针对某一因果事件对<C,E>的额外证据。在形式上,CEG是一个有向无环图,表示为G = {V,R},其中V是节点集,R是边集。每个节点  对应一个事件,而每条边  表示第i个事件和第j个事件之间存在因果关系。

为了提高因果推理的可解释性和稳定性,本文将因果推理问题转化为基于规则的推理任务。具体来说,给定一个输入因果事件对<C,E>,从CEG那里检索到一组证据事件。证据事件与C、E进一步形成一套因果逻辑规则,其中一条规则描述了两个事件之间的因果关系。在形式上,规则  ,其中是⇒一个逻辑连接,表示两个事件  和  之间的因果关系。针对这些因果逻辑规则,可以揭示因果机制,并以一种可解释的方式进行因果推理

事件图知识增强的可解释因果推理(ExCAR)框架结构如下:

•ExCAR

如图上所示,ExCAR由两个组件组成。给定事件对<C,E>,ExCAR采用证据检索模块,从预先构建的因果事件图中检索证据事件,生成一组逻辑规则。然后ExCAR利用条件马尔可夫神经网络进行基于逻辑规则的因果推理。

•证据事件检索

给定在因果事件图之外的事件对<C,E>,为了从因果事件图中获得证据,作者首先在因果事件图中定位因果关系。从直观上看,语义上相似的事件会有相似的原因和结果,并且在CEG中共享相似的位置。为此,采用了一种预先训练的语言模型ELMo来推导CEG中事件的语义表示,以及因果事件。然后利用语义表示的余弦相似度,在CEG中找到与输入的因果事件语义相似的事件。这些事件可以作为定位因果事件的锚点。然后如上图所示,以原因事件的锚点为起点,以效应事件的锚点为终点,可以通过广度优先搜索(BFS)算法检索证据事件。

•条件马尔可夫神经逻辑网络

规则的因果强度可能因先行词的不同而不同,其中先行词可以是一个事件,一个简单的规则或单个规则的复杂组合。为清楚起见,将规则  的先行词表示为  。如图所示,从因果逻辑图派生出的单个规则可以有多个前因,每个前因都可以对规则的因果强度产生自己的影响。为了通过利用神经模型在表示学习中的有效性来解决这个问题,提出了基于逻辑规则嵌入的CMNLN。为了模拟规则的叠加因果效应,CMNLN将CLG视为不同因果逻辑链的组合,并结合每个因果逻辑链的信息预测因果评分。因此,在每个因果逻辑链中,使用一个前因感知的势函数,为每个规则估计特定于链的因果强度。然后CMNLN聚合链内因果信息和链间因果信息,得出因果评分。

•训练

在训练过程中,引入了因果逻辑驱动的负抽样,以提高条件因果强度估计的可靠性。特别是,如果在CLG中存在规则  ,由于因果关系的单向性,可以推导出相应的错误规则  。从CLG中,也可以通过随机抽样为错误规则生成一个错误的前因式。因此,理想情况下,这些错误规则的条件因果强度应该等于0。此外,还将因果关系的单向性与因果关系的及物性结合起来,生成具有更复杂模式的错误规则。通过对错误规则进行采样并训练这些错误规则的势函数为零时,条件因果强度估计的可靠性可以得到提高。对于因果逻辑驱动的负抽样过程,CMNLN的损失函数定义为

理论分析

实验

为了评估ExCAR框架的鲁棒性,作者构建了一个额外的中文常义因果推理数据集C-COPA。

Baseline:这些方法从大规模语料库中估计词或短语层次的因果关系。然后通过合成词级或短语级的因果关系,得到输入事件对的因果关系。PMI使用点互信息度量词级因果关系。PMI EX是一个非对称的词水平PMI,它考虑了因果推理的方向性。CS通过整合必要性因果关系和充分性因果关系来衡量词汇层面的因果关系。CS MWP使用CS评分来衡量单词和介词短语之间的因果关系。

作者在下表中列出了COPA数据集和C-COPA数据集上的结果。实验表明,与基于因果对的BERT相比,ExCAR相关方法的性能有所提高。这表明从事件图中加入额外的证据有助于揭示因果决策机制,从而提高因果推理的准确性。ExCAR-w/ MLN和ExCAR-w/ CMNLN的性能优于ExCAR-concat,后者将CLG简化为一个事件序列。这表明利用逻辑规则之间复杂的因果关系模式可以帮助完成因果推理任务。与ExCAR-w/ fixed-cs相比,ExCAR-w/ MLN和ExCAR-w/ CMNLN的性能有所提高。这证实了神经化规则来解释逻辑规则的不确定性对因果推理任务是有帮助的。与ExCAR-w/ MLN相比,ExCAR-w/ CMNLN进一步提高了预测精度,表明通过整合前因感知势函数,CMNLN可以对因果推理逻辑规则的条件因果强度进行建模。

表2为对抗性攻击后的预测精度,∆为对抗性攻击带来的性能变化。例如,∆= -9.9表示攻击后的预测精度下降了9.9%。作者发现,与基于事件对的BERT相比,ExCAR能够显著提高预测精度的稳定性。这些结果表明,ExCAR可以通过引入额外的证据事件来揭示其背后的因果机制,从而提高预测结果的稳定性。

总结

本文设计了一个新颖的可解释的因果推理框架ExCAR。给定一个事件对,ExCAR能够从一个大规模的因果事件图中获取逻辑规则,以提供对推理结果的洞察力。为了学习逻辑规则的条件概率,作者提出了一种结合了基于规则和神经模型的优势的条件马尔可夫神经逻辑网络。经验上,本文的方法在两个因果推理数据集,包括COPA和C-COPA上优于之前的工作。此外,ExCAR可以通过提供概率逻辑规则的解释来解释。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。

论文浅尝 | ExCAR: 一个事件图知识增强的可解释因果推理框架相关推荐

  1. 论文浅尝 | 利用开放域触发器知识改进事件检测

    笔记整理 | 申时荣,东南大学博士 来源:ACL 2020 源码:https://github.com/shuaiwa16/ekd.git 摘要 事件检测(ED)是文本自动结构化处理的一项基本任务.由 ...

  2. 论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

    本文转载自公众号:专知. [导读]知识图谱一直是研究热点,研究者近年来广泛关注知识图谱嵌入(Knowledge Graph Embedding,简称KGE)方法,在保留语义的同时,将知识图谱中的实体和 ...

  3. 论文浅尝 | IRW:基于知识图谱和关系推理的视觉叙事框架

    笔记整理:孙悦,天津大学 链接:https://www.aaai.org/AAAI21Papers/AAAI-3382.XuC.pdf 动机 视觉叙事是生成一个短篇故事来描述有序图像流的任务.与视觉字 ...

  4. 论文浅尝 | KnowEdu: 一个自动构建教育知识图谱的系统

    笔记整理 | 崔凌云,天津大学硕士 链接:https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=8362657 动机 基于知识图的广泛应用和在教育领 ...

  5. 论文浅尝 | KGAT: 用于推荐的知识图注意力网络

    笔记整理 | 李爽,天津大学 链接:https://arxiv.org/pdf/1905.07854v1.pdf 动机 为了提供更准确.多样化和可解释的推荐,必须超越对用户-项目交互的建模,并考虑辅助 ...

  6. 论文浅尝 | emrKBQA: 一个面向临床医疗问答的KBQA数据集

    笔记整理 |  谭亦鸣,东南大学博士生 来源:BioNLP '21 workshop, ACL '21 链接:https://www.aclweb.org/anthology/2021.bionlp- ...

  7. 论文浅尝 - ICML2020 | 通过关系图上的贝叶斯元学习进行少样本关系提取

    论文笔记整理:申时荣,东南大学博士生. 来源:ICML 2020 链接:http://arxiv.org/abs/2007.02387 一.介绍 本文研究了少样本关系提取,旨在通过训练每个关系少量带有 ...

  8. 论文浅尝 | AAAI2020 - 多分量图卷积协同过滤方法

    论文笔记整理:郝凯龙,南京大学硕士. 来源:AAAI2020 链接:https://arxiv.org/pdf/1911.10699.pdf 动机 推荐系统实际上是在做用户-商品二部图上的链路预测,仅 ...

  9. 论文浅尝 | 基于文本关联的知识图谱的无监督嵌入增强

    来源:IJCAI2019 论文链接: https://www.ijcai.org/proceedings/2019/0725.pdf 概述 知识图谱嵌入是从多关系数据中提取数据的工具,最近的嵌入模型对 ...

最新文章

  1. 【Apollo源码分析】系列的第三部分【prediction】_slamcode的博客 -CSDN博客
  2. intellij 打开node项目 一直停留在scanning files to index....,或跳出内存不够的提示框...
  3. Spring Boot特性
  4. iOS指示器之UIProgressView和UIPageControl
  5. php打印从1到1000,输入一个链表的头节点,从尾到头打印每个节点的值,利用PHP如何实现?...
  6. java 图片手动切换_JavaScript学习案例之手动切换轮播图片
  7. 使用druid连接池的超时回收机制排查连接泄露问题
  8. spring boot基础教程:入门程序Hello World的编写
  9. RunTime.getRunTime().addShutdownHook的用法
  10. java velocity 邮件_邮件集成java mail + 读取邮件模板
  11. java微信服务商支付,Java 微信支付之APP支付服务端 (二)
  12. WinCE5.0下直接写屏操作与函数 CreateDIBSection() 的使用(转)
  13. iPhone 13 系列不再齐「芯」,苹果为什么要造三款不同的 A15 处理器?
  14. Javascript-逻辑运算符()
  15. 将数据加载到datagridview_JVM系列(一)-- Java类的加载机制
  16. android 8.0获取通知权限,Android8.0通知权限适配
  17. unity 字体width_Unity制作自定义字体的两种方法
  18. 5.1 Lilypond五线谱
  19. java多线程执行任务(工具)
  20. 全民营销,只看这篇文章就够了

热门文章

  1. Linux网络服务器epoll模型的socket通讯的实现(一)
  2. [转载]MVVM、MVVMLight、MVVMLight Toolkit之我见
  3. ACDSee Photo Manager 12 中文绿色版
  4. C++ string assign()赋值常用方法
  5. boost中bind的使用
  6. 简单分析STM32和51的区别
  7. 一文让你了解RT-Thread
  8. 跟我师兄聊天引发的思考
  9. MDK530编译出现ARM版本不符问题
  10. php博客文章修改,wordpress博客如何快速修改文章阅读数