论文笔记整理:邱圣广,南京大学硕士,研究方向为自然语言处理。


链接:https://www.ijcai.org/proceedings/2018/0584.pdf

绪论

1.  脚本事件预测

脚本事件预测这个任务最早是由Chambers andJurafsky于2008年提出来的,要求给定一个事件的上下文 (context),需要从候选列表中选出接下来最可能要发生的事件,如下图所示:

这是在餐馆场景下发生的一系列事件,根据已经发生的事件,5个候选事件中下一个最可能发生的事件就是离开餐馆(leave)。

2.  亮点

现有的关于脚本事件预测的方法主要是基于事件对和事件链的,但是会存在以下缺陷,如下图所示:

给定上下文:enter,order,serve,现在要从talk和eat这两个候选事件中选出下一个最可能发生的事件。在基于事件对和事件链的方法中,如(b)所示,在训练的时候,会发现(serve,talk)一起出现的频率要高于(serve,eat),因此在预测的时候选择talk的概率会更高;而在基于事件图结构(即事理图谱)的方法中,如(c)所示,(order,serve,eat)构成了一个强联通分量,这暗示了eat更可能是正确答案。

3.  论文贡献

(1) 第一个在脚本事件预测这个任务上提出基于图结构的方法

(2) 提出一个大规模图神经网络(Scaled Graph Neural Network),从而可以对大规模稠密有向图中的事件关系进行建模,进而学习出更好的事件表示。

模型

1.  事理图谱(NEEG)的构建

(1)  从语料库中抽取事件链

从语料库中抽出所有事件链:, 其中 表示一个事件链 ,  e_i 表示事件,采用四元组的形式表示,其中 p 表示谓语动词, a0, a1,a2 分别表示谓语动词的主语、直接宾语、间接宾语; T 则是被这个事件链中所有事件共享的主人公。下面是一个事件链的例子:s_i = {T=customer, walk{T,restaurant,-}, seat(T,-,-), read(T,menu,-), order(T,food,-),serve(waiter,food,T),eat(T,food,fork)}。

(2)  根据事件链构建图谱

• 根据抽出的事件链,事理图谱就可以形式化定义成一个图结构,其中中每个节点代表事件, 中每条边表示事件之间的关系。

•        为了解决稀疏问题,在图谱中每个事件都采用一种叫做谓词语法(predicate-GR)的形式 (v_i, r_i) 来表示,其中 v_i 表示为谓语动词,r_i 表示谓语动词与链实体之间的语法依赖关系,如 eat(T,food,fork) 用 predicate-GR 表示就是 (eat,subj)。

•        然后每条有向边的权重就可以通过以下公式计算得到:

2.  大规模图神经网络(SGNN

SGNN在GGNN的基础上进行改进,在训练阶段借鉴了分治的思想,只将当前所需子图作为训练样本,从而克服了GGNN不能处理大规模图的缺陷。整个模型的框架图如下所示:

其中(a)为部分事理图谱,(b)为本次训练所需子图,(c)为网络结构图,分为三部分:表示层、GGNN、相关性计算。下面将对这三部分进行介绍:

•        表示层

将输入的事件转成向量表示(即初始化),给定一个事件,分别获得谓语动词以及参数的word embedding,即,文中采用三种不同的方法获取事件 e_i 的表示

•        GGNN

GGNN用于更新事件表示,GGNN的输入为两个矩阵:初始隐藏层,  邻接矩阵 ,n, k 分别表示上下文事件、候选事件的个数,其中:

然后通过各种门不断地进行更新、计算,最终得到所有事件的最终表示h^t

•        相关性计算

获取最终表示 后,就可以计算context和候选事件之间的相关性:

其中 g 表示相似度计算函数,常用的有以下几种:

然后给定上下文: e_1, e_2,...e_n,候选事件发生的可能性为:

选择可能性最大的候选事件。

•        Attention机制

考虑到不同context在选择候选事件的时候占有的比重应该不同,所以作者加了一个attention机制,用来计算每个context对每个候选事件的权重,最后得到新的相似度计算函数:

•        目标函数

其中  表示第 I 个 context 和第 j 个候选事件之间的相似度,y 表示正确答案的下标,margin表示的是Margin loss参数, θ 表示模型参数。

实验

1. 数据集

数据集采用的是Gigaword语料库中的NYT部分,其统计情况如下:

2. 实验结果

作者与很多baseline进行了比较,实验结果表明:

(1) 基于神经网络的模型要比传统统计学习的模型要好。

(2) 基于事件图结构的模型要优于基于事件对或事件链的模型。

(3) 加了attention能够提高实验效果,说明不同context在选择时所占权重是不同的。

(4) 作者将自己的模型与baseline方法进行了结合,实验效果有不同程度的改变。

3. 比较性实验

作者还在验证集上进行了比较性的实验,从实验结果可以看到,采用连接方式获取事件表示,以及采用欧拉距离作为相似函数的时候,模型效果最好。

结论

本文提出了一种基于事理图谱的脚本事件预测方法,通过引入一个大规模图神经网络,用来对事件关系进行建模并学习事件表示。通过实验结果表明,基于事件图结构的方法要比基于事件对、事件链的方法好。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 | 基于事理图谱的脚本事件预测相关推荐

  1. ###好好好#######论文浅尝 | 基于图注意力的常识对话生成

    论文浅尝 | 基于图注意力的常识对话生成 OpenKG 祝各位读者新春快乐,猪年吉祥! 来源:IJCAI 2018. 论文下载地址:https://www.ijcai.org/proceedings/ ...

  2. 论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

    随着监督学习在机器学习领域取得的巨大发展,如何减少人工在样本方面的处理工作,以及如何使模型快速适应层出不穷的新样本,成为亟待解决的问题.零样本学习(Zero-Shot Learning, ZSL)的提 ...

  3. 论文浅尝 | 基于时序知识图谱的问答

    笔记整理:姚云志,浙江大学在读博士,研究方向为自然语言处理. 链接:https://arxiv.org/pdf/2106.01515.pdf 时序知识图谱是一种多关系的知识图谱,相较于常规的知识图谱, ...

  4. 论文浅尝 | 使用循环神经网络的联合事件抽取

    余博涛,南京大学计算机科学与技术系,硕士研究生 论文连接:http://www.aclweb.org/anthology/N16-1034 发表会议:NAACL-HLT 2016 摘要 事件抽取(ev ...

  5. 论文浅尝 | 采用多层注意力机制的事件检测

    笔记整理:杨帆,浙江大学计算机学院硕士,研究方向知识图谱. 动机 事件编码(event encoding)之前的工作集中在提取实体,检测触发单词以及匹配预定义的模板,这些方法存在以下缺点:首先它们依赖 ...

  6. 论文浅尝 | 基于对抗学习的弱监督知识图谱对齐

    论文笔记整理:郭凌冰,浙江大学研究助理,研究方向为知识图谱的表示学习. 绝大部分现有的知识图谱对齐方法都要求足够的已对齐三元组作为监督数据,但在现实世界中,获取大量的对齐三元组的代价十分高昂.本文提出 ...

  7. 论文浅尝 | 基于图卷积网络的跨语言图谱实体对齐

    论文笔记整理:谭亦鸣,东南大学博士生,研究兴趣:知识图谱问答 本文提出了一种基于图卷积网络的跨语言实体对齐方法,通过设计一种属性 embedding 用于 GCN 的训练,发现GCN能同时学习到特征 ...

  8. 论文浅尝 | 基于文本关联的知识图谱的无监督嵌入增强

    来源:IJCAI2019 论文链接: https://www.ijcai.org/proceedings/2019/0725.pdf 概述 知识图谱嵌入是从多关系数据中提取数据的工具,最近的嵌入模型对 ...

  9. 论文浅尝 | 基于深度强化学习将图注意力机制融入知识图谱推理

    论文笔记整理:陈名杨,浙江大学直博生. Introduction 知识图谱(KGs)在很多NLP的下游应用中起着越来越重要的作用.但是知识图谱常常是不完整的,所以解决知识图谱补全的任务也非常重要.主要 ...

最新文章

  1. OpenCASCADE Make Primitives-Sphere
  2. MVC入门学习笔记(十)
  3. NEO智能合约黑盒测试框架
  4. 聊了一个小时,一名电子专业研究生的困惑
  5. 前端学习(2993):vue+element今日头条管理--加入git管理
  6. [BZOJ 3647]
  7. 具有固定名称mysql.data_SQLServer数据库之未找到具有固定名称“System.Data.SqlClient”的 ADO.NET 提供程序的实体框架 解决方案...
  8. 单片机控制点阵字符显示及字模提取原理
  9. POI导出 Excel 加水印支持 SXSSFWorkbook 和 XSSFWorkbook 模式
  10. 基于VPX总线架构下的Virtex-7与C6678信号处理的VPX功能板简介
  11. 减肥日志:100天40斤!!
  12. 【LWP,进程,线程】Linux
  13. 自然语言处理文本分析_通过自然语言处理释放文本分析的力量
  14. 【fly-iot飞凡物联】(5):开源项目Apache IoTDB,开源项目学习,原来还有这样的项目,关于IOT的几个开源项目汇总下
  15. 北大齐教授健康讲座笔录
  16. 《响应式Web设计实践》一2.2 字体大小
  17. 考拉海购操作教学-API接口
  18. Wattagio for Mac(Mac电池管理软件)v1.12.11
  19. 猿创征文|Highgo Database安全版安装指导手册
  20. IPMP国际项目管理资质认证培训班

热门文章

  1. silverlight(一.安装和新建项目)
  2. mysql 8.0 一条insert语句的具体执行流程分析(三)
  3. LevelDb实现原理
  4. 一文看懂 | 内存交换机制
  5. Android ADB 源码分析(三)
  6. python标准库怎么用_Python常用标准库使用(一)
  7. 小型机oracle命令,Oracle小型机如何选型
  8. java创建一个未知长度的数组_Java数组的创建操作
  9. rds基于什么开发_java rds
  10. LeetCode 1894. 找到需要补充粉笔的学生编号