论文笔记 COLING 2020|Joint Event Extraction with Hierarchical Policy Network
文章目录
- 1 简介
- 1.1 动机
- 1.2 创新
- 2 背景知识
- 3 方法
- 4 实验
- 5 总结
1 简介
论文题目:Joint Event Extraction with Hierarchical Policy Network
论文来源:COLING 2020
论文链接:https://aclanthology.org/2020.coling-main.239.pdf
1.1 动机
- 目前pipeline和joint的事件抽取,都存在冗余的实体-事件对信息,从而带来可能的错误。同时存在错误匹配问题(一个句子中存在多个事件)
1.2 创新
- 使用policy network做事件抽取
- 提出了一个分等级(两个)的结构进行联合事件抽取,充分探索了事件抽取子任务之间的深层信息交互,并解决了多个事件和错误匹配问题。
2 背景知识
强化学习包含三个主要概念,环境状态(Environment State),行动(Action),奖励(Reward)。强化学习的目标是获得最多的累计奖励。
3 方法
模型的整体框架如上图所示,主要分为两个部分:
- 事件级别Policy Network:首先计算每个token的状态stes_t^este(hth_tht为双向LSTM的词编码),然后进行选择μ(ote∣ste)\mu(o_t^e|s_t^e)μ(ote∣ste),最后计算奖励分数rter_t^erte(非触发词和触发词之间设置偏差),当全部事件级别的事件选择完成,整个句子的奖励分数为rtere=F1(S)r_{ter}^e=F_1(S)rtere=F1(S)。具体公式如下:
- 论元级别Policy Network:大致流程和事件级的网络一致,其中定义了事件检索表,可以根据事件的类型压缩论元角色的集合,具体公式如下。
当前事件状态下全部论元级别的选择完成,最终的奖励分数为:
Loss函数如下,对奖励进行累加:
使用policy gradient method(参考链接)和REIN FORCE algorithm进行优化:
4 实验
在ACE2005和TAC2015数据集上的实验效果如下:(使用Stanford CoreNLP toolkit处理数据)
在多句子情况下的实验效果:
在触发词和论元都存在出现在训练集和测试集的对比实验效果:
触发词分类的实验效果与触发词识别接近,进行错误分析的结果如下,
5 总结
- 使用强化学习进行事件抽取,可以解决句子中多事件的重叠问题。
论文笔记 COLING 2020|Joint Event Extraction with Hierarchical Policy Network相关推荐
- 论文笔记 NAACL 2016|Joint Event Extraction via Recurrent Neural Networks
文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 编码 3.1.1 句子编码 3.1.2 RNN编码 3.2 预测 3.2.1 触发词预测 3.2.2 论元角色预测 3. ...
- 论文笔记 NAACL 2021|Document-level Event Extraction with Efficient End-to-end Learning of Cross-event De
文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 基础模型 3.2 跨事件依赖 4 实验 1 简介 论文题目:Document-level Event Extractio ...
- 【论文笔记】3D LiDAR-Based Global Localization Using Siamese Neural Network
[论文笔记]3D LiDAR-Based Global Localization Using Siamese Neural Network ~~~ ~~~~ 在本文基于从神经网络中学习到的 ...
- 论文笔记 EMNLP 2020|Event Extraction by Answering (Almost) Natural Questions
文章目录 1 简介 1.1 动机 1.2 创新 2 方法 3 实验 1 简介 论文题目:Event Extraction by Answering (Almost) Natural Questions ...
- 【论文笔记】Multi-modal Knowledge-aware Event Memory Network forSocial Media Rumor Detection
论文标题:Multi-modal Knowledge-aware Event Memory Network forSocial Media Rumor Detection 论文链接:https://s ...
- 论文笔记(三):PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes
PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes 文章概括 摘要 1. ...
- 论文笔记 EMNLP 2020|Resource-Enhanced Neural Model for Event Argument Extraction
文章目录 1 简介 1.1 动机 1.2 创新 2 方法 3 实验 1 简介 论文题目:Resource-Enhanced Neural Model for Event Argument Extrac ...
- 论文笔记 EMNLP 2020|Graph Transformer Networks with Syntactic and Semantic Structures for Event Argument
文章目录 1 简介 1.1 创新 2 方法 3 实验 1 简介 论文题目:Graph Transformer Networks with Syntactic and Semantic Structur ...
- 论文阅读05:基于循环神经网络的联合事件抽取-Joint Event Extraction via Recurrent Neural Networks
公众号:数据挖掘与机器学习笔记 1.简介 事件抽取是把含有事件信息的非结构化文本以结构化的形式呈现出来,在自动文摘.自动问答.信息检索等领域有着广泛的应用.近些年来 ,事件抽取一直吸引着许多研究机构和 ...
最新文章
- memcached 高可用工具 memcached-ha
- PCB板上字母表示的含义
- springmvc中@PathVariable和@RequestParam的区别
- 不会几个框架,都不好意思说搞过前端: Vue.js - 60分钟快速入门
- js中解析json字符串
- 棋盘问题(信息学奥赛一本通-T1217)
- [COCOS2DX-LUA]0-001.利用ClippingNode实现放大镜功能
- Linux Socket C语言网络编程:UDP Socket
- 给网站插入一个百度地图API
- python利用函数求20的阶乘_请运用reduce函数,计算20的阶乘,慕课网2-19
- 阶段3 2.Spring_08.面向切面编程 AOP_6 四种常用通知类型
- flashfxp修改服务器密码,flashfxp服务器端设置
- BOCHS 模拟器和我的启动代码
- Android下WPS打开Excel2007版也有问题
- 假定一种编码的编码范围是a-y的25个字母,形成一个数组如下: a,aa,aaa,aaaa,aaab,aaac,...yyyy 其中a的Index为0aa的Index为1aaa为2,以此类推。
- 乐2 乐视X621_官方线刷包_救砖包_解账户锁
- 0930 视频边下边播/蓝牙库/阿里博客/afnetworking详细/小程序工具
- java多个pdf合并为一个pdf,并通过feign下载
- Word中相邻的两页无法没有对齐的解决方法
- 吐血之作 | 流系统Spark/Flink/Kafka/DataFlow端到端一致性实现对比
热门文章
- Jquery动态显示当前时间
- python:跳出内循环,继续下一次外循环的写法
- Scrapy框架下载与安装
- 设计模式(四)——工厂模式(Factory Pattern)
- 原型模式(设计模式详解)
- 车牌识别系统连不上服务器怎么办,车牌识别系统出现故障的解决方法有哪些?...
- 基于51单片机的甲醛浓度检测仪
- java 安装报错2503,Windows运维之Win10安装msi程序报错2503和2502错误解决方案
- 60V5A LLC,方案采用NCP1654+L6599,资料 包括原理图和PCB,变压器和谐振电感的规格书以及其他资料,请看图
- C语言字符与字符串的库函数