本文针对事件抽取任务中的触发词识别和触发词分类子任务提出了可以充分利用字级别和词级别语义信息的模型Trigger-Aware Lattice Neural Network(TLNN),在ACE2005和KBP2017数据集上取得了state-of-art的效果。本文收录在EMNLP2019
源码:github 原文:原文链接

缺少自然分隔符的语言(如中文)在事件抽取任务上存在以下问题:
① 基于词(word)的方法易造成触发词的错误匹配/识别(Trigger Identification),原因在于预处理阶段的分词错误。
② 触发词的多义性会导致触发词的分类(Trigger Classfication)错误。
解决方法:
本文提出的TLNN框架动态融合字(character)与词(word)的信息以缓解问题①
通过添加外部语言知识库(HowNet)增强对多义触发词的理解以缓解问题②
TLNN框架:

基于触发词感知的特征提取器架构(Trigger-Aware Feature Extractor):

为了缓解触发词的错误匹配问题,创建一个path链接某个词开始和结束位置之间所有词的单元状态(cell state)。
该模型分为三个阶段的处理流程:
1) 预处理模块:使用Skip-Gram模型将句子序列S={c1,c2,…,cN}转化为字级别和词级别的向量。同时,基于HowNet得到所有的与该句子序列中有关的字和词的注释信息向量(sense-level embedding)。
2) 特征提取模块
使用触发词感知的网格LSTM(Trigger-aware lattice LSTM)作为特征提取器,它可以同时提取character-level、 word-level、sense-level(使用HowNet对多义词的注释)的信息。
3) 序列标注模块
采用BIO标注方式,使用CRF预测序列的标注结果,并获得序列标注的loss。
实验:
本文在ACE2005和KBP2017数据集上分别进行了触发词识别和触发词分类的实验。文中实验对比基于字和基于词的触发词识别和触发词分类任务时均取得较好的效果。

总结:
本文提出一个事件抽取模型TLNN,该模型可以有效缓解触发词错误匹配和一词多义的触发词问题,借助多个粒度的语义特征表示(字级别、词级别、字/词释义级别)和
基于触发词感知的特征提取器捕获多个层级的语义信息,得到了较好的实验效果。

补充

Lattice LSTM 结构

该模型对输入字符序列和所有匹配词典的潜在词汇进行编码。与基于字符的方法相比,该模型显性地利用词和词序信息。与基于词的方法相比,lattice LSTM不会出现分词错误。门控循环单元使得模型能够从句子中选择最相关的字符和词,以生成更好的效果。

关注我的微信公众号,一起变强!

参考:
【1】**Lattice LSTM介绍:**https://baijiahao.baidu.com/s?id=1604786068701856320&wfr=spider&for=pc
【2】Yue Zhang、Jie Yang .2018 Chinese NER Using Lattice LSTM原文链接

Event Detection with Trigger-Aware Lattice Neural Network(论文解读)相关推荐

  1. Saliency as Evidence: Event Detection with Trigger Saliency Attribution 论文解读

    Saliency as Evidence: Event Detection with Trigger Saliency Attribution 论文:https://aclanthology.org/ ...

  2. Saliency as Evidence: Event Detection with Trigger Saliency Attribution(ACL2022)

    论文题目:Saliency as Evidence: Event Detection with Trigger Saliency Attribution 论文:https://aclanthology ...

  3. 【医学+深度论文:F16】2015 EMBC Glaucoma detection based on deep convolutional neural network

    16 2015 EMBC Glaucoma detection based on deep convolutional neural network Method : 分类 Dataset :ORIG ...

  4. Exploring the Connection Between Binary andSpiking Neural Networks论文解读

    Exploring the Connection Between Binary andSpiking Neural Networks论文解读 前言 总说 提出B-SNN(论文中为Ⅲ) 实验和结果(论文 ...

  5. 论文阅读 # Event Detection with Trigger-Aware Lattice Neural Network

    这里写目录标题 摘要 1.介绍 2.方法 2.1 分层表示学习 2.2 触发感知特征提取程序 2.3 序列标记器 3.实验 3.1 数据集和实验设置 3.2 总体结果 3.3 触发感知特征抽取器的作用 ...

  6. Distilling the Knowledge in a Neural Network 论文笔记蒸馏

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/bryant_meng/article/ ...

  7. Identifying drug–target interactions based on graph convolutional network and deep neural network 论文

    Identifying drug–target interactions based on graph convolutional network and deep neural network 文章 ...

  8. 特征交互新路线|阿里 Co-action Network论文解读

    最近看到阿里的新工作在公众号上突然流行起来,自己也没忍住去认真拜读了一下,确实是好文.按照自己的理解对论文做了粗浅的解读. 这篇文章主要介绍周国睿大佬的新工作:CAN: Revisiting Feat ...

  9. 韩松EIE:Efficient Inference Engine on Compressed Deep Neural Network论文详解

    EIE为韩松博士在ISCA 2016上的论文.实现了压缩的稀疏神经网络的硬件加速.与其近似方法的ESE获得了FPGA2017的最佳论文. 目录 一.背景与介绍 1.1 Motivation 1.2 前 ...

最新文章

  1. GitHub中的奇葩项目:登顶过趋势榜的女装大佬项目
  2. 浏览器对象模型BOM
  3. Nginx教程-日志配置
  4. java实现对无符号整数的支持
  5. pythonopencv算法_python opencv之SURF算法示例
  6. 线段树(单点更新,区间查询) HDU 1754 I Hate It
  7. python如何判断QQ是否在线?
  8. uniapp 微信小程序下载文件 完整方法
  9. Flash遮罩之光芒四射、佛光普照
  10. 产品经理(PM)的工作流程
  11. windows应用下面卸载不干净如何解决!
  12. 接口测试常见面试题(含答案)
  13. 原生JS事件绑定的三种方式
  14. C++内存管理与指针的使用
  15. jquery 入门(jquery是什么/与JavaScript的联系与区别/jquery版本/引包/入口函数)
  16. 大学生考华为认证HCIP需要做那些准备?
  17. 甘露糖-聚乙二醇-马来酰亚胺 mannose-PEG-MAL 马来酰亚胺-PEG-甘露糖
  18. windows下tomcat集群配置(两种方法)
  19. 怎么聊微信才能让她喜欢你
  20. RPG血腥僵尸感染像素恐怖游戏素材地图场景

热门文章

  1. 关系网络 Relation Network
  2. 单向TSP问题(Uva 116)
  3. 大熊课堂python资源_大熊课堂 - 主页
  4. 滕达路由器拉网线最大线长不超过50米
  5. 香港银行开户哪家门槛低
  6. matlab logistic函数表达式,利用MATLAB进行logistic曲线拟合
  7. 粒子滤波 particle filter —从贝叶斯滤波到 粒子滤波—Part-III(重要性采样序贯重要性采样SIS)
  8. 昆曲清音——南京听戏小记
  9. 微信小程序 移动端触碰区域一如何构造良好的用户体验 的探讨
  10. 科技的成就(四十四)