点击上方,选择星标置顶,每天给你送干货

阅读大概需要5分钟

跟随小博主,每天进步一丢丢

作者:choose_c

链接:

https://blog.csdn.net/choose_c/article/details/90273333

论文发表:ACL 2018

Github:https://github.com/luheng/lsgn

论文研究对象:

文章研究的是nlp中的语义角色标注问题(srl)。语义角色标注常见方法是基于成分句法树或基于依存句法树,今天讲的是深度学习模型进行语义角色标注。srl模型可以分为end to end和gold predicates,即句子中的谓语需要模型进行预测和提前知道两种情况,本文方法为前者,一步到位。而按照输出结果的形式还可以分为Span-Graph for SRL和BIO-tagging-based两种,本文方法也是前者,两者差别见下图。

好!接下来直接讲模型吧,上图,放公式。

首先输入是word&char representation,char向量经过cnn和词向量concate得到,词向量可以使用预训练的词向量,论文中使用了glove向量,elmo词向量可以进一步提升效果。这一层向量我们用表示,然后经过双向lstm之后得到contextualized representations,我们使用表示。由于在后面还会使用到向量,论文作者实现时原始用了一种glove预训练向量,传入lstm的向量用了另一个glove预训练向量(传入lstm的词向量可能会小一些,也可以使用相同的向量)。接着,需要分别得到predicate representation和argument representation。predicate representation可以用直接表示,而argument representation,即上图中的span representation则复杂一些,它是由一个论元头尾的词向量start,和end,还有h和f(a)concate得到,见如下公式。

接下来讲一下xh的表示,可以看到xh和其他词向量的差别,他用的是原始向量(前面说到会用到,就是这里)。xh(a)使用注意力机制得到,注意力权重使用向量计算得到,见如下公式,通过计算得到权重,与原始向量计算得到。

最后的f(a)表示的是论元的width的embedding表示,记录论元width信息。到这里模型各种的输入信息的表示介绍完了。

一句话如果有n个单词组成,那么可能的论元情况就有n的平方种,可能的谓语词就有n个,而谓语词和论文的关系如果有L种,那最后模型的复杂度为,通过选取限定论元和谓语词的候选值和判断他们是否存在关系可以将复杂度降低到 ,如果再限制论元width,论文中选取30,那最后的复杂度为.

论元和谓语词的候选值的选取可以通过之前的向量表示经过全连接之后得到的score值作为筛选条件。计算公式如下。

最后的输出可以通过计算候选论元和候选谓语词的关系得到所有可能输出结果,结果计算如下图。模型的介绍到此结束。

最后模型结果达到了当时的state of the art,2019的aaai上的论文[1]效果超过了它,模型如下图,其实没有太多的改动,就在最后获得最后结果的时候使用了Biaffine Scorer的预测方式。

参考:

[1] Dependency or Span, End-to-End Uniform Semantic Role Labeling


方便交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐阅读:

【ACL 2019】腾讯AI Lab解读三大前沿方向及20篇入选论文

【一分钟论文】IJCAI2019 | Self-attentive Biaffine Dependency  Parsing

【一分钟论文】 NAACL2019-使用感知句法词表示的句法增强神经机器翻译

【一分钟论文】Semi-supervised Sequence Learning半监督序列学习

【一分钟论文】Deep Biaffine Attention for Neural Dependency Parsing

详解Transition-based Dependency parser基于转移的依存句法解析器

经验 | 初入NLP领域的一些小建议

学术 | 如何写一篇合格的NLP论文

干货 | 那些高产的学者都是怎样工作的?

一个简单有效的联合模型

近年来NLP在法律领域的相关研究工作


让更多的人知道你“在看”

【论文】图文解读经典之作Span-Graph for SRL - 一篇经典的语义角色标注paper相关推荐

  1. 语义角色标注 Semantic Role Labeling(SRL) 初探(整理英文tutorial)

    语义角色标注 本文链接 最近调研了一下语义角色标注,记录如下 将语言信息结构化,方便计算机理解句子中蕴含的语义信息. 语义角色标注 (Semantic Role Labeling, SRL) 是一种浅 ...

  2. 论文大盘点|卷积神经网络必读的100篇经典论文,包含检测/识别/分类/分割多个领域...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 转载自:极市平台 作为深度学习的代表算法之一,卷积神经网络(Convolution ...

  3. 从6篇经典论文看问题生成及其相关技术

    ©PaperWeekly 原创 · 作者|Maple小七 学校|北京邮电大学硕士生 研究方向|自然语言处理 在问答系统的构建中,问题生成(QG)常被当作一种数据增强技术来对待,然而在实践中,通过问题生 ...

  4. CVPR 2020 Oral 汇总:论文 / 代码 / 解读(更新中)

    在2月24日,CVPR 2020 公布接收论文结果公布,从 6656 篇有效投稿中录取了 1470 篇论文,录取率约为 22%.3月13日,CVPR Oral结果公布了.有大佬已经分享了自己的工作,本 ...

  5. 【论文】时空预测模型Spatio-Temporal Graph Convolutional Networks

    STGCN流量预估模型论文解读 <Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traf ...

  6. 把一个人的特点写具体作文_五年级下册第五单元习作把一个人的特点写具体写作指导+范文赏析+图文解读...

    宁琪老师说: 我们每天都会接触到形形色色的人,让我们从中选择一个,把他/她的特点写具体. · 第一步:审题 在我们身边有形形色色的人,不同性别.性格.年龄.身份的人,特点一定是不同的.有特点的人可以是 ...

  7. 不规则图形数格子的方法_北师大版五年级数学上册数学6.1组合图形的面积微课堂、同步练习、图文解读...

    点击上方蓝字关注我们! 电子教材 点击图片,查看大图 ▼▼▼ 微课堂 知识点 知识点:了解组合图形:有几个简单的图形拼出来的图形,我们把它们叫做组合图形. 计算组合图形的面积的方法是多种多样的.一般运 ...

  8. ECCV 2022 旷视入选论文亮点解读(上)

    近日,欧洲计算机视觉国际会议 ECCV 2022(European Conference on Computer Vision)发布了论文录用结果.本届 ECCV 2022论文有效投稿数5803篇,其 ...

  9. 元学习之《On First-Order Meta-Learning Algorithms》论文详细解读

    元学习系列文章 optimization based meta-learning <Model-Agnostic Meta-Learning for Fast Adaptation of Dee ...

  10. PSGAN——姿态稳健型可感知空间式生成对抗网络论文详细解读与整理

    PSGAN--姿态稳健型可感知空间式生成对抗网络论文详细解读与整理 1.摘要 2.什么是PSGAN? 3.主要贡献 4.整体模块 5.目标函数 6.实验结果--部分化妆和插值化妆 7.定量比较 8.参 ...

最新文章

  1. Kotlin 1.3.30 发布,改进性能和引入新特性
  2. wust2013届推免生复试机试代码
  3. 从无监督构建词库看「最小熵原理」,套路是如何炼成的
  4. winform下 PictureBox 显示网络图片
  5. 有限覆盖定理证明区间套_圆内整点问题的开普勒猜想证明,关于圆内整点问题误差项的估值E(r)=1-x,x=sin(nx)...
  6. efcore调用函数_.net core EF Core调用存储过程的方式
  7. Hadoop1.x版本升级Hadoop2.x
  8. C语言中预定义宏的应用
  9. 如何使用python装饰器_Python学习之如何使用装饰器 @decorator
  10. android8 压力触控,压力感应触摸屏的原理说明
  11. 计算机网络与社会需求,计算机网络的技术论文计算机网络与社会需求.doc
  12. 数码相机如何当做摄像头(图文并茂版)
  13. 基于Tight VNC的远程协助功能的实现
  14. [CF888G] Xor-mst (Trie 树,最小生成树)
  15. j2me解决模拟器乱码
  16. 乐高ev3搭建图纸大全_乐高课程的详细介绍,内附7岁系列课程,还不抓紧时间收藏...
  17. 伺服电机转矩常数的标定方法
  18. sniffer pro 4.7.5安装教程(附安装系统环境及软件链接)
  19. 数字逻辑课程设计(一):数字时钟——logisam模拟实现
  20. 12306android端接口,12306官方火车票Api接口

热门文章

  1. 玉伯 对 前端的 金玉良言
  2. [转]Java web 开发 获取用户ip
  3. 悲剧,当用cywin 写Linux脚本
  4. Python的几个相关实例
  5. tomcat启动问题,卡在 preparing launch delegate 100% 的解决方法
  6. Mysql中contact、group_concat、concat_ws、repeat
  7. htm的head标签各元素分享
  8. 中国Linux源镜像站大全
  9. jsp 基本语法学习笔记
  10. P1268 树的重量