Abstract

本文在一个简单的基于图的依赖解析器中使用神经注意,并使用biaffine分类器来预测弧和标签。将传统的基于MLP注意力机制和仿射标签分类器替换为biaffine注意力

Model

biaffine并不是双向性或MLP机制,而是使用一个仿射变化在单个LSTM输出状态rrr预测所有类别的得分
若每个句子中有N个单词,包括根在内一共有d=N+1个词,每个词都需要得到一个分数sis_isi​,因为句子中词的个数是不确定的,所以这是一个不定类别的分类问题。
为了解决上述不定类别的分类问题,本文采用两个MLP对BiLSTM的隐层输出向量进行重新编码:hi=MLP(ri);hj=MLP(rj)h_i=MLP(r_i);h_j=MLP(r_j)hi​=MLP(ri​);hj​=MLP(rj​),然后通过线性变化和双仿射分类器得到的结果就是deep bilinear attention mechanism

启示

  1. 本文主要的工作是提出了双仿射注意力机制,只能说太强了。

Deep Biaffine Attention for Dependency Parsing相关推荐

  1. 信息抽取(四)【NLP论文复现】Multi-head Selection和Deep Biaffine Attention在关系抽取中的实现和效果

    Multi-head Selection和Deep Biaffine Attention在关系抽取中的应用 前言 Multi-head Selection 一.Joint entity recogni ...

  2. Chapter7-9_Deep Learning for Dependency Parsing

    文章目录 1 什么是Dependency Parsing 2 模型结构 本文为李弘毅老师[Deep Learning for Dependency Parsing]的课程笔记,课程视频youtube地 ...

  3. CS224N Assignment3 #3: Dependency Parsing(2022 winter)

    课程网站:https://web.stanford.edu/class/archive/cs/cs224n/cs224n.1214/ 1. Machine Learning & Neural ...

  4. 【CS224n】(assignment3)Dependency Parsing

    学习总结 (1)关于5个assignment的难度,可以参考斯坦福大佬的CS224作业评论,大体是说今年的transformer成为课程重点,由总助教博三大佬John讲,他原本还想让同学们手写enco ...

  5. 句法分析:依存分析(Dependency Parsing)

    目录 1. 句法分析任务分类 2. 依存分析方法 2.1 什么是依存分析 2.2 传统的基于转移的依存分析(Transition-based Parsing) 2.3 神经依存分析(Neural De ...

  6. 交通事故风险预测——《TA-STAN: A Deep Spatial-Temporal Attention Learning Framework...》

    一.文章信息 <TA-STAN: A Deep Spatial-Temporal Attention Learning Framework for Regional Traffic Accide ...

  7. 【CS224n-5】Linguistic Structure: Dependency Parsing

    一.句法结构(syntactic structure) 主要有两种方式: 1)Constituency Parsing       2)Dependency Parsing 二.Constituenc ...

  8. 【CS224n】(lecture4)Dependency Parsing 依存句法分析

    学习总结 句法分析(Syntactic Parsing),两种典型的句法结构表示: (1)短语结构句法:依托上下文无关文法,S代表起始符号,如NP和VP分别表示名词短语和动词短语. (2)依存结构句法 ...

  9. 2019年CS224N课程笔记-Lecture 5: Linguistic Structure: Dependency Parsing

    资源链接:https://www.bilibili.com/video/BV1r4411,部分内容参考来自于码农场 » CS224n笔记6 句法分析和https://zhuanlan.zhihu.co ...

最新文章

  1. java swing事件监听_Java swing(awt):事件监听机制的实现原理+简单示例
  2. 数据结构—— 基于二叉树的算术表达式求值
  3. C++静态成员和静态方法
  4. ACM001 Quicksum
  5. Android蓝牙A2DP连接实现
  6. 浅谈mtk平台手机通过gprs网络连接pc
  7. 数据结构(C++版) 栈的链接存储结构及实现
  8. sql or 与and同时有时要注意
  9. html+css 登录界面
  10. vmware虚拟机运行速度卡慢原因分析及解决办法大全(二)
  11. 【转】关系型数据库的设计范式 1NF 2NF 3NF BCNF
  12. 手机共享电脑网络上网
  13. R语言 CHAR 11
  14. 35岁程序员如何转型
  15. 关于一个ISE错误XST:899的错误判断的讨论
  16. OpenFalcon线上初步部署
  17. 最新勒索病毒扩展名.actin,.2k19sys,.help,.lanset的特征分析,常见处理方式
  18. 微信公众平台开发总结
  19. 6-6 实验6_9_素数分解 (100分)
  20. 计算机毕业设计(附源码)python校园食堂订餐系统项目运行

热门文章

  1. oracle添加唯一约束
  2. 多媒体操作系统──BeOS
  3. keepalive+nginx搭建主从负载服务器
  4. LTE终端状态汇总:
  5. CSS3动画特效详解
  6. 了解人脸识别和二维码识别
  7. 分布式处理数据:client
  8. java channel midi_为Java程序中添加播放MIDI音乐功能
  9. html页面内容分页【转】
  10. 多项目同时进行如何做好进度管理