EMNLP20,GEC(Grammar Error Correct)比较近的一篇文章,没啥太多的novelty,主要是用了RoBertA,和以往的neural方法一样,seq2seq model,只是将detect和correct这两个模块解耦,对detect出来的error span进行correct,速度快,能够跨语言,比较适合工业上的使用,对学术上来说并不能产生很惊艳的效果。

Introduction

没啥好说的,就是在传统seq2seq的基础上把encoder-decoder分为了GED(detect)和GEC(correct),一个sequence tagging model还有一个erroneous spans corrector.

related

认为传统方法要么由于将整段文本进行en-de,导致时间上开销很大,而且模型方法很复杂(assemble、rescoring、multi-round);要么是language dependency。现有seq2seq没有做到性能和速度还有灵活性并具。

method

极其简单的一部分…第一次见到methodology就半页的,GED和GEC实现分别如下:

  • GED:
    利用了ERRANT对data pair进行alignment,在source sequence上面用0/1标注是否有error,以此训练tagging model.

  • GEC:
    对specific span进行correct,为了能够让GEC能够有更强的robustness,paper里面没有采用gold erroneous spans ,而是和SpanBERT一样采用了random select span(Geometric distribution)的方式训练model。
    对sample来的spans,用seq2seq仅仅对erroneous spans 进行correct

experiment

对英文和中文(Roberta和chinese BERT)进行fine-tune,decoder用了transformer,主要是时间上变快了,性能上一般吧,没见的提升很多。

总结

感觉可以在工业上用用,因为GEC很大程度会受GED的影响,可以把GED的precision调高点。

Improving the Efficiency of Grammatical Error Correction with Erroneous Span Detection and Correctio相关推荐

  1. Improving the Efficiency of Grammatical Error Correction with Erroneous Span Detection翻译

    摘要 我们提出了一种独立于语言的新颖方法,通过将GEC任务分为两个子任务来提高语法错误纠正的效率:错误跨度检测(ESD)和错误跨度校正(ESC).ESD使用有效的序列标注模型来识别语法错误的文本范围. ...

  2. 论文笔记:Improving Grammatical Error Correction Models with Purpose-Built Adversarial Examples

    论文笔记:Improving Grammatical Error Correction Models with Purpose-Built Adversarial Examples 文章简要介绍 出处 ...

  3. 论文阅读:Overview of the NLPCC 2018 Shared Task: Grammatical Error Correction

    论文阅读:Overview of the NLPCC 2018 Shared Task: Grammatical Error Correction 1. 引言 2. 任务定义 3. 数据 3.1 训练 ...

  4. 复现有道NLPCC-2018 CGEC:A Neural Machine Translation Approach to Chinese Grammatical Error Correction

    有道NLPCC-2018 CGEC任务论文:A Neural Machine Translation Approach to Chinese Grammatical Error Correction ...

  5. 自动语法错误校正(Grammatical Error Correction)

    写英语论文很折磨人.平时用英语写的少,关键时候写的头痛死.记起前段时间在知乎上看了一个哥们写的NLP潜在热门方向,介绍了自动语法错误校正(具体名称记不起来了,当时没有收藏,现在找不到了).就不知道怎么 ...

  6. Jabba: hybrid error correction for long sequencing reads using maximal exact matches机译:Jabba:使用最大精

    Jabba: hybrid error correction for long sequencing reads using maximal exact matches 机译:Jabba:使用最大精确 ...

  7. Bi-level error correction for PacBio long reads. PacBio长读数的两级纠错

    Bi-level error correction for PacBio long reads. PacBio长读数的两级纠错 作者: Liu Yuansheng; Lan Chaowang; Blu ...

  8. HALC: High throughput algorithm for long read error correction

    Journal|[J]BMC BioinformaticsVolume 18, Issue 1. 2017. HALC: High throughput algorithm for long read ...

  9. Ratatosk - Hybrid error correction of long reads enables accurate variant calling and assembly

    Ratatosk - Hybrid error correction of long reads enables accurate variant calling and assembly   长读的 ...

最新文章

  1. CocoaPods (第三方资源管理框架)
  2. 《强化学习周刊》第40期:PMIC多智能体强化学习、Lazy-MDPs、CTDS
  3. C++继承中析构函数 构造函数的调用顺序以及虚析构函数
  4. 使用RestTemplate访问restful服务时遇到的问题
  5. plsql(轻量版)-存储函数存储过程
  6. Windows下查看端口被占用问题和解决办法
  7. linux 显示器分辨率设置太小了,显示器不显示 如何在设置回来,当“显示设置”中的分辨率不可用时,如何使用xrandr设置自定义分辨率...
  8. 32 块大小_详解Linux文件系统的完整结构--引导块、超级块、GDT等
  9. Linux下启动/关闭Oracle
  10. Android Studio配置ADB环境变量
  11. BOCHS 模拟器和我的启动代码
  12. 古体字与简体字对照表_简体字和繁体字对照表
  13. Word文档压缩的方法
  14. 浮点数单双精度输出位数
  15. 最新支持7.2!用C++干掉讨厌的学生机房管理助手
  16. web工程的读书笔记
  17. ros-gazebo-仿真环境搭建
  18. 2017 ACM-ICPC 亚洲区(乌鲁木齐赛区)网络赛
  19. 图文并茂的电脑组装过程讲解
  20. android 最简洁的日历,简洁日历 - 日历与 ToDo 的完美结合 #Android

热门文章

  1. C#开发的通用化视觉系统框架
  2. 【转载】第一次有人把 5G 讲的这么简单明了
  3. flash 8或flex 2.0+.net web service做在线大头贴,完善中!
  4. 《和空姐同居的日子》
  5. 十张GIFs让你弄懂递归等概念
  6. 智能RGV的动态调度策略
  7. UP9616|UPI车充IC| QC3.0认证车充方案|兼容FCP/TypeC/BC1.2/Apple等协议
  8. metamask方法使用获取账户信息
  9. 一款小程序增强开发工具 - EWA
  10. 双十一发货超2000万件,极智嘉(Geek+)柔性方案从容应对购物狂欢节