An Imitation Learning Curriculum for Text Editing with Non-Autoregressive Models [pdf]

  • 论文状态:被ACL22接收
  • 作者:University of Maryland的 Sweta Agrawal 和 Marine Carpuat
  • TL;DR: 本文介绍了两种互补的策略来解决NAR模型适应编辑任务时训练不足和泛化问题:roll-in policy和Curriculum Learning

1. Motivation

设计用于训练机器翻译模型的模仿学习算法引入了训练阶段和推理阶段之间的不匹配,导致在text editing任务中的训练不充分和泛化错误。

2. Contribution

  • 提升了text editing任务的输出质量和可控性
  • 在controllable text simplifification (TS) 和 abstractive summarization任务上应用了非自回归模型

3. Model

传统的非自回归模型一般是会基于输入的文本做编辑,规定2种操作类型:

  • reposition:预测单词的位置和是否该删掉
  • insertion: 预测掩码位置 和 掩码单词预测

而在训练的时候,是根据ROLL-IN POLICIES来训练的(我是做摘要的,没有看懂什么是ROLL-IN POLICIES,貌似是某种Markov Decision Process)

  • 作者修改了ROLL-IN POLICIES,添加了一些噪音。
  • 然后为了防止训练不充分,作者用简单的例子先训,再逐步增加复杂度。

4. Experiments

在一个6K数据的短文本摘要数据集(Toutanova et al. (2016))上做了实验。

比较的模型都是20年之前的模型,也没有和BART之类的模型对比。主要是和一个同为Non-Autoregressive Model的FELIX模型对比。

而且也只report了Rouge-L分数。

得出的结论是EDITCL能大幅提升Recall,进而把F1分数提升。

5. Key takeaways

  • 不只有Autoregressive方法做生成式摘要,还有Non-Autoregressive Model

[ACL22] An Imitation Learning Curriculum for Text Editing with Non-Autoregressive Models阅读笔记相关推荐

  1. 《A Survey on Deep Learning Technique for Video Segmentation》视频分割综述阅读笔记(翻译)

    <A Survey on Deep Learning Technique for Video Segmentation>视频分割综述阅读笔记(背景部分翻译) 作者:Wenguan Wang ...

  2. Dual Contrastive Learning: Text Classification via Label-Aware Data Augmentation 阅读笔记

    Dual Contrastive Learning: Text Classification via Label-Aware Data Augmentation PyTorch实现:https://g ...

  3. Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction论文阅读笔记

    我的博客链接 0. 前言 1. 作者试图解决什么问题? 作者想在KGE中对语义层级(semantic hierarchies)进行建模. 2. 这篇论文的关键元素是什么? semantic hiera ...

  4. MGN:Learning Discriminative Features with Multiple Granularities for Person Re-Identification阅读笔记

    Learning Discriminative Features with Multiple Granularities for Person Re-Identification Guanshuo W ...

  5. 【图像增强】Learning Enriched Features for Real Image Restoration and Enhancement 阅读笔记

  6. Deep Learning for Polar Codes over Flat Fading Channels《阅读笔记》精读

    平面衰落通道上的极地代码深度学习 文章目录 Abstract introduction 二.系统模型 1.系统模型框图 Polar Codes 神经网络模型 性能评估 结论 Abstract 提出了啥 ...

  7. 【李宏毅2020 ML/DL】P115-117 Actor-Critic Sparse Reward Imitation Learning

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 关于强化学习,我专门花半年时间学习实践过,因此这里笔记只记录李老师的 outline .我的强化学习资源仓库: ...

  8. 【论文笔记】Reinforcement and Imitation Learning for Diverse Visuomotor Skills

    目录 Abstract Introduction Related Work Model A. Background: GAIL and PPO 1. 行为克隆(Behavior Cloning) 2. ...

  9. CS285课程笔记(1)——模仿学习(Imitation Learning)

    (本文对应lecture 1和2,文中的图片来自于对课程课件截图的小修小改) 1. 强化学习简介 本节介绍在课程中我认为对于理解强化学习框架有用的一些概念.更为详细的可以参照我的其他博客. 1.1 强 ...

最新文章

  1. Ubuntu配置伪分布式hadoop时报错:localhost: mkdir: 无法创建目录/usr/local/hadoop/logs: 权限不够...
  2. memcached+keepalived+magent高群集
  3. 腾讯云centos7搭建javaweb服务器(本人亲自经历,详细)
  4. OpenCV图像处理使用笔记(四)——图像融合
  5. 分支限界法 tsp java_基于分支限界法的旅行商问题(TSP)一
  6. 量数据导出Excel 之 多重影分身之术
  7. NAT技术与代理服务器的区别
  8. [201209][HTTP 权威指南][陈涓][赵振平][译]
  9. 51蓝牙红外循迹避障小车+代码
  10. leetcode 53. Maximum Subarray(DP动态规划问题)
  11. 上传文件,路径为C:\fakepath\的问题(待跟进)
  12. ucore Lab 1 系统软件启动过程
  13. laravel pdf 加水印
  14. 优盘插计算机上成快捷方式,u盘一插就变成快捷方式打不开怎么办 u盘变成快捷方式怎么办...
  15. 什么是前台?什么是中台?什么是后台?
  16. 优动漫PAINT入门小知识——拾色器功能
  17. Linux du命令(du -h ,du -s)
  18. 百度地图搜索、标注地图示例
  19. 流言粉碎机:JAVA使用 try catch会影响性能
  20. 【mcuclub】0.96寸oled显示屏

热门文章

  1. WPF 数据库数据导出为Datatable,Datatable导出为Excel
  2. ckplayer在播放FMS rtmp视频地址时跟普通的的地址调用是一样的
  3. 京东移动端商场步骤来源黑马
  4. 前端各种分辨率问题总结
  5. 哈工大计算机学院2021复试分数线,2021年哈工大研究生分数线是多少
  6. 关于国产化迁移至银河麒麟终端
  7. Failure downloading binaries (curl RC=56). Please try again and .....问题解决
  8. 打造丝般顺滑的 H5 翻页库
  9. 方向不对,努力白费(好文章)
  10. Python 2 和 Python 3 操作 MySQL 数据库实现创建表、删除表、增删改查操作