从 2017-2019 年开始,NLP 模型发生了翻天覆地的变化,这种全监督范式发挥的作用越来越小。具体而言,研究重点开始转向预训练、微调范式。在这一范式下,一个具有固定架构的模型通过预训练作为语言模型(LM),用来预测观测到的文本数据的概率。由于训练 LM 所需的原始文本数据需要足够丰富,因此,这些 LM 都是在比较大的数据集上训练完成。之后,通过引入额外的参数,并使用特定任务的目标函数对模型进行微调,将预训练 LM 适应于不同的下游任务。在这种范式下,研究重点转向了目标工程,设计在预训练和微调阶段使用的训练目标(损失函数)。

当前我们正处于第二次巨变中,「预训练、微调」过程被称为「预训练、prompt 和预测」的过程所取代。在这种范式中,不是通过目标工程使预训练的语言模型(LM)适应下游任务,而是重新形式化(Reformulate)下游任务,使其看起来更像是在文本 prompt 的帮助下在原始 LM 训练期间解决的任务。通过这种方式,选择适当的 prompt,该方法可以操纵模型的行为,以便预训练的 LM 本身可以用于预测所需的输出,有时甚至无需任何额外的特定任务训练。这种方法的优点是给定一组合适的 prompt,以完全无监督的方式训练的单个 LM 就能够用于解决大量任务。然而该方法也存在一个问题——这种方法引入了 prompt 挖掘工程的必要性,即需要找出最合适的 prompt 来让 LM 解决面临的任务。

该综述研究试图通过提供 prompting 方法的概述和形式化定义,以及使用这些 prompt 的预训练语言模型的概述,来梳理这一迅速发展领域的当前知识状态。然后该论文对 prompt 方法进行了深入的讨论,包括 prompt 工程、answer 工程等基础和多 prompt 学习方法、prompt 相关的训练方法等更高级的概念。

然后,该研究列出了已有的基于 prompt 学习方法的多种应用,并探讨了不同应用场景中如何选择合适的训练方法。最后,该研究尝试在研究生态系统中定位 prompt 方法的当前状态,并与其他研究领域建立联系。此外,该研究提出一些可能适合进一步研究的挑战性问题,并针对当前研究趋势进行了分析。

02

prompting 的正确描述

在传统的用于 NLP 任务的监督学习系统中,输入 x 通常是文本数据,并基于模型 P(y|x; θ) 预测输出 y。但是,监督学习面临的一个主要问题是,即为了训练模型 P(y|x; θ),必须要有用于训练任务的监督数据,但找到这种适用数据是比较困难的。

在 NLP 中,基于 Prompt 的学习方法试图通过学习 LM 来规避这一问题,该 LM 对文本 x 本身的概率 P(x; θ) 进行建模并使用该概率来预测 y,从而减少或消除了训练模型对大型监督数据集的需求。

本节中研究者对最基本的 Prompt 形式进行了数学描述,其中包含许多有关 Prompt 的工作,并且可以扩展到其他内容。具体来说,基础 Prompt 分三步预测得分最高的 ^y,即 prompt 添加、answer 搜索和 answer 映射。

Prompt 的形式

Prompt 主要有两种主要类型:

填充文本字符串空白的完形填空(Cloze)prompt,和

用于延续字符串前缀的前缀 (Prefix) prompt。

选择哪一个取决于任务和用于解决任务的模型。一般来说,对于有关生成的任务或使用标准自回归 LM 解决的任务,前缀 prompt 往往更有帮助,因为它们与模型从左到右的性质刚好吻合。对于使用掩码 (Mask) LM 解决的任务(比如,BERT),完形填空 prompt 则非常合适,因为它们与预训练任务的形式非常匹配。全文本重建模型则可以与完形填空 prompt 或前缀 prompt 一起使用。最后,对于一些涉及多个输入的任务,例如文本对分类,prompt 模板必须包含至少两个输入的空间。

NLP Prompt范式,两种主要类型:填充文本字符串空白的完形填空(Cloze)prompt,和用于延续字符串前缀的前缀 (Prefix) prompt。相关推荐

  1. 分类与数值预测是预测问题的两种主要类型

    分类与数值预测是预测问题的两种主要类型

  2. 安装linux必不可少的一个分区,安装linux系统对硬盘分区时,必须有的两种分区类型是什么?...

    安装Linux系统对硬盘分区时,必须有两种分区类型: 根分区和交换分区. 根分区就是root分区,所有的东西都在这个分区内. /swap分区是交换分区,是一定磁盘空间(分区或文件),用于将部分内存中的 ...

  3. Java中的两种异常类型及其区别?

    Java中的两种异常类型及其区别? 参考文章: (1)Java中的两种异常类型及其区别? (2)https://www.cnblogs.com/zxfei/p/11182730.html (3)htt ...

  4. <随笔03>Java中的两种异常类型

    <随笔03>Java中的两种异常类型 参考文章: (1)<随笔03>Java中的两种异常类型 (2)https://www.cnblogs.com/newlyfly/p/744 ...

  5. CNAS认证和CMA认证是国内两种不同类型的权威认证

    CNAS认证和CMA认证是国内两种不同类型的权威认证,因此,若开具具有公信力的检测报告,需要过CNAS和CMA两种认证. 1.CNAS认证:dao为中国合格评定国家认可委员会的认证英文缩写,是在原中国 ...

  6. 仿钉钉考勤统计页面的日历组件,通过日历展示每日考勤打卡情况,支持在日历上打两种不同类型的点,大致适配各种分辨率效果图

    原文链接:uniapp : 仿钉钉考勤统计页面的日历组件,通过日历展示每日考勤打卡情况,支持在日历上打两种不同类型的点,大致适配各种分辨率 - northwest - 博客园 (cnblogs.com ...

  7. scala的两种变量类型 var 和 val

    scala的两种变量类型 var 和 valscala的两种变量类型 var 和 val 在Java中,您可以这样声明新变量: String s = "hello"; int i ...

  8. java中两种异常类型_Java中的三种异常类型

    java中两种异常类型 Errors are the bane of users and programmers alike. Developers obviously don't want thei ...

  9. Linux安装时分区跳过硬盘锁,安装Linux系统对硬盘分区时,必须有两种分区类型: 和 。...

    安装Linux系统对硬盘分区时,必须有两种分区类型: 和 . 更多相关问题 [单选] 轴瓦穴蚀破坏主要发生在()薄壁瓦上. [单选] 精密偶件端面的机械密封不良的主要原因是(). [单选] 采用塞尺测 ...

  10. 基本磁盘和动态磁盘是硬盘的两种配置类型,Win10可识别动态磁盘

    今天小编将为小伙伴们分享Windows 10操作系统磁盘类型与文件系统. 理解磁盘类型和分区形式.分区和卷 基本磁盘和动态磁盘是硬盘在Windows操作系统中的两种配置类型.所有版本的Windows操 ...

最新文章

  1. 李彦宏为什么被称为AI先生,美国权威媒体给出答案
  2. IT人不要一辈子做技术
  3. python中fit什么意思_使用Logit()和fit()在python中进行逻辑回归
  4. 关于使用jQuery时$(document).ready()方法失效问题
  5. python读取sqlserver数据库方法_SQLServer数据库之Python读取配置文件,并连接数据库SQL Server...
  6. 家用、商用、工业交换机的用途与区别
  7. 【项目管理】人力资源计划和组建项目团队
  8. cts(7)---android 8.1 vts环境和测试
  9. toad如何查看表字段备注(表字段的说明)
  10. 09.VMWare虚拟机copy后网卡不是eth0解决办法
  11. Oracle【IT实验室】数据库备份与恢复之三:OS备份/用户管理的备份与恢复
  12. Ubuntu 下为 Idea 创建启动图标.
  13. 清除office激活秘钥方法
  14. 银河麒麟设置静态IP
  15. 【华人学者风采】Ting Xu 加州大学伯克利分校
  16. has leaked window com.android.internal.policy.impl.PhoneWindow解决(Dialog.cancel、dismiss、hide区别)
  17. Mybatis批量插入数据到Oracel
  18. android十大开源项目
  19. matlab棋盘格标定角点,相机标定(Camera calibration)Matlab——棋盘格标定原理,流程...
  20. 全面的网络诊断-Omnipeek

热门文章

  1. 中配置kylin_Kylin集群模式部署(使用同一HBase存储)
  2. 转:js中arguments详解
  3. 台湾“比基尼登山客”遗体运出 山友接其“回家”
  4. 配置防盗链 访问控制Directory 访问控制FilesMatch
  5. iOS9自动布局神器StackView
  6. 英语字帖电子版可打印_一年级英语字母专项练习:含26个英文字母书写教学 可下载电子版...
  7. 7月6号奥特曼服务器维护中,泰迦奥特曼:7月6号开播,泰迦是泰罗儿子,优幸可变为三个奥特曼...
  8. Train Problem I(STL)基本运用stack
  9. python的整数类型_Python 标准数据类型:Bytes
  10. 安卓桌面软件哪个好_有哪些好用的手机记事本软件?安卓手机便签哪个好用?