读论文的过程中看到soft prompt的概念,不是很能理解,后来复习了一下prompt综述,原来在那篇论文中讲得很清楚,在这篇博客中做一下整理。
参考:https://arxiv.org/pdf/2107.13586.pdf

总结:

  • hard prompt 又称为 Discrete Prompt
  • soft prompt 又称为 Continuous Prompts

模板的制作分为手工创建模板和自动化生成模板,而自动化生成模板又分为离散提示(又叫做硬提示)和连续提示(又叫做软提示)

Discrete Prompt / Hard Prompt

离散prompt中,prompt是一个实际的文本字符串。下面简单介绍自动化生成离散prompt的集中方法。

1. Prompt Mining

该方法需要一个包含输入字符串x和输出字符串y的大型文本语料库(例如维基百科),并找到中间词或输入输出之间的依赖路径。高频中间词或者依赖路径将作为模板,如:“[X] middle words [Z]”

2. Prompt Paraphrasing

基于释义的方法采用现有的种子提示(例如手工构建或挖掘),并将其解释为一组其他候选提示,然后选择在目标任务中达到最高训练精度的提示。

这个解释可以以多种方式进行,包括将模板进行双向翻译(先翻译成另外一种自然语言然后再翻译回来),或使用替代的同义,或者使用专门优化的a neural prompt rewriter,以提高使用prompt的系统的准确性。

3. Gradient-based Search

这个方法在实际token上应用了基于梯度的搜索,以找到能够触发底层预训练LM生成所需目标预测的短序列。这种搜索是以迭代的方式完成的,在prompt中逐行执行标记。

4. Prompt Generation

这种方法将提示的生成视为文本生成任务,并使用标准的自然语言生成模型来执行该任务。例如,将seq2seq预训练的模型T5引入到模板搜索过程中。

由于T5已经进行了预训练,所以可以使用T5来生成prompt token,方法是(1)指定在templat中插入模板标记的位置 (2)提供训练样本供T5解码template tokens。

5. Prompt Scoring

首先手工制作一组模板作为潜在的候选者,然后填充input和answer slot以形成一个填充的提示。然后,他们使用单向LM来给那些填满的提示打分,选择LM概率最高的提示。这将为每个单独的输入生成自定义模板。

Continuous Prompts / Soft Prompt

连续prompt中,prompt直接在底层语言模型的嵌入空间中进行描述.

由于prompt构造的目的是找到一种方法,使LM能够有效地执行任务,而不是供人类使用,因此没有必要将prompt限制为人类可解释的自然语言。因此,还有一些方法叫连续prompt(也称为软提示),这些提示可以直接在模型的嵌入空间中执行提示。具体来说,连续提示消除了两个约束:

  1. 模板词不再是自然语言。
  2. 消除了模板是由预训练LM的参数化的限制。相反,prompt有自己的参数,这些参数可以根据下游任务的训练数据进行调优。

下面介绍几种具有代表性的方法:

1. Prefix Tuning

Prefix Tuning 将一系列连续的特定于任务的向量前置到输入,同时保持LM参数不变。

2. Tuning Initialized with Discrete Prompts

使用离散方法创建的prompt初始化连续prompt的搜索。先使用离散搜索方法定义模板,根据发现的prompt初始化virtual token,然后对嵌入进行微调,以提高任务的准确性.

3. Hard-Soft Prompt Hybrid Tuning

软硬prompt混合调优:这些方法没有使用纯可学习的提示模板,而是将一些可调的嵌入插入到硬提示模板中。如:“P-tuning”,通过在嵌入式输入中插入可训练变量来学习连续的提示。

【prompt】什么是 Soft Prompt 和 Hard Prompt ?相关推荐

  1. 飞浆AI studio人工智能课程学习(2)-Prompt优化思路|十个技巧高效优化Prompt|迭代法|Trick法|通用法|工具辅助

    文章目录 优化思路 上节课的例子 问题分析 思路解析 Prompt优化技巧 Prompt优化原理 十个技巧高效优化Prompt 迭代法 Trick法 工具法 通用技巧│定基础 通用技巧│做强调 需求强 ...

  2. Prompt learning 教学[进阶篇]:简介Prompt框架并给出自然语言处理技术:Few-Shot Prompting、Self-Consistency等;项目实战搭建知识库内容机器人

    Prompt learning 教学[进阶篇]:简介Prompt框架并给出自然语言处理技术:Few-Shot Prompting.Self-Consistency等:项目实战搭建知识库内容机器人 1. ...

  3. 万能Prompt句式拆解,人人都是Prompt 工程师

    正文共 1318字,阅读大约需要 5 分钟 内容特辑,介绍单一技能的同时今天我们添加一个Prompt造句模板,学会这个,你会成为一个优秀的Prompt Engineer ~ 快去学习.收藏.下载资料包 ...

  4. 论文笔记 | 谷歌 Soft Prompt Learning ,Prefix-Tuning的 -> soft promt -> p tuning v2

    论文笔记 | 谷歌 Soft Prompt Learning ptuning -> Prefix-Tuning -> soft promt -> p tuning v2 " ...

  5. 直播活动丨BMMeetup第1期:大模型Prompt Tuning技术,8场学术报告和Poster提前下载...

    「Big Model Meetup」系列活动是由智源研究院悟道团队.青源会.清华大学计算机科学与技术系博硕论坛.中国中文信息学会青年工作委员会共同组织,智源社区提供社区支持,PaperWeekly提供 ...

  6. 线下活动丨Big Model Meetup 第1期:大模型Prompt Tuning技术,8场学术报告和Poster展示...

    「Big Model Meetup」系列活动是由智源研究院悟道团队.青源会.清华大学计算机科学与技术系博硕论坛.中国中文信息学会青年工作委员会共同组织,智源社区提供社区支持,PaperWeekly提供 ...

  7. prompt你到底行不行?

    文 | 马杀鸡三明治 源 | 知乎 很久之前老板下任务要试试prompt这个大风,但是玩完后发现太菜了所以连文章都没写,刚好今天工作比较闲就来写写了. 先上结论,连续prompt为运用大模型提供了一种 ...

  8. prompt 你到底行不行?

    文 | 马杀鸡三明治 源 | 知乎 很久之前老板下任务要试试prompt这个大风,但是玩完后发现太菜了所以连文章都没写,刚好今天工作比较闲就来写写了. 先上结论,连续prompt为运用大模型提供了一种 ...

  9. 预训练新范式!为什么Prompt会更有效?

    作者 | 上杉翔二 悠闲会 · 信息检索 整理 | NewBeeNLP 「Prompt Tuning也许会是深度学习时代的Feature Engineering问题,如何给各大任务设计合理的Promp ...

最新文章

  1. Vue中使用uuidv1根据时间戳和MAC地址生成唯一标识
  2. 腾讯的一笔画游戏--巧妙解法
  3. 防止文件重复定义之方法
  4. 51单片机c语言测距,超声波HM55B测距(STC10F08单片机C程序)
  5. SIP协议栈读书笔记1
  6. 拿来即用的 Python LDAP 实现类
  7. 电商产品经理:如何搭建会员管理体系(多图干货)
  8. 什么是边界扫描(boundary scan)?
  9. 牛客 送分啦-QAQ
  10. 使用原版镜像安装windows时install.wim文件过大的解决方案
  11. ios开发中如何调用苹果自带地图导航
  12. android手机最低内存,安卓想用很久不卡顿?12GB内存是最低标准,这6款硬核配置还便宜...
  13. android8.1新建分区并挂载,Android8.1 MTK Vendor分区大小调整无效分析
  14. 快手引流卖什么暴利?很多人现在都觉得在各大平台引流很难
  15. 64位WIN7下虚拟机安装winxp
  16. 北京地铁预约进站-自动预约
  17. 2021届校招阿里一面面经
  18. windows server 2012 活动目录部署
  19. POSIX互斥锁自旋锁
  20. 【php基础入门】运算符、流程控制语句及单双引号区别和模块化编程的使用详解

热门文章

  1. 经验积淀大级沟通修行
  2. 计算x的n次方的方法
  3. python函数实验心得_python学习心得
  4. 现在还有哪些好的站长论坛?
  5. IPSec配置与实验
  6. Postgresql模式匹配
  7. 计算机网络检测和评估标准,网络安全检测与评估技术
  8. javascript用while循环计算年利率5%,从1000元到5000元需要几年
  9. 微软考试号码与名称对照表
  10. 前滴滴出行产品经理刘飞:写给产品经理的说明书(中)