读论文的过程中看到soft prompt的概念，不是很能理解，后来复习了一下prompt综述，原来在那篇论文中讲得很清楚，在这篇博客中做一下整理。
参考：https://arxiv.org/pdf/2107.13586.pdf

总结：

hard prompt 又称为 Discrete Prompt
soft prompt 又称为 Continuous Prompts

模板的制作分为手工创建模板和自动化生成模板，而自动化生成模板又分为离散提示（又叫做硬提示）和连续提示（又叫做软提示）

Discrete Prompt / Hard Prompt

离散prompt中，prompt是一个实际的文本字符串。下面简单介绍自动化生成离散prompt的集中方法。

1. Prompt Mining

该方法需要一个包含输入字符串x和输出字符串y的大型文本语料库(例如维基百科)，并找到中间词或输入输出之间的依赖路径。高频中间词或者依赖路径将作为模板，如：“[X] middle words [Z]”

2. Prompt Paraphrasing

基于释义的方法采用现有的种子提示(例如手工构建或挖掘)，并将其解释为一组其他候选提示，然后选择在目标任务中达到最高训练精度的提示。

这个解释可以以多种方式进行，包括将模板进行双向翻译（先翻译成另外一种自然语言然后再翻译回来），或使用替代的同义，或者使用专门优化的a neural prompt rewriter，以提高使用prompt的系统的准确性。

3. Gradient-based Search

这个方法在实际token上应用了基于梯度的搜索，以找到能够触发底层预训练LM生成所需目标预测的短序列。这种搜索是以迭代的方式完成的，在prompt中逐行执行标记。

4. Prompt Generation

这种方法将提示的生成视为文本生成任务，并使用标准的自然语言生成模型来执行该任务。例如，将seq2seq预训练的模型T5引入到模板搜索过程中。

由于T5已经进行了预训练，所以可以使用T5来生成prompt token，方法是(1)指定在templat中插入模板标记的位置 (2)提供训练样本供T5解码template tokens。

5. Prompt Scoring

首先手工制作一组模板作为潜在的候选者，然后填充input和answer slot以形成一个填充的提示。然后，他们使用单向LM来给那些填满的提示打分，选择LM概率最高的提示。这将为每个单独的输入生成自定义模板。

Continuous Prompts / Soft Prompt

连续prompt中，prompt直接在底层语言模型的嵌入空间中进行描述.

由于prompt构造的目的是找到一种方法，使LM能够有效地执行任务，而不是供人类使用，因此没有必要将prompt限制为人类可解释的自然语言。因此，还有一些方法叫连续prompt(也称为软提示)，这些提示可以直接在模型的嵌入空间中执行提示。具体来说，连续提示消除了两个约束:

模板词不再是自然语言。
消除了模板是由预训练LM的参数化的限制。相反，prompt有自己的参数，这些参数可以根据下游任务的训练数据进行调优。

下面介绍几种具有代表性的方法：

1. Prefix Tuning

Prefix Tuning 将一系列连续的特定于任务的向量前置到输入，同时保持LM参数不变。

2. Tuning Initialized with Discrete Prompts

使用离散方法创建的prompt初始化连续prompt的搜索。先使用离散搜索方法定义模板，根据发现的prompt初始化virtual token，然后对嵌入进行微调，以提高任务的准确性.

3. Hard-Soft Prompt Hybrid Tuning

软硬prompt混合调优：这些方法没有使用纯可学习的提示模板，而是将一些可调的嵌入插入到硬提示模板中。如：“P-tuning”，通过在嵌入式输入中插入可训练变量来学习连续的提示。

【prompt】什么是 Soft Prompt 和 Hard Prompt ?相关推荐

飞浆AI studio人工智能课程学习（2）-Prompt优化思路|十个技巧高效优化Prompt|迭代法|Trick法|通用法|工具辅助
文章目录优化思路上节课的例子问题分析思路解析 Prompt优化技巧 Prompt优化原理十个技巧高效优化Prompt 迭代法 Trick法工具法通用技巧│定基础通用技巧│做强调需求强 ...
Prompt learning 教学[进阶篇]：简介Prompt框架并给出自然语言处理技术：Few-Shot Prompting、Self-Consistency等；项目实战搭建知识库内容机器人
Prompt learning 教学[进阶篇]:简介Prompt框架并给出自然语言处理技术:Few-Shot Prompting.Self-Consistency等:项目实战搭建知识库内容机器人 1. ...
万能Prompt句式拆解，人人都是Prompt 工程师
正文共 1318字,阅读大约需要 5 分钟内容特辑,介绍单一技能的同时今天我们添加一个Prompt造句模板,学会这个,你会成为一个优秀的Prompt Engineer ~ 快去学习.收藏.下载资料包 ...
论文笔记 | 谷歌 Soft Prompt Learning ，Prefix-Tuning的 -＞ soft promt -＞ p tuning v2
论文笔记 | 谷歌 Soft Prompt Learning ptuning -> Prefix-Tuning -> soft promt -> p tuning v2 " ...
直播活动丨BMMeetup第1期：大模型Prompt Tuning技术，8场学术报告和Poster提前下载...
「Big Model Meetup」系列活动是由智源研究院悟道团队.青源会.清华大学计算机科学与技术系博硕论坛.中国中文信息学会青年工作委员会共同组织,智源社区提供社区支持,PaperWeekly提供 ...
线下活动丨Big Model Meetup 第1期：大模型Prompt Tuning技术，8场学术报告和Poster展示...
「Big Model Meetup」系列活动是由智源研究院悟道团队.青源会.清华大学计算机科学与技术系博硕论坛.中国中文信息学会青年工作委员会共同组织,智源社区提供社区支持,PaperWeekly提供 ...
prompt你到底行不行？
文 | 马杀鸡三明治源 | 知乎很久之前老板下任务要试试prompt这个大风,但是玩完后发现太菜了所以连文章都没写,刚好今天工作比较闲就来写写了. 先上结论,连续prompt为运用大模型提供了一种 ...
prompt 你到底行不行？
文 | 马杀鸡三明治源 | 知乎很久之前老板下任务要试试prompt这个大风,但是玩完后发现太菜了所以连文章都没写,刚好今天工作比较闲就来写写了. 先上结论,连续prompt为运用大模型提供了一种 ...
预训练新范式！为什么Prompt会更有效？
作者 | 上杉翔二悠闲会 · 信息检索整理 | NewBeeNLP 「Prompt Tuning也许会是深度学习时代的Feature Engineering问题,如何给各大任务设计合理的Promp ...

【prompt】什么是 Soft Prompt 和 Hard Prompt ?