【prompt】什么是 Soft Prompt 和 Hard Prompt ?
读论文的过程中看到soft prompt的概念,不是很能理解,后来复习了一下prompt综述,原来在那篇论文中讲得很清楚,在这篇博客中做一下整理。
参考:https://arxiv.org/pdf/2107.13586.pdf
总结:
- hard prompt 又称为 Discrete Prompt
- soft prompt 又称为 Continuous Prompts
模板的制作分为手工创建模板和自动化生成模板,而自动化生成模板又分为离散提示(又叫做硬提示)和连续提示(又叫做软提示)
Discrete Prompt / Hard Prompt
离散prompt中,prompt是一个实际的文本字符串。下面简单介绍自动化生成离散prompt的集中方法。
1. Prompt Mining
该方法需要一个包含输入字符串x和输出字符串y的大型文本语料库(例如维基百科),并找到中间词或输入输出之间的依赖路径。高频中间词或者依赖路径将作为模板,如:“[X] middle words [Z]”
2. Prompt Paraphrasing
基于释义的方法采用现有的种子提示(例如手工构建或挖掘),并将其解释为一组其他候选提示,然后选择在目标任务中达到最高训练精度的提示。
这个解释可以以多种方式进行,包括将模板进行双向翻译(先翻译成另外一种自然语言然后再翻译回来),或使用替代的同义,或者使用专门优化的a neural prompt rewriter,以提高使用prompt的系统的准确性。
3. Gradient-based Search
这个方法在实际token上应用了基于梯度的搜索,以找到能够触发底层预训练LM生成所需目标预测的短序列。这种搜索是以迭代的方式完成的,在prompt中逐行执行标记。
4. Prompt Generation
这种方法将提示的生成视为文本生成任务,并使用标准的自然语言生成模型来执行该任务。例如,将seq2seq预训练的模型T5引入到模板搜索过程中。
由于T5已经进行了预训练,所以可以使用T5来生成prompt token,方法是(1)指定在templat中插入模板标记的位置 (2)提供训练样本供T5解码template tokens。
5. Prompt Scoring
首先手工制作一组模板作为潜在的候选者,然后填充input和answer slot以形成一个填充的提示。然后,他们使用单向LM来给那些填满的提示打分,选择LM概率最高的提示。这将为每个单独的输入生成自定义模板。
Continuous Prompts / Soft Prompt
连续prompt中,prompt直接在底层语言模型的嵌入空间中进行描述.
由于prompt构造的目的是找到一种方法,使LM能够有效地执行任务,而不是供人类使用,因此没有必要将prompt限制为人类可解释的自然语言。因此,还有一些方法叫连续prompt(也称为软提示),这些提示可以直接在模型的嵌入空间中执行提示。具体来说,连续提示消除了两个约束:
- 模板词不再是自然语言。
- 消除了模板是由预训练LM的参数化的限制。相反,prompt有自己的参数,这些参数可以根据下游任务的训练数据进行调优。
下面介绍几种具有代表性的方法:
1. Prefix Tuning
Prefix Tuning 将一系列连续的特定于任务的向量前置到输入,同时保持LM参数不变。
2. Tuning Initialized with Discrete Prompts
使用离散方法创建的prompt初始化连续prompt的搜索。先使用离散搜索方法定义模板,根据发现的prompt初始化virtual token,然后对嵌入进行微调,以提高任务的准确性.
3. Hard-Soft Prompt Hybrid Tuning
软硬prompt混合调优:这些方法没有使用纯可学习的提示模板,而是将一些可调的嵌入插入到硬提示模板中。如:“P-tuning”,通过在嵌入式输入中插入可训练变量来学习连续的提示。
【prompt】什么是 Soft Prompt 和 Hard Prompt ?相关推荐
- 飞浆AI studio人工智能课程学习(2)-Prompt优化思路|十个技巧高效优化Prompt|迭代法|Trick法|通用法|工具辅助
文章目录 优化思路 上节课的例子 问题分析 思路解析 Prompt优化技巧 Prompt优化原理 十个技巧高效优化Prompt 迭代法 Trick法 工具法 通用技巧│定基础 通用技巧│做强调 需求强 ...
- Prompt learning 教学[进阶篇]:简介Prompt框架并给出自然语言处理技术:Few-Shot Prompting、Self-Consistency等;项目实战搭建知识库内容机器人
Prompt learning 教学[进阶篇]:简介Prompt框架并给出自然语言处理技术:Few-Shot Prompting.Self-Consistency等:项目实战搭建知识库内容机器人 1. ...
- 万能Prompt句式拆解,人人都是Prompt 工程师
正文共 1318字,阅读大约需要 5 分钟 内容特辑,介绍单一技能的同时今天我们添加一个Prompt造句模板,学会这个,你会成为一个优秀的Prompt Engineer ~ 快去学习.收藏.下载资料包 ...
- 论文笔记 | 谷歌 Soft Prompt Learning ,Prefix-Tuning的 -> soft promt -> p tuning v2
论文笔记 | 谷歌 Soft Prompt Learning ptuning -> Prefix-Tuning -> soft promt -> p tuning v2 " ...
- 直播活动丨BMMeetup第1期:大模型Prompt Tuning技术,8场学术报告和Poster提前下载...
「Big Model Meetup」系列活动是由智源研究院悟道团队.青源会.清华大学计算机科学与技术系博硕论坛.中国中文信息学会青年工作委员会共同组织,智源社区提供社区支持,PaperWeekly提供 ...
- 线下活动丨Big Model Meetup 第1期:大模型Prompt Tuning技术,8场学术报告和Poster展示...
「Big Model Meetup」系列活动是由智源研究院悟道团队.青源会.清华大学计算机科学与技术系博硕论坛.中国中文信息学会青年工作委员会共同组织,智源社区提供社区支持,PaperWeekly提供 ...
- prompt你到底行不行?
文 | 马杀鸡三明治 源 | 知乎 很久之前老板下任务要试试prompt这个大风,但是玩完后发现太菜了所以连文章都没写,刚好今天工作比较闲就来写写了. 先上结论,连续prompt为运用大模型提供了一种 ...
- prompt 你到底行不行?
文 | 马杀鸡三明治 源 | 知乎 很久之前老板下任务要试试prompt这个大风,但是玩完后发现太菜了所以连文章都没写,刚好今天工作比较闲就来写写了. 先上结论,连续prompt为运用大模型提供了一种 ...
- 预训练新范式!为什么Prompt会更有效?
作者 | 上杉翔二 悠闲会 · 信息检索 整理 | NewBeeNLP 「Prompt Tuning也许会是深度学习时代的Feature Engineering问题,如何给各大任务设计合理的Promp ...
最新文章
- Vue中使用uuidv1根据时间戳和MAC地址生成唯一标识
- 腾讯的一笔画游戏--巧妙解法
- 防止文件重复定义之方法
- 51单片机c语言测距,超声波HM55B测距(STC10F08单片机C程序)
- SIP协议栈读书笔记1
- 拿来即用的 Python LDAP 实现类
- 电商产品经理:如何搭建会员管理体系(多图干货)
- 什么是边界扫描(boundary scan)?
- 牛客 送分啦-QAQ
- 使用原版镜像安装windows时install.wim文件过大的解决方案
- ios开发中如何调用苹果自带地图导航
- android手机最低内存,安卓想用很久不卡顿?12GB内存是最低标准,这6款硬核配置还便宜...
- android8.1新建分区并挂载,Android8.1 MTK Vendor分区大小调整无效分析
- 快手引流卖什么暴利?很多人现在都觉得在各大平台引流很难
- 64位WIN7下虚拟机安装winxp
- 北京地铁预约进站-自动预约
- 2021届校招阿里一面面经
- windows server 2012 活动目录部署
- POSIX互斥锁自旋锁
- 【php基础入门】运算符、流程控制语句及单双引号区别和模块化编程的使用详解