1.本文贡献

(1)提出prompt tuning,并在大型语言模型领域展示其与model tuning(fine tuning)的竞争力;

(2)减少了许多设计选择,显示质量和鲁棒性随着规模的增加而提高。

(3)在域转移问题上,显示prompt tuning优于model tuning。

(4)提出“prompt ensembling”,并展示其有效性。

2.Prompt tuning

在GPT-3中,提示标记P={p1,p2,…,pn}的表示是模型embedding table的一部分,由冻结θ参数化(模型嵌入表原来不适合于GPT3,后经过预训练后,词语的嵌入表示适合与GPT3,也就相当于被模型的参数参数化了,而提示又是离散的,且是嵌入表中的词,所以说是被模型的参数参数化了)。与GPT-3相比,Prompt tuning有其自己的参数,而不是像GPT-3那样参数被模型的参数Θ参数化。

prompt design涉及从一个固定的冻结的嵌入的词表中寻找prompt token,而prompt tuning被认为使用一个固定的特殊token的提示,这些提示的token可以被更新。所以新形式的条件生成就变为

The Power of Scale for Parameter-Efficient Prompt Tuning及prefix tuning与prompt tuning的区别相关推荐

  1. Data efficient parameter efficient tuning 助教 姜成翰

    2022 - 如何有效的使用自督导式模型 - Data-Efficient & Parameter-Efficient Tuning_哔哩哔哩_bilibili Recent advances ...

  2. prompt综述论文阅读:Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural La

    prompt综述论文阅读:Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Lan ...

  3. Zero-shot Cross-lingual Transfer of Prompt-based Tuning with a Unified Multilingual Prompt

    虽然现有的大部分工作都集中在单语prompt上,但研究了多语言PLM的多语言prompt,尤其是在zero-shot setting下.为了减轻为多种语言设计不同prompt的工作量,我们提出了一种新 ...

  4. python中prompt的意思_python中的prompt是什么意思,怎么用

    查看: 5468|回复: 9 [已解决]python中的prompt是什么意思,怎么用 当前离线UID日志 相册 贡献 荣誉 积分 电梯直达 发表于 2019-5-26 22:08:12 | 只看该作 ...

  5. Prompt 工程师是什么? 为什么要学习Prompt?

    Prompt 工程师是什么? 是识别人工智能的错误和隐藏功能,以便开发者可以对这些发现进行处理. 如果你正在寻找科技领域最热门的工作,你可以尝试了解如何与AI聊天机器人交流,这可能会让你得到一份生成式 ...

  6. 【NLP】五万字综述!Prompt Tuning:深度解读一种新的微调范式

    作者 | 王嘉宁 整理 | NewBeeNLP https://wjn1996.blog.csdn.net/article/details/120607050 这绝对是我看过最全面细致的Prompt ...

  7. LLMs:《Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca》翻译与解读

    LLMs:<Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca>翻译与解读 目录 相关文章 LLMs:&l ...

  8. 一文跟进Prompt进展!综述+15篇最新论文逐一梳理

    文 | ZenMoore 编 | 小轶 自从 Dr.Pengfei Liu 的那篇 prompt 综述发表开始,prompt 逐渐红得发紫.近期清华.谷歌等单位你方唱罢我登场,涌现了好多好多 prom ...

  9. LLMs之Guanaco:《QLoRA:Efficient Finetuning of Quantized LLMs》翻译与解读

    LLMs之Guanaco:<QLoRA:Efficient Finetuning of Quantized LLMs>翻译与解读 导读:本文介绍了QLORA,一种高效的微调方法.利用QLo ...

最新文章

  1. DebugHook 与 ReportMemoryLeaksOnShutdown
  2. [软件工程基础]结对项目 数独程序扩展
  3. All Roads Lead to Rome (30)
  4. 为什么Java会给system报错_java – 为什么将System.nanoTime()转换为Calendar对象会给我错误的当前日期?...
  5. python Flask 使用https 安全协议
  6. mysql加服务器命令_mysql服务器常用命令
  7. [导入]哪种图像格式最好?
  8. 关于一个类中方法的调用
  9. cam350怎么看顶层_CAM350软件怎么查看gerber文件 cam350导出gerber教程
  10. Windows系统重装教程完整版(系统备份、系统还原与重装)
  11. python-将图片存储到pdf中
  12. 视觉跟踪近年来的进展(2010年以前)——Advances in Visual Tracking
  13. less文件中导入另一个less文件
  14. DNS资源纪录(Resource Record)介绍
  15. oa项目经验描述_简历中项目经验模版
  16. 如何使用在线客服转接功能
  17. 正负数排列(用链表和数组实现)
  18. arnold如何设置鱼眼相机_Arnold(C4DToA)阿诺德渲染教程(51) – 常规摄像机 persp_camera 官方文档...
  19. RFNet:基于RGB-D数据的语义分割和意外障碍物检测的实时融合网络
  20. DataBinding源码分析

热门文章

  1. 基于富芮坤fr8016 蓝牙5.0 芯片设计的BLE HID Joystick 游戏摇杆设备
  2. 十大python培训机构
  3. Docker 入门教程-----supervisor(进程管家)配置与Docker使用
  4. 《王阳明心学营销》营销落地-知行合一
  5. 中年刘强东背后,是已婚男性的集体挣扎
  6. 针对于“上传文件”和“触发方式” 的解决方案(Antd个例)
  7. QGis 使用高德 画KML
  8. DSO Framer ActiveX 控件
  9. Ubuntu-20.04永久修改DNS服务器
  10. 多路复用,讲的很明白