笔记整理:田玺,浙江大学硕士研究生。研究方向:知识图谱、自然语言处理

论文地址:https://openreview.net/forum?id=DhzIU48OcZh,录用于ICLR2022

摘要

之前的工作发现,从大型语言模型(LLMs)中提取事实信息的质量取决于用于查询的Prompt,但用不同的Prompt来查询相同的信息应该得到相同的答案。本文作者通过引入P-Adapters来解决这一问题:一个位于LLMs的embedding层和第一个attention层之间的轻量级模型。此外,作者还研究了混合专家(MoE)模型,在从BERT和RoBERTa中提取事实信息方面,P-Adapters的表现与更复杂的MoE模型相当,同时不需要额外注释。最后,作者研究发现是获得原始自然语言Prompt的LLM embedding,特别是实体对的主语是使P-Adapters成功的重要因素。

论文动机

为了使LLMs成为有效的知识库,它们必须对用户可能提供的不同查询具有鲁棒性。然而先前的工作表明LLMs并不鲁棒:语义等同的查询可能导致不一致的预测。之前的许多工作试图为一个给定的关系找到最佳的一个或一组prompt来让模型更好地提取事实信息,而本文中,作者提出P-Adapters的模型来帮助LLMs克服这种变化性,通过将自然语言prompt改变为连续的表征,使LLMs能够准确预测事实信息。它们是端到端的优化,在训练时只需要(prompt,宾语)对,并通过学习将不同的训练prompt映射到相同的宾语,从而隐性地鼓励一致性。

图1  P-Adapters的框架

作者还研究了其他可以提高自然语言prompt一致性的模型:专家混合(MoE)模型。并在四种情况中对模型进行了评估:

1.ID模板和宾语:模板和宾语来自同一个分布。

2.OOD Prompt:不同的自然语言prompt集

3.OOD Objects:不同的实体分布。

4.OOD Keyboard Errors:有拼写错误的自然语言prompt。

最后,作者深入研究了什么使P-Adapter有效,发现保持一些原始的自然语言prompt 的embedding,特别是主语的embedding很重要。

模型

P-Adapter模型训练函数  使  达到最大,LLMs的预测为

有许多不同的可能参数设定,文章中描述了三个(见图2(a))。

Rewrite P-Adapter:原始的embedding经过一个双向的LSTM和一个MLP后全部被改写,成为完全不同的embedding。

Prefix P-Adapter:原始的embedding经过Bi-LSTM、max-pool和MLP后作为原始的embedding的前缀。

P-Tuning P-Adapter:基于P-Tuning的方法,只有主语和[MASK] token的embedding保持不变,但是此方法中需要知道主语的身份。

MoE模型:由一个预测自然语言prompt实体之间关系的分类器和一个用于将预测的关系映射到典型的连续prompt的查找表组成(见图2(b))。

Oracle方法:与MoE方法类似,只是不是使用分类器来预测关系,而是在推理时使用gold关系(见图2(b))。

Baseline:将自然语言prompt作为输入,没有任何前缀或优化。

图2  P-Adapter、MoE和Oracle模型

实验

数据集:实体对方面,作者使用了LAMA进行评估,使用Shin等人[1]为每个关系收集的独立的实体对集进行训练和验证,对于OOD Objects的情况,使用了Cao等人[2]的uniform-wikidata数据集中的实体对;模板方面,作者使用了LAMA、LPAQA和ParaRel数据集,并使用Lee等人[3]的BERT词汇替换系统为每个模板生成五个改述来补充ParaRel模板,将这些模板分成两个同等大小的组,一个用于训练,一个用于OOD Prompt评估,OOD Keyboard Errors的情况,作者使用了训练的模板,然后使用nlpaug包在每个模板中引入至少一个拼写错误。

评价指标为P@1和一致性,一致性定义为

其中,

表1中为BERT Base的实验结果,BERT Large和RoBERTa Large的结果显示了类似的趋势,详细见文章附录。在所有的评估设置中,优化的prompt比自然语言的prompt有更高的精确度。

表1  BERT Base的P@1和一致性实验结果

从表1的结果中观察到,让LLM访问其未修改的自然语言prompt的embedding是有帮助的。因此作者进行了消融实验,探究自然语言prompt的哪一部分是需要保留的。

图3(左)显示了LLM的哪些embedding是重要的,可以保持不修改。作者得出结论,prompt中主语token的embedding不被修改使得P-Adapter表现突出,但需要在训练和推理时知道主语token的索引,这与之前不使用额外注释的要求相矛盾。因此,作者提出了另一种版本的P-Adapter将未经修改的LLM的自然语言prompt加入到P-Adapter的输出中,如下:

图3(右)显示了α等于0.5时,模型表现最好。当主语和[MASK] token被替换进来时,尽管表现比P-Tuning P-Adapter差,但优于Rewrite P-Adapter。

图3  左图为LLM的哪些embedding是重要的,可以保持不修改。右图为不同的α与P-Tuning P-Adapter和Rewrite P-Adapter进行比较。

参考文献

[1] Auto- Prompt: Eliciting Knowledge from Language Models with Automatically Generated Prompts. (EMNLP2020)

[2] Knowledgeable or educated guess? revisiting language models as knowledge bases. (ACL2021)

[3] Swords: A benchmark for lexical substitution with improved data coverage and quality. (NAACL2021)


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。

论文浅尝 | P-Adapters: 从具有不同提示的语言模型中鲁棒地提取事实信息相关推荐

  1. 论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识

    笔记整理:谭亦鸣,东南大学博士生 来源:EACL'21 链接:https://aclanthology.org/2021.eacl-main.284.pdf 概述 本文关注将语言模型(LM)视作一个知 ...

  2. 论文浅尝 | 融入知识的弱监督预训练语言模型

    论文笔记整理:叶群,浙江大学计算机学院,知识图谱.NLP方向. 会议:ICLR 2020 链接:https://arxiv.org/pdf/1912.09637.pdf Abstract 预训练语言模 ...

  3. 论文浅尝 | 利用多语言 wordnet 上随机游走实现双语 embeddings

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答. 来源:Knowledge Based System 链接:https://www.sciencedirect.com/science/a ...

  4. 论文浅尝 | 图神经网络综述:方法及应用

    论文链接:https://arxiv.org/pdf/1812.08434.pdf GNN相关论文列表链接:https://github.com/thunlp/GNNPapers 近日,清华刘知远老师 ...

  5. 论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

    随着监督学习在机器学习领域取得的巨大发展,如何减少人工在样本方面的处理工作,以及如何使模型快速适应层出不穷的新样本,成为亟待解决的问题.零样本学习(Zero-Shot Learning, ZSL)的提 ...

  6. 论文浅尝 | 近期论文精选

    本文转载自公众号 PaperWeekly, 对我们近期的论文浅尝进行了精选整理并附上了相应的源码链接,感谢 PaperWeekly! TheWebConf 2018 ■ 链接 | https://ww ...

  7. 论文浅尝 | 从 6 篇顶会论文看「知识图谱」领域最新研究进展 | 解读 代码

    本文内容源自往期「论文浅尝」,由 PaperWeekly 精选并重新排版整理,感谢 PaperWeekly. ISWC 2018 ■ 链接 | http://www.paperweekly.site/ ...

  8. ###好好好#######论文浅尝 | 基于图注意力的常识对话生成

    论文浅尝 | 基于图注意力的常识对话生成 OpenKG 祝各位读者新春快乐,猪年吉祥! 来源:IJCAI 2018. 论文下载地址:https://www.ijcai.org/proceedings/ ...

  9. 论文浅尝 - AAAI2020 | 多轮对话系统中的历史自适应知识融合机制

    论文笔记整理:潘锐,天津大学硕士. 链接:https://www.aaai.org/ojs/index.php/AAAI/article/view/6425 来    源:AAAI 2020 论文简介 ...

最新文章

  1. Windows 7键盘失灵导致无法输入登录密码问题解决方案
  2. 地区省份城市sql信息
  3. table类型数据提交_OGG数据同步异常问题总结
  4. 不给糖果就捣乱,用Python绘制有趣的万圣节南瓜怪【华为云分享】
  5. matlab检查错误 函数,检查代码中的错误和警告
  6. 阿尔法狗 3 天走完人类千年棋史,被反超的我们该如何绝地求生?34 个开源项目告诉你!
  7. Webpack + vue + es6 安装
  8. Android广播机制(1)
  9. 转载---ubutun18.04系统安装搜狗输入法
  10. /分数化简和加减乘除
  11. welearn平台答案 大学英语 视听说 综合教程
  12. A Scalable Probabilistic Tensor Factorization(SPTF)论文小结
  13. 解决 WPS 输入文字颜色无法改变并自带下划线的问题
  14. Java字符串:getBytes() 方法
  15. windows远程桌面连接任务栏显示问题
  16. webpack将部分图片打包后转化为base64
  17. 3dmax顶点动画导入unity_3DMAX点缓存的动画怎么导入unity呀?
  18. 阿里数据中台底座的12年建设实践
  19. 《地理信息系统导论》绪论 复习题
  20. 基地树洞 | 自动化小系列之整合篇

热门文章

  1. 服装盘点机在服装行业颜色尺码仓库条码高效管理中的应用
  2. 文字识别/文本检测数据集
  3. ReflectiveMethodInvocation
  4. 模仿3d打印中使用 Arduino 来根据 NTC 温度传感器的查询表来测量温度的示例程序。
  5. 服务器框架语言,Perfect:Swift 语言服务器端软件框架简介
  6. 【无标题】lead与lag函数
  7. AMEYA360:芯片的四大分类
  8. djay Pro AI Mac(DJ混音软件)
  9. 即时配送:新零售时代的“物流新战场”
  10. Java实现掘金自动签到、免费抽奖