笔记整理 | 胡楠,东南大学


来源:ICLR 2021

论文下载地址:https://arxiv.org/pdf/2010.02329.pdf

动机

最近的研究表明,BERT和RoBERTa这种基于BERT的模型容易受到文字对抗攻击的威胁。论文旨在从信息理论的角度解决此问题并提出InfoBERT,这是一种用于对预训练语言模型进行健壮微调的新颖学习框架。InfoBERT包含两个用于模型训练的基于互信息的正则器:(i)Information Bottleneck regularizer,用于抑制输入和特征表示之间的嘈杂的互信息;(ii)Anchored Feature regularizer,可增加局部稳定特征和全局特征之间的相互信息。论文提出一种方法可以从理论上分析和提高标准训练和对抗训练中语言模型的鲁棒性。大量实验表明,InfoBERT在自然语言推理(NLI)和问题解答(QA)任务的多个对抗性数据集上均达到了最先进的鲁棒准确性。

贡献

论文的贡献总结如下。(i)从信息论的角度提出了一种新颖的学习框架InfoBERT,旨在有效地提高语言模型的鲁棒性。(ii)提供了关于模型鲁棒性的原则性理论分析,并提出了两个基于MI的正则化器来细化局部和全局特征,可将其应用于针对不同NLP任务的标准训练和对抗训练。(iii)全面的实验结果表明,InfoBERT可以在不牺牲良性准确性的情况下大幅提高鲁棒准确性,从而在NLI和QA任务的多个对抗性数据集上产生了最先进的表现。

实验

Adversarial Datasets:(I)Adversarial NLI(ANLI)是大型NLI基准,通过迭代、对抗性的、人为模型的循环过程收集来攻击BERT和RoBERTa。ANLI数据集是强大的对抗性数据集,可轻松将BERTLarge的准确性降低至0%。(II)Adversarial  SQuAD数据集是一种对抗性QA基准数据集,由一组手工规则生成并通过众包进行精炼。由于没有提供对抗训练数据,因此论文仅在良性SQuAD训练数据上微调RoBERTa Large,并在良性和对抗性测试集上测试模型。(III)TextFooler是最新的词级对抗攻击方法,用于生成对抗示例。为了创建对抗性评估数据集,论文分别从SNLI和MNLI的测试集中采样了1,000个示例,并针对BERT Large和RoBERTa Large运行TextFooler以获取对抗性文本示例。

Baselines:由于基于IBP的方法还不能应用于大规模的语言模型,并且基于随机平滑的方法实现了有限的认证鲁棒性,因此论文将InfoBERT与基于对抗训练的三个竞争基线进行了比较:(I)FreeLB在微调阶段对语言模型进行对抗性训练,以提高泛化能力。(二)SMART在微调过程中使用对抗训练作为平滑诱导正则化和Bregman近点优化,以提高语言模型的泛化和鲁棒性。(三)ALUM在训练前和微调阶段都进行对抗性训练,在广泛的NLP任务中获得了显著的性能增益。由于对抗性训练的高计算成本,论文将InfoBERT与ALUM和SMART进行了比较,并与原始文献中的最佳结果进行了比较。

Evaluation Metrics:我们使用稳健精度或稳健F1评分来衡量基线模型和InfoBERT在面对对手数据时的稳健程度。具体来说,鲁棒精度的计算方法是:,其中Dadv是对抗数据集,y是地面真值标签,arg max选择logits最高的类,是指示函数。类似地,鲁棒F1分数的计算公式为:,其中是真实答案a和预测答案arg max之间的F1分数,arg max选择概率最高的答案。

实验结果:

论文从信息论的角度提出了一种新的学习框架InfoBERT,在理论分析的支持下,InfoBERT为提高BERT和RoBERTa对NLI和QA任务的鲁棒性提供了一种原则性的方法。综合实验表明,InfoBERT在对抗性数据集上取得了新的进展,为提高语言模型表征学习的鲁棒性提供了一种新的有效方法。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

论文浅尝 - ICLR2021 | 从信息论的角度提高语言模型的鲁棒性相关推荐

  1. 论文浅尝 - ICLR2021 | BERTology 遇上生物学:在蛋白质语言模型中解释注意力

    来源:ICLR2021 链接:https://arxiv.org/abs/2006.15222v3 一.动机 Transformer架构已经被证明可以学习有用的蛋白质分类和生成任务表示.然而,在可解释 ...

  2. 论文浅尝 | P-Adapters: 从具有不同提示的语言模型中鲁棒地提取事实信息

    笔记整理:田玺,浙江大学硕士研究生.研究方向:知识图谱.自然语言处理 论文地址:https://openreview.net/forum?id=DhzIU48OcZh,录用于ICLR2022 摘要 之 ...

  3. 论文浅尝 | 从 6 篇顶会论文看「知识图谱」领域最新研究进展 | 解读 代码

    本文内容源自往期「论文浅尝」,由 PaperWeekly 精选并重新排版整理,感谢 PaperWeekly. ISWC 2018 ■ 链接 | http://www.paperweekly.site/ ...

  4. 论文浅尝 | 利用多语言 wordnet 上随机游走实现双语 embeddings

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答. 来源:Knowledge Based System 链接:https://www.sciencedirect.com/science/a ...

  5. 论文浅尝 | 图神经网络综述:方法及应用

    论文链接:https://arxiv.org/pdf/1812.08434.pdf GNN相关论文列表链接:https://github.com/thunlp/GNNPapers 近日,清华刘知远老师 ...

  6. 论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

    随着监督学习在机器学习领域取得的巨大发展,如何减少人工在样本方面的处理工作,以及如何使模型快速适应层出不穷的新样本,成为亟待解决的问题.零样本学习(Zero-Shot Learning, ZSL)的提 ...

  7. 论文浅尝 | 近期论文精选

    本文转载自公众号 PaperWeekly, 对我们近期的论文浅尝进行了精选整理并附上了相应的源码链接,感谢 PaperWeekly! TheWebConf 2018 ■ 链接 | https://ww ...

  8. ###好好好#######论文浅尝 | 基于图注意力的常识对话生成

    论文浅尝 | 基于图注意力的常识对话生成 OpenKG 祝各位读者新春快乐,猪年吉祥! 来源:IJCAI 2018. 论文下载地址:https://www.ijcai.org/proceedings/ ...

  9. 论文浅尝 - AAAI2020 | 多模态基准指导的多模态自动文摘

    论文笔记整理:刘雅,天津大学硕士. 链接: https://aaai.org/ojs/index.php/AAAI/article/view/6525 动机 近年来,随着计算机视觉以及自然语言处理技术 ...

最新文章

  1. mit 6.824 Distributed System
  2. 碰撞,处理碰撞,发射 Learn Unreal Engine (with C++)
  3. [转]关于WM_NCHITTEST消息
  4. PHP 查看系统文件时间戳
  5. [翻译]基于ASP.NET的NumericTextBox控件[Carol]
  6. “终端服务临时客户端许可证过期”的解决方法
  7. Kubernetes 一键部署实践
  8. ghost linux pe,winPE下安装系统ghost的详细教程
  9. WSO2 ——(10)ESB功能:服务编排
  10. mysql获取autoincrement_MySQL获取Auto_increment字段刚插入的值 | 学步园
  11. 学习CentOS6这一篇就够了
  12. java手机验证码登录代码_java web实现手机短信验证码登录实例
  13. Gan(生成式对抗网络)
  14. 51单片机4G模块通信(EC03-DNC4G)
  15. 大棚养殖韭菜如何保障产量?资产监测设备保障大棚养殖韭菜
  16. 合肥工业大学计算机与信息学院研究生招生,合肥工业大学计算机与信息学院有关研究生分配的有关规定...
  17. php服务软件安装?宝塔服务器配置搭建一键完成
  18. 创建简单的CA并签名
  19. 狂神学JAVA--基础篇:JavaSE Xmind总结 思维导图
  20. nginx作为web服务应用

热门文章

  1. 【Eclipse 插件】Implementors
  2. windows 下编译 jrtplib-3.9.1 和 jthread-1.3.1
  3. SVN1.6.5详细配置
  4. of_property_read_string 剖析~
  5. Android 亮屏速度分析
  6. 在Ubuntu下安装jdk解压出现问题:./jdk-6u30-linux-i586.bin: 113: ./install.sfx.3631: not found
  7. webmvcconfigurer配置跨域_为什么加了 Spring Security 会导致 Spring Boot 跨域失效呢?...
  8. matlab dir函数_MATLAB自动管理文件
  9. python3列表生成式中的for循环与普通放在外面的for循环细微差异
  10. 绿盟防火墙配置手册_双链路环境下不同品牌防火墙更换案例分享