Abstract & Introduction & Related Work

  • 研究任务
    通用持续学习
  • 已有方法和相关工作
  • 面临挑战
    • 忽略了实际场景的特性,即数据流不能被塑造为任务序列,而且离线训练也不可行
    • 我们致力于实现一般持续学习(GCL),在这种情况下,任务边界模糊,领域和类别分布逐渐或突然转变。我们通过将重现与知识蒸馏和正则化相混合来解决这个问题;我们简单的baseline,即黑暗经验重放,与整个优化轨迹中采样的网络对数相匹配,从而促进与它的过去的一致性
  • 创新思路
    • 依靠黑暗知识来蒸馏过去的经验,在整个训练轨迹中进行采样
  • 实验结论

大多数比较的方法都不适合现实世界的应用,因为现实世界的内存是有限的,而且任务交织重叠。最近,[11]介绍了一系列CL方法应该实现的准则,以便在实践中适用:

  1. 无任务边界:在训练期间不依赖任务之间的边界
  2. 无测试时间orcale:在推理时不需要任务识别器
  3. 恒定内存:在整个训练阶段有一个有界限的内存足迹

Dark Experience Replay

给出定义,要优化的项

理想情况下,我们要寻找能很好地适应当前任务的参数,同时近似于在旧任务中观察到的行为:实际上,我们鼓励网络模仿其对过去样本的原始反应。为了保持对以前任务的了解,我们寻求最小化以下目标

θt∗\theta^*_tθt∗​ 是结束第t个任务时候的最优参数,α\alphaα 是平衡两者的超参数,这一项像教师-学生方法,需要之前的数据集,为了克服这个限制,引入一个重演缓存来为任务t保留过去的经验

与其他基于排练的方法不同,我们保留了网络的logits z≜hθt(x)z \triangleq h_{θ_t} (x)z≜hθt​​(x),而不是真实标签y


由于我们专注于通用持续学习,我们有意地避免依赖任务边界来填充训练过程中的缓冲区。因此,我们采用水库采样来代替常见的任务分层抽样策略:这样,我们从输入流中选择 ∣M∣\mathcal{|M|}∣M∣ 随机样本,保证它们有相同的概率 ∣M∣/∣S∣\mathcal{|M|_{/|S|}}∣M∣/∣S∣​被存储在缓冲区中,而不必事先知道流的长度S。我们可以将公式3重写如下

这样的策略意味着在优化轨迹中挑选对数z,因此可能与在任务的局部最优时观察到的对数不同。即使是反直觉的,我们根据经验观察到,这种策略并不损害性能,同时在没有任务边界的情况下仍然适用。此外,次优逻辑的重放在达到的最小值的平坦性和校准方面有好处

在温和的假设下,公式4中KL散度的优化等同于最小化相应的pre-softmax(即logits)之间的欧氏距离。在这项工作中,我们选择匹配logits,因为它避免了由于挤压函数(如软化函数)而在概率空间发生的信息损失。基于这些考虑,黑暗经验重放(DER,算法1)优化了以下目标


我们通过计算从重放缓冲区采样的批次的梯度来近似期望值

Dark Experience Replay++。值得注意的是,水库策略在某些特定情况下可能会削弱DER。也就是说,当输入流中发生突然的分布变化时,那些被以前的任务训练严重偏向的logits可能会被抽样用于以后的重放:同时利用真实标签–如ER所做的那样–可以减轻这样的缺陷。基于这些理由,我们还提出了Dark Experience Replay++,它为公式5的目标配备了一个关于缓冲区数据点的附加项,以最小的内存开销促进了对其真实标签的更高条件的可能性

黑暗经验回放(++):

Relation with previous works

虽然我们提出的方法和LWF[25]都利用了持续学习中的知识蒸馏,但它们采用的方法明显不同。后者不回放过去的例子,所以它只鼓励教师和学生对当前任务的数据点的反应的相似性

iCaRL通过过去的例子来提炼过去输出的知识,这与我们的建议更为相似
然而前者利用每个任务结束时指定的网络作为唯一的教学信号
我们的方法在整个优化轨迹中存储了采样的对数,这类似于有几个不同的教师准则

与我们接近的建议是由函数距离正则化(FDR),用于对抗灾难性遗忘([4]的第3.1节)。与FDR一样,我们使用过去的典范和网络输出来调整过去和当前的输出

与上述iCaRL的讨论类似,FDR在任务边界存储网络反应,因此不能在GCL环境中使用

我们在第5节中提出的实验分析显示,任务边界的需要可以通过水库采样来放松,而不会出现性能下降

我们从经验上观察到DER和DER++取得了明显优越的结果和显著的特性

背后的动机主要在于研究如何在函数 L2L^2L2 希尔伯特空间中表征神经网络的训练轨迹,而函数空间正则化对于连续学习问题的潜力只是通过MNIST上的一个实验粗略地解决

Experiments




Conclusions

在本文中,我们介绍了Dark Experience Replay:一个简单的持续学习baseline,它利用知识蒸馏来保留过去的经验,从而避免灾难性的遗忘。我们通过在标准基准上进行的广泛的实验分析,展示了我们建议的有效性。另外,我们认为最近正式化的通用持续学习为不同应用的进展提供了基础

Remark

方法很简单,但是效果还可以?不过是两年前的东西了

Raki的读paper小记:Dark Experience for General Continual Learning: a Strong, Simple Baseline相关推荐

  1. Raki的读paper小记:Prompting ELECTRA: Few-Shot Learning with Discriminative Pre-Trained Models

    Abstract&Introduction&Related Work 研究任务 基于提示学习的ELECTRA 已有方法和相关工作 ELECTRA 面临挑战 基于判别模型的预训练模型的f ...

  2. Raki的读paper小记:OFA: UNIFYING ARCHITECTURES, TASKS, AND MODALITIES THROUGH A SIMPLE Seq2Seq FRAMEWORK

    Abstract&Introduction&Related Work 研究任务 多模式预训练的统一范式 包括图像生成.visual-grounding(visual grounding ...

  3. Raki的读paper小记:Image as a Foreign Language: BEIT Pretraining for All Vision and Vision-Language Tasks

    Abstract&Introduction&Related Work 研究任务 语言+视觉模态预训练任务 已有方法和相关工作 masked data已经成为一种主流 面临挑战 现有的多 ...

  4. Raki的读paper小记:Named Entity Recognition without Labelled Data: A Weak Supervision Approach(半成品)

    Abstract & Introduction & Related Work 研究任务 无标注数据NER学习 已有方法和相关工作 Unsupervised domain adaptat ...

  5. Raki的读paper小记:Forget-free Continual Learning with Winning Subnetworks

    Abstract&Introduction&Related Work 研究任务 用子网络做CL 已有方法和相关工作 彩票假说(LTH)证明了稀疏子网络(称为中奖彩票)的存在,这些子网络 ...

  6. Raki的读paper小记:Neuro-Inspired Stability-Plasticity Adaptation for Continual Learning in Sparse Nets

    Abstract&Introduction&Related Work 研究任务 Continual Learning 已有方法和相关工作 面临挑战 创新思路 利用持续学习过程中的持续稀 ...

  7. Stetman读paper小记:ATTEQ-NN

    注:本周笔者阅读了龚雪鸾.陈艳娇的文章ATTEQ-NN:Attention-based QoE-aware Evasive Backdoor Attacks.本文讲了作者设计的一种基于注意力机制的后门 ...

  8. Stetman读paper小记:BackdoorBench - A Comprehensive Benchmark of Backdoor Learning

    之前因为参与了实验室后门攻击的项目,阅读了一下这篇关于后门学习的综合性基准测试的研究工作,在此记录一下学习笔记与心得. 1 摘要 这篇文章介绍了一个名为BackdoorBench的基准测试,用于评估后 ...

  9. 【不想读paper的时候看看】阅读文献?

    [不想读paper的时候看看]为何阅读文献? 最近看了中国科学院大学(国科大/果壳)图书馆对我们一年级集中教学的同学关于图书馆资源与服务的培训PPT,截取了一些较有感触的slides做一下笔记. 1. ...

  10. Paper reading:A simple baseline for one-shot multi-object tracking(一)

    A simple baseline for one-shot multi-object tracking(一) 1. 背景介绍 作者来自华中科技大和微软亚亚研院,之前LZ是看过一点多目标跟踪的算法的, ...

最新文章

  1. delphi处理消息的几种方式
  2. intellij中出現java.lang.NoClassDefFoundError: org/apache/commons/configuration/Configuration解決方案
  3. 计算机应用基础教材6,全国2013年自考《计算机应用基础》教材大纲第六章
  4. 看《墨攻》理解IoC—Spring底层核心
  5. bootstrap-内联文本元素-斜体
  6. PHP面试题(二)---百度
  7. 锐起无盘服务器优化,(锐起无盘系统制作系统优化教程.doc
  8. web应用渗透测试流程
  9. TextBlock/Textbox
  10. 《电脑音乐制作实战指南:伴奏、录歌、MTV全攻略》——2.2 能知旋律但不知歌名,使用哼唱搜索来找歌...
  11. 安装corelDraw x8过程遇到的坑
  12. 基于java Swing 框架使用socket技术开发的即时通讯系统【源码+数据库】
  13. 【Python 无损放大图片】——支持JPG/PNG 可将图片无损放大上万像素
  14. 988-211所有学校
  15. C++系列(关键字static)
  16. 编程基础(三十七):PTA运行时错误
  17. Sass的概念以及命令
  18. Vue Clipboard 异步复制粘贴
  19. Linux内核之PCI设备
  20. C71500(BFe30-1-1)镍白铜锻件 带材

热门文章

  1. 《Java程序设计语言(第4版)》阅读笔记(1)
  2. tomcat设置独立jvm的例子
  3. Cisco PIX 简单配置-4
  4. Ubuntu Linux系统备份与还原命令技巧
  5. 如何让百度快速收录自己的wordpress网站
  6. python 通过逗号分割字符串_「Python 秘籍」使用多个界定符分割字符串
  7. hql中 oracle当前时间,hql oracle 比较 日期时间
  8. node http创建正向代理_Node.JS实战20:用execFile执行外部程序
  9. pandas如何保存在excel里面_别找了,这是 Pandas 最详细教程了
  10. html文本框自动填充,html利用文本框input自动填写当前日期