目录

一、数据增量与类别增量

二、常见增量学习结构

三、增量学习方法分类

四、总结及论文链接

4.1 总结

4.2 相关论文链接


相关论文链接

无监督增量学习 Unsupervised Class-Incremental Learning Through Confusion.论文详解ICLR 2021

基于拓扑图的增量学习方法 论文归纳与详解

Few Shot Incremental Learning with Continually Evolved Classifiers论文详解 基于持续进化分类器的小样本类别增量学习CVPR2021

TPCIL论文详解,基于持续改进分类器的增量学习Topology-Preserving Class-Incremental Learning,ECCV2020_祥瑞的技术博客-CSDN博客

论文详解Memory Efficient Incremental learning through feature adaptation. CVPR2020 基于增量特征映射

Supervised Contrastive Replay 论文详解 通过NCM分类器和图片回放实现增量学习_祥瑞的技术博客-CSDN博客

差文解析 IIRC: Incremental Implicitly-Refined Classification_祥瑞的技术博客-CSDN博客

FSCIL论文详解 Few-Shot Class-Incremental Learning, CVPR2020_祥瑞的技术博客-CSDN博客

DER论文详解DER: Dynamically Expandable Representation for Class Incremental Learning, CVPR 2021_祥瑞的技术博客-CSDN博客

CEC论文详解Few Shot Incremental Learning with Continually Evolved Classifiers. CVPR2021_祥瑞的技术博客-CSDN博客

PODNet: Pooled Outputs Distillation for Small-Tasks Incremental Learning论文详解ECCV2020_祥瑞的技术博客-CSDN博客

CVPR2021论文详解Rainbow Memory: Continual Learning with a Memory of Diverse Samples_祥瑞的技术博客-CSDN博客

SDC论文详解Semantic Drift Compensation for Class-Incremental Learning. CVPR 2020_祥瑞的技术博客-CSDN博客

RKR论文详解 Rectification-based Knowledge Retention for Continual Learning. CVPR 2021 基于知识矫正的持续学习_祥瑞的技术博客-CSDN博客

基于拓扑的增量学习Topology Preserving Class-Incremental learning论文详解ECCV2020_祥瑞的技术博客-CSDN博客

一、数据增量与类别增量

增量学习任务分为,数据增量和类别增量。数据增量过程中,增量任务和原始任务之间没有新类别出现,两者具有相同的类别。

本文对广义和狭义的类别增量进行了明确的定义,对于增量任务,具有如下的定义:

  • C表示所有的类别
  • Tt表示增量任务t之中的类别,相当于C的子集
  • DcC表示所有类别C中子类c的样本
  • DtT表示增量任务t中类别c的样本

广义于狭义的类别增量定义如下:

  • 对于狭义类别增量问题,不同task之间没有共有类,这是狭义的类别增量。
  • 对于广义的类别增量问题,不同的task之间有共有类,这是广义的类别增量。

二、常见增量学习结构

增量学习中最常见的结构,也是近两年被广泛采用的结构是,特征提取模块加上分类器模块。假定特征提取模块是hθ(), 分类器模块是gW(), 非常常见的结构就是:

这个结构对于目标检测任务同样适用,例如对于CentreNet,它的特征提取模块hθ()提取出特征之后,对应的目标检测模块可以看作gW()

输入经过特征提取后送入分类器。同时,为了维持旧知识,避免灾难性遗忘,多种方式可以在此过程中被选择性加入。

  • 扩张模型结构:增量训练中,改变特征提取模块hθ()或者分类器模块gW()的结构,或者引入额外的模型结构。
  • 知识蒸馏:基于模型输出结果的知识蒸馏(多采用交叉熵)、基于feature-map的知识蒸馏(L2范数或者余弦距离)、基于所有中间结果feature-map的知识蒸馏(本文中PodNet池化蒸馏的方法)。基于知识蒸馏的方法需要保存旧模型的权重。
  • Memory:用于存储原始样本,或者存储已提取特征,在增量训练过程中进行回放。

三、增量学习方法分类

按照近两年的论文情况,增量学习方法可以粗略分为三大类:基于模型结构的方法、基于回放的方法、基于正则化的方法。

基于模型结构的方法随着增量学习不断地对网络结构进行修改。例如对于增量任务增加新的模型结构,这样旧任务可以通过旧的模型权重进行保持,同时新增的模型结构适应了增量任务,从而达到了既适应旧任务,也适应新任务的目的。基于模型结构的方法可以分为两种:

  • 基于模型结构增扩的方法:如本文的RKR(CVPR, 2021), DER(CVPR 2021),通过扩张模型结构的方式提升模型性能,这样旧的模型结构有利于保持原始任务的性能,新的模型结构可以适应新的增量任务性能。但是此过程中,模型结构增加必然造成任务存储负担和运算负担的加剧,如何通过更优的模型增扩方式,降低此消耗的同时,达到较好的效果,是此方法改进的方向。
  • 基于拓扑图结构的方法:本文的FSCIL(CVPR,2020)、TPCIL(ECCV, 2020)、CEC(CVPR, 2021),增量任务中,不同的类别之间具有一定的相关性,这种相关性可以通过拓扑结构进行建模和分析。此方向较新,方法的有效性也得到了一定的验证,是未来发展的一个趋势之一。
  • 基于元学习的方法:本文的ONCE(CVPR,2020)目标检测框架。将元学习与目标检测网络相结合,通过元学习引入了特征编码生成器。但是元学习对于小量样本的Few-Shot时候较为适用,且实验性能较差。

基于回放的方法可以分为:基于样本回放的方法和基于特征回放的方法。基于样本回放的方法能够将旧任务的样本进行存储,这类方法的缺点在于直接存储样本比直接存储特征需要耗费更多的存储空间,同时需要考虑如何选取用于回放的样本。基于特征回放的方法需要将旧任务提取出的特征进行存储,同样面临考虑样本选取的问题。同时特征回放的模型结构进行了更新,那么就需要考虑特征漂移的问题。

  • Non-rehearsal: 即不需要rehearsal, 例如LwF直接用新旧网络之间进行知识蒸馏,不需要存储旧样本。这种方法的存储负担最小,但是效果往往不如基于特征回放的方法效果好,对灾难性遗忘的抵抗能力较弱。
  • Exemplars: 直接存储原始图片,例如最经典的iCARL(CVPR2017),直接将原始图片存储在Memory之中。如本文的Rainbow Memory(CVPR 2021)、SCR(2021)。原始图片存储在训练时需要重新训练Memory之中的图片,存储和运算开销较大,但是性能往往最好。此方法优化的方向是,如何选取对任务更有益的样本存储于Memory之中、如何根据已有的Memory提取出更具判别性的特征。如果模型对性能要求较高,则多采用此方法。
  • Generated images: 利用GANs生成伪装图片。这种方法受到GAN的影响较大,如果GAN生成的图片质量不高,很容易造成增量模型性能不佳。难点在于如何使得GAN模型生成对模型训练更有益的图片,主要改进点在GAN模型上。
  • Feature based methods: 基于特征存储的方法,直接利用memory存储网络特征。特征在原始图片的基础上经过了提取,所以占用的存储和运算负担相对较小。但是特征如果与增量模型进行绑定,特征提取模型不更新,则模型灵活性较差。如果不固定特征提取模块,新模型的特征就会发生变化,叫做特征漂移。本文SDC(CVPR,2020),Feature Adaptation就是解决特征漂移情况。

基于正则化的方法,即知识蒸馏项作为正则化项来约束模型。此过程往往需要存储旧模型的权重,以取得知识蒸馏的来源。这种方法可以与基于回放的方法结合使用。蒸馏算法与增量学习之间面临一种天然矛盾,如果知识蒸馏的约束过强,则模型不够灵活,被限制在旧任务上;如果知识蒸馏约束较弱,模型可能发生灾难性遗忘。因此,如何设计更好的蒸馏的方法,是本方向改进的重点。目前的主流方法是:基于模型输出结果的蒸馏多采用交叉熵;基于feature和中间结果的蒸馏多采用L2范数或者余弦相似度;PodNet被提出后,一种新的基于池化蒸馏的方法值得关注。

四、总结及论文链接

4.1 总结

4.2 相关论文链接

无监督增量学习 Unsupervised Class-Incremental Learning Through Confusion.论文详解ICLR 2021

基于拓扑图的增量学习方法 论文归纳与详解

Few Shot Incremental Learning with Continually Evolved Classifiers论文详解 基于持续进化分类器的小样本类别增量学习CVPR2021

TPCIL论文详解,基于持续改进分类器的增量学习Topology-Preserving Class-Incremental Learning,ECCV2020_祥瑞的技术博客-CSDN博客

论文详解Memory Efficient Incremental learning through feature adaptation. CVPR2020 基于增量特征映射

Supervised Contrastive Replay 论文详解 通过NCM分类器和图片回放实现增量学习_祥瑞的技术博客-CSDN博客

差文解析 IIRC: Incremental Implicitly-Refined Classification_祥瑞的技术博客-CSDN博客

FSCIL论文详解 Few-Shot Class-Incremental Learning, CVPR2020_祥瑞的技术博客-CSDN博客

DER论文详解DER: Dynamically Expandable Representation for Class Incremental Learning, CVPR 2021_祥瑞的技术博客-CSDN博客

CEC论文详解Few Shot Incremental Learning with Continually Evolved Classifiers. CVPR2021_祥瑞的技术博客-CSDN博客

PODNet: Pooled Outputs Distillation for Small-Tasks Incremental Learning论文详解ECCV2020_祥瑞的技术博客-CSDN博客

CVPR2021论文详解Rainbow Memory: Continual Learning with a Memory of Diverse Samples_祥瑞的技术博客-CSDN博客

SDC论文详解Semantic Drift Compensation for Class-Incremental Learning. CVPR 2020_祥瑞的技术博客-CSDN博客

RKR论文详解 Rectification-based Knowledge Retention for Continual Learning. CVPR 2021 基于知识矫正的持续学习_祥瑞的技术博客-CSDN博客

基于拓扑的增量学习Topology Preserving Class-Incremental learning论文详解ECCV2020_祥瑞的技术博客-CSDN博客

增量学习方法分类及近两年论文汇总相关推荐

  1. CCF A类会议或期刊----多视图聚类近两年论文

    工具代码位置 期待您的PR 会议/期刊 论文 kdd2021 A Novel Multi-View Clustering Method for Unknown Mapping Relationship ...

  2. CCF A类会议或期刊----多视图,多模态近两年论文

    工具代码位置 期待您的PR 多模态多视图交流QQ群:927952513 会议/期刊 论文 neurips2020 Removing Bias in Multi-modal Classifiers: R ...

  3. CSP认证近两期试题汇总

    前言 因为了学分的需要,准备参加CSP认证,结果发现这个比赛没有题解,平台也没有提供相关讨论方式,因此决定以此来记录本人刷题解答.希望能够帮到大家,共同进步. 本人主要使用python刷题,但是pyt ...

  4. 福建省计算机中职类高考400分多少名,重要参考!福建高职分类各院校近两年招生计划及分数线汇总来了,快收藏...

    昨天,福建省教育考试院公布了2021年高职分类的切线, 分数线公布后,有什么信息是我们需要了解的?对比去年又有什么新变化?一起来了解一下! 一.近两年分数线对比 1.专科分数线保持,本科分数线上涨 对 ...

  5. 结合知识蒸馏的增量学习方法总结

    结合知识蒸馏的增量学习方法总结 知识蒸馏(Knowledge Distillation)最早是在Hinton的<Distilling the Knowledge in a Neural Netw ...

  6. 最年轻院士入职浙大,近两年浙大引进45位高层次人才~

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 转载自:杭州浙江大学校友会 11月30日,<浙江日报>头版发布文章:<助力浙 ...

  7. GitHub 近两万 Star!深度学习 500 问带你入门人工智能!| 技术头条

    作者 | 非主流.Jane 出品 | CSDN AI 科技大本营(ID:rgznai100) 程序员转行学什么语言? https://edu.csdn.net/topic/ai30?utm_sourc ...

  8. ICLR 2019提交截止,近1600篇论文已全部上线

    岳排槐 发自 凹非寺 量子位 出品 | 公众号 QbitAI 今早ICLR 2019宣布提交截止,大会总共收到近1600篇论文.这个数字不出所料的又创新高,今年的ICLR总共收到900多篇论文,同比去 ...

  9. 陈跃国教授计算机,我校两篇论文在人工智能顶级国际会议AAAI 2014发表

    我校信息学院卢志武副教授和重点实验室陈跃国副教授各有一篇论文在2014年人工智能顶级国际会议AAAI发表.AAAI全称为Association for the Advancement of Artif ...

最新文章

  1. Linux 环境 搭建Git 服务器,并且修改SSH端口使用
  2. 简单几何(推公式) UVA 11646 Athletics Track
  3. 第15章 SpringBoot集成logging日志
  4. [转载]ASP.NET开发经验积累
  5. IIS6.0,Apache低版本,PHP CGI 解析漏洞
  6. Django之Mode的外键自关联和引用未定义的Model
  7. 实现开发板与ubuntu的共享--根文件系统NFS--Samba共享【sky原创】
  8. ecshop轻松实现不同商品调用不同模板
  9. String去重方法
  10. android的ant脚本build.xml自动生成模板
  11. Java实现堆排序和图解
  12. 《药物设计学》单词表
  13. leetcode:数组:1467自矩形查询
  14. 关于EAN13码的设置问题
  15. 网络神经科学 Network neuroscience
  16. 模拟地铁自动售票系统C语言,基于PLC的地铁自动售票机控制系统设计.doc
  17. 苹果手机使用爱思助手安装ipa软件
  18. mysql 根据经纬度查询距离
  19. 四川工程职业技术学院计算机专业,四川工程职业技术学院学生在四川省大学生计算机作品大赛获佳绩...
  20. ESPIDF开发ESP32学习笔记【基本内容】

热门文章

  1. Text to face:寻找黛玉-从语言描述到人脸图像生成
  2. 用java实现从txt文本文件批量导入数据至数据库
  3. 关于区块链的想法和感想
  4. 解决iphone的短信中心号码设置错误的方案
  5. 独立IP、特产浏览量(PV)、访问次数(VV)、独立访客(UV)有什么区别?
  6. iOS音视频播放-AVPlayer简单使用
  7. react native实现兼容Android与ios的视频播放器
  8. C# 窗体 如何设置背景图片
  9. springboot报错 The Bean Validation API is on the classpath but no implementation could be found
  10. 高端数据中心交换机散热系统大比拼