论文地址:https://arxiv.org/abs/2203.06359
发表于:CVPR 22

Abstract

无示范的类增量学习是指在旧类样本无法保存的情况下,同时识别新旧两类。这是一项具有挑战性的任务,因为只有在新类的监督下才能实现表征优化和特征保留。为了解决这个问题,我们提出了一个新颖的自我维持的表征扩展方案。我们的方案包括一个结构重组策略,该策略融合了主枝扩展和侧枝更新来保持旧的特征,以及一个主枝蒸馏方案来转移不变的知识。此外,还提出了一种原型选择机制,通过有选择地将新样本纳入蒸馏过程来提高新旧类别之间的区分度。在三个基准上进行的广泛实验显示了显著的增量性能,分别以3%、3%和6%的幅度超过了最先进的方法。

I. Overview


本文的创新点同样也是经典的三个,分别为图中的Dynamic Structure Reorganization(DSR)、Main-Branch Distillation(MBD)、Prototype Selection Mechanism(PSM)。

首先,我们先简单复习下经典的带示例的增量学习的流水线。对于新类样本,在使用交叉熵损失学习表征的同时,也使用蒸馏损失来减少对旧类的遗忘。此外,存储的旧类示例也会被一同训练,以显式监督的形式进一步去强化对旧类的回忆。然而,由于NECIL(Non-Exemplar CIL)不能去直接存储旧类的样本,因此本文采取了一种较为常见的替代方式,即直接存储旧类的原型表征(prototype representation)本身,具体的存储实现与PASS[1](CVPR 20)类似。一个不同之处在于,本文相比与PASS而言还使用了over sample策略,以对分类头进行进一步的校准。

II. Dynamic Structure Reorganization

DSR包含Structural Expansion与Structural Reparameterization两个部分。

Structural Expansion,字面意思,结构扩充,就是为深度网络添加的额外的层,以增大网络参数量的形式使得网络在学习新知识的同时,减少对旧知识的覆盖。但是,持续增大参数量的话会使网络变得臃肿,从而违背增量学习的原则。实际上,本文添加的结构仅仅是为了辅助网络进行学习。我们来回看一下示意图:

其中灰色立方体框出来的部分就是深度网络的一个Encoder Block。Encoder Block由若干个卷积组成,而一个深度网络一般包含五个Encoder Block。本文的做法是,在Encoder Block的基础上添加额外的residual connection,对应蓝色连接线部分。在训练时,首先冻结主网络参数,只对这些residual connection进行训练。在训练完后,这些residual block中就可以包含一些新类的知识。

接下来,问题就成了怎么把这一额外结构中的新类知识给融合回主网中。这一过程对应着Structural Reparameterization,其结构如下:

具体做法可能源自于RepVGG[2],通过zero-padding与linear transformation实现。在新类知识被融合后,额外的residual connection被移除以保证网络参数不变。

III. Prototype Selection

具体做法是,对于新类样本,计算其embedding与原型向量的相似性。如果这个相似性超过了某个阈值,说明该新类样本与旧类样本相似,容易混淆,此时为蒸馏损失增加一个mask,强调对新旧类的区分;如果这个相似性低于某个阈值,则说明该新类样本与旧类样本差异很大,此时为交叉熵损失增加一个mask,强调对新类特征的学习。

Ref

[1] Zhu, Fei, et al. “Prototype augmentation and self-supervision for incremental learning.” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021.
[2] Ding, Xiaohan, et al. “Repvgg: Making vgg-style convnets great again.” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021.

[论文阅读] Self-Sustaining Representation Expansion for Non-Exemplar Class-Incremental Learning相关推荐

  1. 论文阅读笔记:Improving Attacks on Speck32 / 64 using Deep Learning

    论文阅读笔记:Improving Attacks on Speck32 / 64 using Deep Learning 本文通过神经网络利用了减少轮数的 Speck 的差分性质.为此,作者对神经网络 ...

  2. [基础论文阅读]QMIX: Monotonic Value Function Factorization for Deep Multi-agent Reinforcement Learning

    [基础论文阅读]QMIX: Monotonic Value Function Factorization for Deep Multi-agent Reinforcement Learning 题目含 ...

  3. 论文阅读:On Dynamic Resource Allocation for Blockchain Assisted Federated Learning over Wireless Channel

    论文阅读:On Dynamic Resource Allocation for Blockchain Assisted Federated Learning over Wireless Channel ...

  4. 论文阅读: 3D Human Pose Estimation in the Wild by Adversarial Learning

    论文地址:https://arxiv.org/abs/1803.09722 出自港中文,CUHK-SenseTime Joint Lab 一.总体框架描述 1.本篇论文主体思路是提出了一个对抗性的学习 ...

  5. 论文阅读:(2020 AAAI) Video Cloze Procedure for Self-Supervised Spatio-Temporal Learning

    Video Cloze Procedure for Self-Supervised Spatio-Temporal Learning (2020 AAAI) Dezhao Luo, Chang Liu ...

  6. 【视频异常检测-论文阅读】Anomaly Detection in Video via Self-Supervised and Multi-Task Learning

    来源: Georgescu, Mariana-Iuliana, et al. "Anomaly Detection in Video via Self-Supervised and Mult ...

  7. 论文阅读:智能机器故障诊断方法综述Applications of machine learning to machine fault diagnosis: A review and roadmap

    论文链接:link 2020年雷亚国西交团队 文章目录 1 介绍 2 过去:基于传统机器学习理论的IFD问题 2.1 概述 2.2 Step1:数据采集 2.3 Step2:手工特征提取 2.3.1. ...

  8. 【论文阅读】【3d目标检测】Behind the Curtain: Learning Occluded Shapes for 3D Object Detection

    论文标题:Behind the Curtain: Learning Occluded Shapes for 3D Object Detection AAAI2022 南加大 这篇文章的主题思想是认为现 ...

  9. 论文阅读:(2020版)A Survey on Deep Learning for Named Entity Recognition 命名实体识别中的深度学习方法

    A Survey on Deep Learning for Named Entity Recognition 命名实体识别中的深度学习方法 目录 A Survey on Deep Learning f ...

  10. 论文阅读 :A survey of visual analytics techniques for machine learning

    题目:A survey of visual analytics techniques for machine learning A survey of visual analytics techniq ...

最新文章

  1. 黄聪:说说JSON和JSONP,也许你会豁然开朗(转)
  2. 用Jmeter做微信小程序项目接口测试【案例】
  3. Django 【补充】ORM多对多正向查询
  4. 深度探索C++ 对象模型(1)-三种对象模型的设计
  5. LeetCode Algorithm 101. Symmetric Tree
  6. PHP扩展开发(3)-config.m4
  7. oracle decode_ORACLE常见问题-100问(系列一)
  8. python识别验证码登陆学校网站
  9. MySQL集群Cluster
  10. 自顶向下语法分析的作业
  11. excel 置信区间 计算_正态分布 excle(Excel中用什么函数可以算置信区间,怎么算啊?)...
  12. mysql查询这一周数据库_MYSQL查询一周,一月内的数据
  13. 99%健身人士的疑问:营养补充窗口真的很重要吗?
  14. CorelDRAW X8超低价优惠啦,你却还在用CDR X4破解?!
  15. AtCoder Beginner Contest 242——1111gal password
  16. 【Socket网络编程进阶与实战】------ Socket网络编程快速入门
  17. Windows操作系统及其应用
  18. 打开谷歌浏览器提示输入密钥环
  19. 【使用指南】清华源的使用
  20. BMP图片格式分析(超详细)

热门文章

  1. 万亿平安,如何继续高速增长?
  2. ValueError: With n_samples=1, test_size=0.2 and train_size=None, the resulting train set will be emp
  3. 微信小程序:2022强大的修复版趣味心理测试小程序源码,趣味测试引流裂变神器,流量主激励广告实现管道收益
  4. 编写一个自我介绍python_简单的个人简历的自我介绍怎么写
  5. ORA-02292: 违反完整约束条件 (***.FK_****) - 已找到子记录
  6. C++ primer读书记录包括第一部分和第二部分 第二十二次更新2021.9.10
  7. 1998ieee圆周率c语言,华人留学生开发首个古汉语编程语言,实现易经算命、圆周率计算,Github获赞14.7k...
  8. 6.4_[Java 数组]-详解 break/continue 跳转语句
  9. 马云说:“未来是大数据的时代”
  10. 《Java语言程序设计》 课程分析与总结(上)---我为什么这样设计考试试卷?