论文地址:https://openaccess.thecvf.com/content_ICCV_2019/html/Belouadah_IL2M_Class_Incremental_Learning_With_Dual_Memory_ICCV_2019_paper.html
代码:https://github.com/EdenBelouadah/class-incremental-learning/tree/master/il2m/
发表于:ICCV 19

Abstract

本文提出了一种类增量学习(IL)方法,它利用微调和双重内存来减少图像识别中灾难性遗忘的负面影响。首先,我们简化了目前基于微调的方法,该方法使用分类和蒸馏损失的组合来补偿过去数据的有限可用性。我们发现,在允许有记忆的情况下,蒸馏项实际上损害了性能。然后,我们修改了通常的类增量学习内存模块。与现有的工作类似,第一个内存存储过去类的示范图像。这里引入了第二个内存,以存储最初学习时获得的过去的类的统计数据。这里的直觉是,当所有的数据都可用时,类是最好的模型,而且它们的初始统计数据在不同的增量状态下是有用的。在推理过程中会出现对新学的类的预测偏差,因为数据集对它们是不平衡的。挑战在于如何使新的和过去的类的预测更具有可比性。为了做到这一点,通过利用两个内存的内容,对过去的类的分数进行纠正。该方法在内存和推理复杂性方面的额外成本可以忽略不计。对三个大型公共数据集的实验表明,所提出的方法比一系列有竞争力的最先进的方法更有效。

Method

本文是一种典型的依赖于示例(exemplar)样本的类增量学习方法。从标题可以看出,本文的核心创意在于多了一个内存。不过,多的那个内存并不和传统的内存一样是存储示范样本用的,而存的是一些别的信息,用于纠正预测偏差。总体流程如下所示:

在图中,MMM表示各个增量阶段的模型,XXX为训练样本,CCC为预测结果。KKK为传统的内存,用于储存旧类的示范。可以看到,由于内存容量是固定的,随着新类的不断加入,旧类的样本数量会不断降低,从而加剧类不均衡现象,导致模型更倾向于去预测新类。而为了纠正这个预测偏差,本文引入了个额外的内存SSS,以维护各类的状态。

现在来看本文的具体方法。首先,对于类别iii的原始预测结果p(Ci)p(C_i)p(Ci​),进行修正如下:pr(Ci)={p(Ci)×μP(Ci)μN(Ci)×μ(MN)μ(MP),if pred =new p(Ci),otherwise p^{r}\left(C_{i}\right)= \begin{cases}p\left(C_{i}\right) \times \frac{\mu^{P}\left(C_{i}\right)}{\mu^{N}\left(C_{i}\right)} \times \frac{\mu\left(\mathcal{M}_{N}\right)}{\mu\left(\mathcal{M}_{P}\right)}, & \text { if pred }=\text { new } \\ p\left(C_{i}\right), & \text { otherwise }\end{cases} pr(Ci​)={p(Ci​)×μN(Ci​)μP(Ci​)​×μ(MP​)μ(MN​)​,p(Ci​),​ if pred = new  otherwise ​ 上面这个公式换成人话就是,如果预测结果是旧类,那就不去管;而如果预测到的是新类,由于模型是倾向于预测成新类的,此时犯错概率更大些,因此做一个修正。修正依据则是储存的旧模型的预测倾向,其中μP(Ci)\mu^{P}(C_{i})μP(Ci​)与μN(Ci)\mu^{N}(C_{i})μN(Ci​)分别为类别iii在所有PPP个旧类上的平均预测概率与所有NNN个新类上的平均预测概率。显然μP(Ci)\mu^{P}(C_{i})μP(Ci​)是会比μN(Ci)\mu^{N}(C_{i})μN(Ci​)大一些的,因此通过p(Ci)×μP(Ci)μN(Ci)p\left(C_{i}\right) \times \frac{\mu^{P}\left(C_{i}\right)}{\mu^{N}\left(C_{i}\right)}p(Ci​)×μN(Ci​)μP(Ci​)​可以进行第一步的修正;μ(MN)\mu(\mathcal{M}_{N})μ(MN​)与μ(MP)\mu(\mathcal{M}_{P})μ(MP​)为旧模型MP\mathcal{M}_{P}MP​与新模型MC\mathcal{M}_{C}MC​的置信程度(所有类的平均预测概率),从而完成了第二步修正。可以看到,为了完成这一修正过程,需要额外维持旧模型的状态(旧的预测偏好),这就是本文所提到的第二个内存。

[论文阅读] IL2M: Class Incremental Learning With Dual Memory相关推荐

  1. [论文阅读] Large Scale Incremental Learning

    论文地址:https://openaccess.thecvf.com/content_CVPR_2019/html/Wu_Large_Scale_Incremental_Learning_CVPR_2 ...

  2. [论文阅读] Active Class Incremental Learning for Imbalanced Datasets

    论文地址:https://arxiv.org/abs/2008.10968 发表于:ECCV 20 Workshop Abstract 增量学习(IL)使人工智能系统能够适应流式数据.大多数现有的算法 ...

  3. 论文阅读笔记:SCAN: Learning to Classify Images without Labels

    论文阅读笔记:SCAN: Learning to Classify Images without Labels 摘要 简介和相关工作 方法 表征学习 语义聚类损失 2.3 通过自标记进行微调 3 实验 ...

  4. Zero-shot Learning零样本学习 论文阅读(一)——Learning to detect unseen object classes by between-class attribute

    Zero-shot Learning零样本学习 论文阅读(一)--Learning to detect unseen object classes by between-class attribute ...

  5. 年龄论文阅读——Deep Label Distribution Learning With Label Ambiguity

    论文阅读--Deep Label Distribution Learning With Label Ambiguity 版权声明:本文为博主原创文章,未经博主允许不得转载.https://blog.c ...

  6. 【论文阅读】Attributed Graph Clustering with Dual Redundancy Reduction(AGC-DRR)

    [论文阅读]Attributed Graph Clustering with Dual Redundancy Reduction(AGC-DRR) 文章目录 [论文阅读]Attributed Grap ...

  7. 论文阅读|node2vec: Scalable Feature Learning for Networks

    论文阅读|node2vec: Scalable Feature Learning for Networks 文章目录 论文阅读|node2vec: Scalable Feature Learning ...

  8. 【论文阅读】Neural Transformation Learning for Deep Anomaly Detection Beyond Images 异常检测,可学习变换,时间序列,表格数据

    本博客系博主阅读论文之后根据自己理解所写,非逐字逐句翻译,预知详情,请参阅论文原文. 论文标题:Neural Transformation Learning for Deep Anomaly Dete ...

  9. 【论文阅读】Occupancy Networks: Learning 3D Reconstruction in Function Space

    论文题目:Occupancy Networks: Learning 3D Reconstruction in Function Space(占据网络:在函数空间内学习三维重建,简称ONet) 论文作者 ...

最新文章

  1. ionic之点击放大图片
  2. 切换运行时用户以及用户组
  3. 雾霾经济:这10款产品,马云看了都想投资
  4. c++ char*初始化_C开发实战-深入理解指针
  5. java 异步得到函数返回值_使用JavaScript进行异步编程
  6. Python黑帽编程2.8 套接字编程
  7. 使用jsp实现文件上传的功能
  8. 吐槽:Lambda表达式
  9. this.$modal.confirm 自定义按钮关闭_【勤哲资料】7.6 自定义打印
  10. Spring Boot Transactional注解源码阅读笔记(二)
  11. [转载] Go语言的自重写程序
  12. ld: warning: cannot find entry symbol _start; defaulting to 00000000080481d8
  13. jsp+servlet实现最基本的注册登陆功能
  14. apollo local 模式_Apollo开发者说丨使用GDB调试Apollo项目
  15. 自动把动态的jsp页面(或静态html)生成PDF文档,并且上传至服务器
  16. PostgreSQL 命令行客户端 psql 使用指南
  17. kodi树莓派_树莓派投屏秒变家庭影院(安装 kodi
  18. 什么是RS485总线?怎么使用RS485总线?——转自微信公众号弱点课堂
  19. win10没有声音(扬声器一直显示未插入)
  20. APP-安装cisco anyconncet app for mac inter

热门文章

  1. mac mysql打不开闪一下_mac系统上 MySQL Workbench意外退出,再也打不开
  2. 昭阳k42-80可以装linux么,华硕K420JC 双显卡 本本 能装ubuntu吗
  3. runtime 分类结构体_几种常见滚动轴承的分类方法
  4. @value注解取不到值_教学笔记:Java注解及自定义注解示例
  5. 度度熊的01世界 DFS
  6. 《南溪的目标检测学习笔记》的笔记目录
  7. MATLAB中数组的原始索引和线性索引之间相互进行转换
  8. 关于Cohen-Sutherland算法和Liang-Barsky算法
  9. 一行命令直接拷贝ssh公钥到远程服务器
  10. R语言将一列分解为多列