[论文阅读] IL2M: Class Incremental Learning With Dual Memory
论文地址:https://openaccess.thecvf.com/content_ICCV_2019/html/Belouadah_IL2M_Class_Incremental_Learning_With_Dual_Memory_ICCV_2019_paper.html
代码:https://github.com/EdenBelouadah/class-incremental-learning/tree/master/il2m/
发表于:ICCV 19
Abstract
本文提出了一种类增量学习(IL)方法,它利用微调和双重内存来减少图像识别中灾难性遗忘的负面影响。首先,我们简化了目前基于微调的方法,该方法使用分类和蒸馏损失的组合来补偿过去数据的有限可用性。我们发现,在允许有记忆的情况下,蒸馏项实际上损害了性能。然后,我们修改了通常的类增量学习内存模块。与现有的工作类似,第一个内存存储过去类的示范图像。这里引入了第二个内存,以存储最初学习时获得的过去的类的统计数据。这里的直觉是,当所有的数据都可用时,类是最好的模型,而且它们的初始统计数据在不同的增量状态下是有用的。在推理过程中会出现对新学的类的预测偏差,因为数据集对它们是不平衡的。挑战在于如何使新的和过去的类的预测更具有可比性。为了做到这一点,通过利用两个内存的内容,对过去的类的分数进行纠正。该方法在内存和推理复杂性方面的额外成本可以忽略不计。对三个大型公共数据集的实验表明,所提出的方法比一系列有竞争力的最先进的方法更有效。
Method
本文是一种典型的依赖于示例(exemplar)样本的类增量学习方法。从标题可以看出,本文的核心创意在于多了一个内存。不过,多的那个内存并不和传统的内存一样是存储示范样本用的,而存的是一些别的信息,用于纠正预测偏差。总体流程如下所示:
在图中,MMM表示各个增量阶段的模型,XXX为训练样本,CCC为预测结果。KKK为传统的内存,用于储存旧类的示范。可以看到,由于内存容量是固定的,随着新类的不断加入,旧类的样本数量会不断降低,从而加剧类不均衡现象,导致模型更倾向于去预测新类。而为了纠正这个预测偏差,本文引入了个额外的内存SSS,以维护各类的状态。
现在来看本文的具体方法。首先,对于类别iii的原始预测结果p(Ci)p(C_i)p(Ci),进行修正如下:pr(Ci)={p(Ci)×μP(Ci)μN(Ci)×μ(MN)μ(MP),if pred =new p(Ci),otherwise p^{r}\left(C_{i}\right)= \begin{cases}p\left(C_{i}\right) \times \frac{\mu^{P}\left(C_{i}\right)}{\mu^{N}\left(C_{i}\right)} \times \frac{\mu\left(\mathcal{M}_{N}\right)}{\mu\left(\mathcal{M}_{P}\right)}, & \text { if pred }=\text { new } \\ p\left(C_{i}\right), & \text { otherwise }\end{cases} pr(Ci)={p(Ci)×μN(Ci)μP(Ci)×μ(MP)μ(MN),p(Ci), if pred = new otherwise 上面这个公式换成人话就是,如果预测结果是旧类,那就不去管;而如果预测到的是新类,由于模型是倾向于预测成新类的,此时犯错概率更大些,因此做一个修正。修正依据则是储存的旧模型的预测倾向,其中μP(Ci)\mu^{P}(C_{i})μP(Ci)与μN(Ci)\mu^{N}(C_{i})μN(Ci)分别为类别iii在所有PPP个旧类上的平均预测概率与所有NNN个新类上的平均预测概率。显然μP(Ci)\mu^{P}(C_{i})μP(Ci)是会比μN(Ci)\mu^{N}(C_{i})μN(Ci)大一些的,因此通过p(Ci)×μP(Ci)μN(Ci)p\left(C_{i}\right) \times \frac{\mu^{P}\left(C_{i}\right)}{\mu^{N}\left(C_{i}\right)}p(Ci)×μN(Ci)μP(Ci)可以进行第一步的修正;μ(MN)\mu(\mathcal{M}_{N})μ(MN)与μ(MP)\mu(\mathcal{M}_{P})μ(MP)为旧模型MP\mathcal{M}_{P}MP与新模型MC\mathcal{M}_{C}MC的置信程度(所有类的平均预测概率),从而完成了第二步修正。可以看到,为了完成这一修正过程,需要额外维持旧模型的状态(旧的预测偏好),这就是本文所提到的第二个内存。
[论文阅读] IL2M: Class Incremental Learning With Dual Memory相关推荐
- [论文阅读] Large Scale Incremental Learning
论文地址:https://openaccess.thecvf.com/content_CVPR_2019/html/Wu_Large_Scale_Incremental_Learning_CVPR_2 ...
- [论文阅读] Active Class Incremental Learning for Imbalanced Datasets
论文地址:https://arxiv.org/abs/2008.10968 发表于:ECCV 20 Workshop Abstract 增量学习(IL)使人工智能系统能够适应流式数据.大多数现有的算法 ...
- 论文阅读笔记:SCAN: Learning to Classify Images without Labels
论文阅读笔记:SCAN: Learning to Classify Images without Labels 摘要 简介和相关工作 方法 表征学习 语义聚类损失 2.3 通过自标记进行微调 3 实验 ...
- Zero-shot Learning零样本学习 论文阅读(一)——Learning to detect unseen object classes by between-class attribute
Zero-shot Learning零样本学习 论文阅读(一)--Learning to detect unseen object classes by between-class attribute ...
- 年龄论文阅读——Deep Label Distribution Learning With Label Ambiguity
论文阅读--Deep Label Distribution Learning With Label Ambiguity 版权声明:本文为博主原创文章,未经博主允许不得转载.https://blog.c ...
- 【论文阅读】Attributed Graph Clustering with Dual Redundancy Reduction(AGC-DRR)
[论文阅读]Attributed Graph Clustering with Dual Redundancy Reduction(AGC-DRR) 文章目录 [论文阅读]Attributed Grap ...
- 论文阅读|node2vec: Scalable Feature Learning for Networks
论文阅读|node2vec: Scalable Feature Learning for Networks 文章目录 论文阅读|node2vec: Scalable Feature Learning ...
- 【论文阅读】Neural Transformation Learning for Deep Anomaly Detection Beyond Images 异常检测,可学习变换,时间序列,表格数据
本博客系博主阅读论文之后根据自己理解所写,非逐字逐句翻译,预知详情,请参阅论文原文. 论文标题:Neural Transformation Learning for Deep Anomaly Dete ...
- 【论文阅读】Occupancy Networks: Learning 3D Reconstruction in Function Space
论文题目:Occupancy Networks: Learning 3D Reconstruction in Function Space(占据网络:在函数空间内学习三维重建,简称ONet) 论文作者 ...
最新文章
- ionic之点击放大图片
- 切换运行时用户以及用户组
- 雾霾经济:这10款产品,马云看了都想投资
- c++ char*初始化_C开发实战-深入理解指针
- java 异步得到函数返回值_使用JavaScript进行异步编程
- Python黑帽编程2.8 套接字编程
- 使用jsp实现文件上传的功能
- 吐槽:Lambda表达式
- this.$modal.confirm 自定义按钮关闭_【勤哲资料】7.6 自定义打印
- Spring Boot Transactional注解源码阅读笔记(二)
- [转载] Go语言的自重写程序
- ld: warning: cannot find entry symbol _start; defaulting to 00000000080481d8
- jsp+servlet实现最基本的注册登陆功能
- apollo local 模式_Apollo开发者说丨使用GDB调试Apollo项目
- 自动把动态的jsp页面(或静态html)生成PDF文档,并且上传至服务器
- PostgreSQL 命令行客户端 psql 使用指南
- kodi树莓派_树莓派投屏秒变家庭影院(安装 kodi
- 什么是RS485总线?怎么使用RS485总线?——转自微信公众号弱点课堂
- win10没有声音(扬声器一直显示未插入)
- APP-安装cisco anyconncet app for mac inter
热门文章
- mac mysql打不开闪一下_mac系统上 MySQL Workbench意外退出,再也打不开
- 昭阳k42-80可以装linux么,华硕K420JC 双显卡 本本 能装ubuntu吗
- runtime 分类结构体_几种常见滚动轴承的分类方法
- @value注解取不到值_教学笔记:Java注解及自定义注解示例
- 度度熊的01世界 DFS
- 《南溪的目标检测学习笔记》的笔记目录
- MATLAB中数组的原始索引和线性索引之间相互进行转换
- 关于Cohen-Sutherland算法和Liang-Barsky算法
- 一行命令直接拷贝ssh公钥到远程服务器
- R语言将一列分解为多列