一、动机

单阶段长尾识别方法以“跷跷板”的方式提高整体性能,即要么牺牲头部的准确度以获得更好的尾部分类,要么将头部的准确度提高得更高,但忽略尾部的性能,因此提出一种解决数据长尾分布的模型。

之前解决方法:

大多数重新平衡方法通过牺牲大多数类的性能来提高少数类的性能, 包括重新采样和重新加权

数据扩充对头部有效,但对尾部有轻微伤害

具体步骤:

在共享Backbone之后,多个专家被分支出来,并有单独的可学习块和预测层。Distributed-adaptive optimizer为每个专家分配不同但重叠的类别划分,包括目标类别(TC)和干扰类别(IC)。这些专家会对输入的图像进行判断,最后,通过对每个数据分割中重新缩放的Logit进行平均,汇总专家的预测。

细节:

专家对类的分配:

并不是所有的专家都要参与所有类的判断。

假设有K个专家,有C个类别

对于C,如果i<j,第i个类的数量>第j个类的的数量

第i个专家需要参与的类集合有Ci,那么,同时保证类有重叠,即CiCj≠∅

对于第i个专家,它的目标类是

它的干扰类是,也就是第个类及前面的所有类,这样保证把少数类作为目标类的专家很多。

根据完全连接层的权重标准,将其进一步调整为z^i,以具有可比性

可以从中看出,第1个专家的目标类是所有的类,它没有干扰类

越往后的专家目标类越少,干扰类越多

当汇集目标类对应专家的结果取平均值,就是输出

损失函数

zi可以理解为第i个专家输出的特征向量

损失函数分别应用于每个专家,而不是聚合输出

除了对指定的目标类别进行分类外,每个专家对他们从未见过的类别的回答不应影响其他专家,即干扰类别(IC)。对于专家本身来说,IC中的类别也是造成混淆的主要原因。通过消除IC的影响,专家们以互补而非竞争的方式工作。因此,需要一个正则化项来抑制IC的输出

学习率:

带有随机梯度下降(SGD)优化器的小批量训练网络的线性缩放规则:当小批量大小乘以k时,学习率乘以k。所有其他超参数(权重衰减、动量等)保持不变。根据这条规则,为了避免过度拟合,优化器应该了解分布情况,为使用较少数据进行训练的Ei分配较小的权重。将基本学习率表示为η0,这是所有类别专家的学习率,第i位专家的训练方式为

其中,N={n1,n2,…nC}是每个类中的样本数,假定N降序。E1的损失函数会更新E1的主干和参数,i>1的Li只会更新专家本身。原因是由于数据重叠,错误可能重复,这意味着主干可能会由于同一错误而被多次更正。这类似于重新加权方法的想法,这会损害表征学习。因此,只有E1,也就是目标类是所有类的专家更新主干。

消融实验

  1. ACE与其他方法进行对比

2.专家架构的对比

2.1有无Lcom函数

将非目标组的权重设置为零作为硬约束,而不是学习以软正则化方式使用Lcom抑制它们

2.2有无干扰类

3.学习率设置的对比

这三种方案都比基线方案产生更好的结果。促进了大多数类别的更高改善,同时显著减少了尾部。原因是一些专家过早收敛,因此由于过度拟合而导致尾类性能不佳。表现出相似的性能,而在中数类和少数类时表现更好。

4.输出的决定

:有缩放的取平均

:取最大的概率

:各取一部分,取的是属于自己目标类的一部分

:无缩放的取平均

ACE: Ally Complementary Experts for Solving Long-Tailed Recognition in One-Shot(2022.5.27)相关推荐

  1. Long tailed 长尾分布论文汇总

    什么是长尾分布? 长期以来研究人员做图像.文本分类时使用的大多是均衡数据集:MNIST, CIFAR 10, CIFAR 100等,但是现实生活中的数据分布是非常不均衡的.有的类会占绝大多数,有的类别 ...

  2. 计算机视觉最新进展概览(2021年8月1日到2021年8月7日)

    1.GraphFPN: Graph Feature Pyramid Network for Object Detection 在需要多尺度特征的图像理解任务中,特征金字塔已经被证明是强大的.最先进的多 ...

  3. ICCV 2021 最新200篇ICCV2021论文分方向汇总

    ICCV 2021 结果出炉!最新200篇ICCV2021论文分方向汇总(更新中) - 知乎 不久前,计算机视觉三大顶会之一ICCV2021接收结果已经公布,本次ICCV共计 6236 篇有效提交论文 ...

  4. 【论文阅读】Revisiting Long-tailed Image Classification: Survey and Benchmarks with New Evaluation Metrics

    综述内容 Abstract Recently, long-tailed image classification harvests lots of research attention, since ...

  5. FastDeRain解读

    Abatract In this paper, we propose a novel video rain streak removal approach FastDeRain, which full ...

  6. hr 软件 初创企业_面向企业和初创企业的顶级软件开发公司

    hr 软件 初创企业 Every day we hear about new budding software programs. With the rapid advances in the sof ...

  7. Deep Residual Learning for Image Recognition(ResNet)论文翻译及学习笔记

    [论文翻译]:Deep Residual Learning for Image Recognition [论文来源]:Deep Residual Learning for Image Recognit ...

  8. 图像分类经典卷积神经网络—ResNet论文翻译(中英文对照版)—Deep Residual Learning for Image Recognition(深度残差学习的图像识别)

    图像分类经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为中英文对照版,纯中文版请稳步:[ResNet纯中文版] Deep Residual Learning for Image ...

  9. 【论文翻译】Learning Generalizable and Identity-Discriminative Representations for Face Anti-Spoofing

    Abstract 由于人脸认证系统的高安全性需求,面部反欺骗(a.k.a演示攻击检测)已引起越来越多的关注.当训练和测试欺骗样本拥有相似的模式时,现有的基于CNN的方法通常很好地识别欺骗攻击,但它们的 ...

最新文章

  1. 2018-3-22论文一种新型的智能算法--狼群算法(笔记三)算法的步骤+收敛性分析
  2. DataGrid中,读取数据库中的图片并绑定数据列或磁盘目录中的图片,用输出流方式...
  3. python基础语法有哪些-Python基础语法知识有哪些?
  4. mysql(待完善)
  5. numpy 线性代数_数据科学家的线性代数—用NumPy解释
  6. C# Azure 存储-Blob
  7. 引导linux为什么要用实模式,Linux引导过程与故障排除|第1章:Linux启动流程详解...
  8. 经典算法详解 之 递归算法
  9. 【elasticsearch】Elasticsearch : alias数据类型
  10. python读取文件路径乱码 linux_Python之pandas读写文件乱码的解决方法
  11. 思科交换机配置链路聚合
  12. web服务器与web框架
  13. ebp 函数堆栈esp_2.1ebp,esp与call
  14. 苹果+android+扫码支付,苹果iOS12捷径扫码付款怎么设置 微信支付宝扫码二合一支付捷径...
  15. [Unity Shader] 水纹着色器 Water Shader
  16. NLP之逆向最大匹配算法(BMM)
  17. 图片360度无死角自由旋转
  18. Java插件自动保存浏览器书签_EverSync插件,浏览器书签同步插件,支持Chrome和Firefox书签同步...
  19. Python-自动下载抖音无水印高清视频
  20. java1.7 apk 签名_【keytool jarsigner工具的使用】Android 使用JDK1.7的工具 进行APK文件的签名,以及keystore文件的使用...

热门文章

  1. 神经网络模型u-net 、VGG
  2. 微信 mac 版 3.* beta 可以查看朋友圈了
  3. android 复制屏幕,iphone或者android的手机或者pad可以屏幕复制到Z1上了!
  4. thinkcmf5 pc手机模板切换
  5. 插上网线进入转发状态需要等30s,是什么问题?-网络热门问题分析
  6. Spark 2.4.8 提交应用
  7. mount: special device /dev/vgdata/lv_ora does not exist,centos系统LV status状态为Not avaliable问题排查及处理
  8. 027 Rust死灵书之Vec内存分配
  9. 巧妙利用博客来推广网站的方法
  10. Vulnstack(四)