什么是长尾分布?

长期以来研究人员做图像、文本分类时使用的大多是均衡数据集:MNIST, CIFAR 10, CIFAR 100等,但是现实生活中的数据分布是非常不均衡的。有的类会占绝大多数,有的类别却很少出现。如果对这种分布不加以考虑,会导致尾部类别(tail)的预测结果受到很大影响,会严重的偏向头部类(head),如图所示:

目前对于长尾分布已经有很多工作去优化、考虑,在这里对最近自己看的论文进行总结。

计算机视觉

Class-Balanced Loss Based on Effective Number of Samples cvpr 2019
论文地址

这篇文章从有效数字的角度出发,考虑到每一个类别中数目的不一样,在损失函数中显式地去加入类别>相关的参数,使得分类结果得到提高。并且对CIFAR 10和CIFAR 100进行处理,手动地让它成为长尾数据集

Rethinking Class-Balanced Methods for Long-Tailed Visual Recognition from a Domain Adaptation Perspective CVPR 2020
论文地址
该文章认为由于训练集当中数据不多,无法让模型学习到很好的表征,所以从域适应的角度来考虑,对于目标域t (测试集)以及源域s (训练集) 对于尾类y 的 Pt(x∣y)/Ps(x∣y)P_t(x|y)/P_s(x|y)Pt​(x∣y)/Ps​(x∣y)并不相等,然而这个条件分布并没有办法直接估计,所以在论文中去学习这个参数,使得结果相比于上一篇有了进一步提升。

BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition CVPR 2020
论文地址
该篇文章提出了一种两分支模型,分别利用uniform sampler 和 reverse sampler进行数据采样之后,利用共享的特征提取器提取特征,最后用累积学习的方法学习分类器,最后得到loss。

Equalization Loss for Long-Tailed Object Recognition CVPR 2020
论文地址
一个类别的每个正样本可以被视为其他类别的负样本,使尾部类别接收更多负的梯度。基于在,该文章提出了均衡损失,通过简单地忽略稀有类别的梯度来解决长尾稀有类别的问题。均衡损失保护在网络中处于不利地位的类别参数更新。

Equalization Loss v2: A New Gradient Balance Approach for Long-tailed Object Detection CVPR 2021
论文地址
Equalization loss的改良版

Overcoming Classifier Imbalance for Long-tail Object Detection with Balanced Group Softmax CVPR 2020
论文地址
还没看

Learning From Multiple Experts: Self-paced Knowledge Distillation for Long-tailed Classification ECCV 2020
论文地址

DECOUPLING REPRESENTATION AND CLASSIFIER FOR LONG-TAILED RECOGNITION ICLR 2020
论文地址
这篇文章提出了在长尾分布数据集下进行训练的时候,表征学习是正常的(采用正常采样方法,而不是基于类别进行采样),不正常的是分类器(classifier)。所以这篇文章提出了两阶段学习,第一阶段正常训练,但是二阶段只保留backbone,利用多种方法对分类器进行重构:重新训练分类器,分类器正则,最近邻等,最后达到了最佳性能。

Identifying and Compensating for Feature Deviation Imbalanced Deep Learning Nips2020
论文地址
该文章提出了CDT loss,假设原始分类器某一类权重为ziz_izi​,那么这个loss就是对其做如下处理:ziα\frac{z_i}{\alpha}αzi​​,其中α=Nmax/Ni\alpha=N_{max}/N_iα=Nmax​/Ni​,NmaxN_{max}Nmax​代表类别数最多的类包含的训练集数量,NiN_iNi​代表第i类所有的训练集数量

Balanced Meta-Softmax for Long-Tailed Visual Recognition Nips2020
论文地址
该文章提出了BSCEloss,假设原始分类器某一类权重为ziz_izi​,那么这个loss就是对其做如下处理:zi^=zi+log(Ni)\hat{z_i}=z_i+log(N_i)zi​^​=zi​+log(Ni​),NiN_iNi​代表第i类所有的训练集数量。BSCE和CDT虽然非常简单,但是效果出奇的好

Long-Tailed Classification by Keeping the Good and Removing the Bad Momentum Causal Effect NIPS 2020
论文地址
这篇文章从上一篇文章进行讨论,端到端学习一直是深度学习的目标,但是上一篇论文采用两阶段训练的效果反而更好,这是让人费解的。他们在研究过程中发现SGD的动量momentum是引入数据分布的原因,但是单纯地去掉动量效果会极大的变差。于是他们考虑保留动量好的部分,去掉动量坏的部分,最终达到了更好的结果。
这篇文章涉及非常多的理论知识,很难懂,推荐去作者的知乎去学习:链接

Improving Calibration for Long-Tailed Recognition CVPR 2021
论文地址
这篇文章讨论了深度学习模型的校准错误(Expected Calibration Error)ECE,发现当引入了长尾之后模型的ECE急剧升高,但是现有的方法并没有改善。于是使用了mixup策略,label aware smoothing和BN层的shift learning来提高性能。

Contrastive Learning based Hybrid Networks for Long-Tailed Image Classification CVPR 2021
论文地址
采用了对比学习和课程学习的方法,在一阶段过程中训练backbone和分类器,并得到了最优的结果。

Distribution Alignment: A Unified Framework for Long-tail Visual Recognition CVPR 2021
论文地址
这篇文章指出了两阶段框架下对classifier的不同调整方式,假设原始分类器某一类的权重为ziz_izi​,对它进行变换之后的结果为zi^=αzi+β\hat{z_i } = \alpha z_i+\betazi​^​=αzi​+β,在这里α\alphaα被称为magnitude,β\betaβ被称为margin。以前的工作有调整magnitude的,也有调整margin的,但是这个工作把两者都考虑进来并且一起训练,取得了最好的效果

PML: Progressive Margin Loss for Long-tailed Age Classification CVPR 2021
论文地址

MetaSAug: Meta Semantic Augmentation for Long-Tailed Visual Recognition CVPR 2021
论文地址
该文章利用了一种Nips2020里的一种隐式数据增强的手法,并且用元学习来训练这种数据增强方法所需的协方差,最后达到了很好的性能(CIFAR100-100的数据集中能有48%的acc)

Bag of Tricks for Long-Tailed Visual Recognition with Deep Convolutional Neural
Networks
AAAI 2021
论文地址
对现有的long tail的方法进行总结,并且集合各种trick来验证哪些trick可以同时使用,哪些trick是冲突的,给出了trick的最优组合。

LONG-TAILED RECOGNITION BY ROUTING DIVERSE DISTRIBUTION-AWARE EXPERTS ICLR 2021
论文地址
提出了Routing Diverse Experts 来同时减少长尾分类的分类器的bias 和 variance。主要分成三个idea:1. 多个分类器共享结构。 2. 分布感知的 diversity loss 3. 专家(expert)(classifier)路由模块
截止笔者目前看到的SOTA

Test-Agnostic Long-Tailed Recognition by Test-Time Aggregating Diverse Experts with Self-Supervision ICCV 2021
论文地址

Parametric Contrastive Learning ICCV 2021
论文地址
改进对比学习学习类别的表征(和improving Calibration … 是同一团队)

ACE: Ally Complementary Experts for Solving Long-Tailed Recognition in One-Shot ICCV 2021 Oral
论文地址

Breadcrumbs: Adversarial Class-Balanced Sampling for Long-tailed Recognition
论文地址

GistNet: a Geometric Structure Transfer Network for Long-Tailed Recognition ICCV 2021
论文地址
短文

Class-Balanced Distillation for Long-Tailed Visual Recognition ICCV 2021
论文地址
蒸馏这么有用吗.jpg

Adaptive Logit Adjustment Loss for Long-Tailed Visual Recognition AAAI 2022
论文地址
多Experts 还是管用.jpg

Memory-based jitter: Improving visual recognition on long-tailed data with diversity in memory AAAI 2022
论文地址
也是配合多experts的

Imagine by Reasoning: A Reasoning-Based Implicit Semantic Data Augmentation for Long-Tailed Classification AAAI 2022
论文地址
隐式数据增强类文章,但是实验对比是不公平的

文本分类

在文本分类当中long tail的现象也有,但是文本的label大多是multi label,和图像的单label不一样。所以处理的方式也有所差别

Deep Learning for Extreme Multi-label Text Classification SIGIR 2017
论文地址
开山之作,没什么好说的,idea在现在看来也比较简单

SGM: Sequence Generation Model for Multi-Label Classification COLING 2018
论文地址
采用seq2seq的方法来预测label

AttentionXML: Label Tree-based Attention-Aware Deep Model for High-Performance Extreme Multi-Label Text Classification NIPS 2019
论文地址
构造label tree,然后分层构造模型来进行预测。

Taming Pretrained Transformers for Extreme Multi-label Text Classification SIGKDD 2020
论文地址
首先利用二叉树将label进行聚类,然后模型先预测label在哪个簇里,簇内利用ranking model进行预测。

Long tailed 长尾分布论文汇总相关推荐

  1. 恒源云(GPUSHARE)_长尾分布的多标签文本分类平衡方法(论文学习笔记)

    文章来源 | 恒源云社区(专注人工智能/深度学习云GPU服务器训练平台,官方体验网址:https://gpushare.com/center/) 原文地址 | https://bbs.gpushare ...

  2. 长尾分布系列论文解析(一)Decoupling Representation and Classifier for Long-Tailed Recognition

    大纲 引言 分类问题中的长尾分布 采样策略 解耦训练 实验结果 总结 引言  看了挺多长尾分布的论文,从中获益匪浅,长尾分布的问题并不仅仅只局限于早期的分类问题之中,而是广泛存在于深度学习的多项任务之 ...

  3. 损失函数——长尾分布 / Equalization Loss【论文笔记】

    Contents 1 前言 1.1 重采样(re-sampling) 1.2 重加权(re-weighting) 2 softmax/sigmoid cross-entropy 2.1 softmax ...

  4. CVPR 2021论文解读 | 长尾分布问题解决新思路

    收录会议:CVPR 2021 论文单位:旷视研究院 论文链接:https://arxiv.org/abs/2103.16370 论文代码:https://github.com/Megvii-BaseD ...

  5. EMNLP 2021 | 多标签文本分类中长尾分布的平衡策略

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者 | 黄毅 作者简介:黄毅,本文一作,目前为罗氏集团的数据科学家 ...

  6. CVPR2021最新接收论文合集!22个方向100+篇论文汇总

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 导读 CVPR2021结果已出,本文为CVPR最新接收论文的资源汇总贴,附有相关文章与代码链接. 官网 ...

  7. 【学术相关】CVPR2021最新接收论文合集!22个方向100+篇论文汇总|持续更新

    报道丨极市平台 导读 CVPR2021结果已出,本文为CVPR最新接收论文的资源汇总贴,附有相关文章与代码链接. 文章在Github上持续更新,欢迎大家 star/fork(点击阅读原文即可跳转): ...

  8. ICCV 2021 LVIS Challenge 长尾分布实例分割挑战赛,冠军解决方案

    关注公众号,发现CV技术之美 本文为52CV粉丝投稿. 本文介绍在 ICCV 2021 LVIS Challenge Workshop上的冠军解决方案:『LVIS Challenge Track Te ...

  9. ECCV 2022|计算机视觉中的长尾分布问题还值得做吗?

    点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心技术交流群 后台回复[ECCV2022]获取ECCV2022所有自动驾驶方向论文! 后台 ...

最新文章

  1. OpenCV中cvBlobsLib的编译与使用
  2. Java Array 常见报错
  3. 鼠标滚轮控制panel滚动条
  4. 如何进行5万并发用户负载测试?
  5. Java 中的多线程你只要看这一篇就够了
  6. [html] html标签中的lang属性有什么作用?
  7. Unity2020.1新功能探路:脚本开发相关更新
  8. 深度解析Android中字体设置
  9. ECSHOP的订单状态在数据库中的表现(order_status, shipping_status, pay_status)
  10. 人情味,让你的内容脱颖而出
  11. HTML基础整理(From表单)
  12. 题解 P1217 【[USACO1.5]回文质数 Prime Palindromes】
  13. 计算机挂个硬盘显示格式化怎么解决,硬盘提示格式化怎么办?硬盘数据怎么恢复?...
  14. 中文字体库转换成16X16点阵 另外附上ASCII码转换8X16点阵
  15. 戴维斯分校 计算机硕士,2017年美国加州大学戴维斯分校研究生申请之计算机......
  16. java实践课程感想_Java课程总结与感想
  17. EDA实验(3)计数器设计
  18. 争对让望对思野葛对山栀注解_争对让,望对思的下一句是什么?
  19. myeclipse中遇到代码run as后只有run configurations的情况
  20. android gridview 设置字体,我想为GridView设置字体

热门文章

  1. 制造业和物流行业的WMS系统差别在哪?
  2. 【ZJOI2005】沼泽鳄鱼
  3. 1898: [Zjoi2005]Swamp 沼泽鳄鱼
  4. python列表拆包_python元组拆包
  5. 交换机/路由器实验:最后说些什么
  6. 发声 | 再访《Scratch少儿趣味编程》系列图书作者阿部和广访谈问题有奖征集...
  7. 使用腾讯云轻量应用服务器搭建网络质量拨测工具 SmokePing
  8. 阿里云国际站实名认证上传材料填写样例(域名持有者为组织)
  9. 【Spark NLP】第 16 章:对象字符识别(OCR)
  10. 关于协作与个人英雄主义