文章目录

  • 主要内容
    • 采样方式
    • 权重 α \alpha α
    • Inference phase
  • 代码

Zhu B., Cui Q., Wei X. and Chen Z. BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition. CVPR 2020.

数据的长短尾效应是当前比较棘手的问题, 本文提出用分支网络来应对这一问题, 并取得了不错的结果.

主要内容

这篇文章的创新点是用两个分支来适应数据的不平衡.
如图所示, 上面的分支用于标准的训练, 而下面的分支则采用适合不平衡数据的训练方式: 即一般的训练是均匀的采样分布, 而非标准训练采用的是一个非均匀的依赖于样本分布的.

通过均匀采样得到 ( x c , y c ) (x_c, y_c) (xc​,yc​), 通过非均匀采样得到 ( x r , y r ) (x_r, y_r) (xr​,yr​), 分别喂入上下分支得到特征表示 f c f_c fc​和 f r f_r fr​.
注意到, 上下两个分支是共享部分参数的, 作者实际选择的是残差网络, 设定为除了最后一个residual block外均是共享的.

根据 f c f_c fc​和 f r f_r fr​进一步得到
z = α W c T f c + ( 1 − α ) W r T f r , z = \alpha W^T_c f_c + (1-\alpha) W_r^T f_r, z=αWcT​fc​+(1−α)WrT​fr​,
即 [ z 1 , z 2 , ⋯ , z C ] T [z_1, z_2,\cdots, z_C]^T [z1​,z2​,⋯,zC​]T.
得到相应的概率向量
p ^ i = e z i ∑ i = 1 C e z j . \hat{p}_i = \frac{e^{z_i}}{\sum_{i=1}^{C}e^{z_j}}. p^​i​=∑i=1C​ezj​ezi​​.
最后通过下列损失函数进行训练
L = α E ( p ^ , y c ) + ( 1 − α ) E ( p ^ , y r ) . \mathcal{L} = \alpha E(\hat{p}, y_c) + (1-\alpha)E(\hat{p}, y_r). L=αE(p^​,yc​)+(1−α)E(p^​,yr​).
实际上, α \alpha α就是一个调整标准训练和处理不平衡数据的权重.

采样方式

对于非均匀分布, 作者采取了如下方式构造采样分布, 假设每个类的样本数目为 N i , i = 1 , 2 , … , C N_i, i=1,2,\ldots,C Ni​,i=1,2,…,C. 则采样比例为
P i = w i ∑ j = 1 C w j , P_i = \frac{w_i}{\sum_{j=1}^C w_j}, Pi​=∑j=1C​wj​wi​​,
其中 w i = 1 N i w_i=\frac{1}{N_i} wi​=Ni​1​.

权重 α \alpha α

作者采用的是这样的一种方案
α = 1 − ( T T m a x ) 2 , \alpha = 1 - (\frac{T}{T_{max}})^2, α=1−(Tmax​T​)2,
其中 T T T为当前的epoch, T m a x T_{max} Tmax​为总的训练epochs.
在实际测试中, 作者也尝试了一些别的方案, 不过别的方案不如此方案理想.
直观上的解释就是, 训练过程会有普通的训练渐渐偏向re-balance的训练.

Inference phase

在推断过程中, 设定 α = 0.5 \alpha=0.5 α=0.5.

代码

原文代码

BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition相关推荐

  1. BBN:Bilateral-Branch network with cumulative learning for long-tailed visual recognition

    旷视研究院提出双边分支网络BBN:攻坚长尾分布的现实世界任务 - 知乎IEEE 国际计算机视觉与模式识别会议 CVPR 2020 (IEEE Conference on Computer Vision ...

  2. 《BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition》笔记

    Paper:<BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition& ...

  3. 【无标题】RADICAL ANALYSIS NETWORK FOR ZERO-SHOT LEARNING IN PRINTED CHINESE CHARACTER RECOGNITION

    印刷体汉字识别中零次学习的部件分析网络 (RADICAL ANALYSIS NETWORK FOR ZERO-SHOT LEARNING IN PRINTED CHINESE CHARACTER RE ...

  4. BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition

    针对长尾分布中的不平衡分类问题,本文首次发现这些重新平衡方法能够实现令人满意的识别精度,这是因为它们可以显着地促进深度网络的分类学习.但是同时它们也在一定程度上破坏了学习到的深度特征的代表能力. 因此 ...

  5. 【BiSeNet】《BiSeNet:Bilateral Segmentation Network for Real-time Semantic Segmentation》

    ECCV-2018 文章目录 1 Background and Motivation 2 Related Work 3 Advantages / Contributions 4 Method 5 Ex ...

  6. PRN(20200816):A Hierarchical Deep Convolutional Neural Network for Incremental Learning [Tree-CNN]

    Roy D , Panda P , Roy K . Tree-CNN: A Hierarchical Deep Convolutional Neural Network for Incremental ...

  7. 小样本学习 | Learning to Compare: Relation Network for Few-Shot Learning

    博主github:https://github.com/MichaelBeechan 博主CSDN:https://blog.csdn.net/u011344545 Learning to Compa ...

  8. 文献阅读笔记 | Reconstructing commuters network using machine learning and urban indicators

    原文:Spadon, G., de Carvalho, A. C., Rodrigues-Jr, J. F., & Alves, L. G. (2019). Reconstructing co ...

  9. 【Paper】ConvLSTM:Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting

    论文原文 论文下载 论文被引:1651(2020/03/01) 4827(2022/03/26) 论文年份:2015 文章目录 Abstract 1 Introduction 2 Preliminar ...

最新文章

  1. 人工智能伦理如何设定,从种群层面看人类的知识积累和进化
  2. STL: set相关算法
  3. PMCAFF微课堂 (已结束)| 京东平台产品负责人:如何打造一个支撑3200万日订单量的平台型产品
  4. Oracle11g服务详细介绍及哪些服务是必须开启的?
  5. 解决虚拟机 正在决定eht0 的ip信息失败 无链接-- 添加虚拟网卡
  6. [position]返回顶部
  7. java基础学习——14、代码格式
  8. poj 1872 A Dicey Problem (bfs+WordFinal题)
  9. LeetCode刷题目录
  10. pandas之combine_first() 合并重叠数据(修补)
  11. AspNetPager分页控件样式
  12. python刷屏代码_python 刷屏
  13. SAP MTO生产模式和计划策略组
  14. 微信小程序客服可以直接在手机回复吗,小程序客服功能怎么用手机回复,微信小程序客服手机版
  15. SSH密匙key介绍
  16. 国庆头像生成器小程序源码
  17. 计算机图形学与虚拟环境pdf,计算机图形学与虚拟现实环境.ppt
  18. 如何解决弹出 C:\WINDOWS\system32\Macromed\Flash\Flash32_11_2_202_228.ocx 问题。
  19. python羊车门问题_python羊车门问题的正确解答
  20. 视频、图形图像处理之Opencv技术记录(四)、OpenCV教程概述

热门文章

  1. mac系统下启用root用户
  2. 【入门教程】TensorFlow 2 模型:深度强化学习
  3. 利用albert模型提取文本标签
  4. Word中常见的论文三线表(表格)制作
  5. 序列化Serializable serialVersionUID的作用
  6. 阿里云生态峰会实录(中)
  7. 手札 江湖的完美窗口化研究
  8. Manacher思想 SCOI2013 密码
  9. 常见的WebShell管理工具
  10. (2020.9.28)面试记录:软件测试实习生--面试记录