BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition
文章目录
- 概
- 主要内容
- 采样方式
- 权重 α \alpha α
- Inference phase
- 代码
Zhu B., Cui Q., Wei X. and Chen Z. BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition. CVPR 2020.
概
数据的长短尾效应是当前比较棘手的问题, 本文提出用分支网络来应对这一问题, 并取得了不错的结果.
主要内容
这篇文章的创新点是用两个分支来适应数据的不平衡.
如图所示, 上面的分支用于标准的训练, 而下面的分支则采用适合不平衡数据的训练方式: 即一般的训练是均匀的采样分布, 而非标准训练采用的是一个非均匀的依赖于样本分布的.
通过均匀采样得到 ( x c , y c ) (x_c, y_c) (xc,yc), 通过非均匀采样得到 ( x r , y r ) (x_r, y_r) (xr,yr), 分别喂入上下分支得到特征表示 f c f_c fc和 f r f_r fr.
注意到, 上下两个分支是共享部分参数的, 作者实际选择的是残差网络, 设定为除了最后一个residual block外均是共享的.
根据 f c f_c fc和 f r f_r fr进一步得到
z = α W c T f c + ( 1 − α ) W r T f r , z = \alpha W^T_c f_c + (1-\alpha) W_r^T f_r, z=αWcTfc+(1−α)WrTfr,
即 [ z 1 , z 2 , ⋯ , z C ] T [z_1, z_2,\cdots, z_C]^T [z1,z2,⋯,zC]T.
得到相应的概率向量
p ^ i = e z i ∑ i = 1 C e z j . \hat{p}_i = \frac{e^{z_i}}{\sum_{i=1}^{C}e^{z_j}}. p^i=∑i=1Cezjezi.
最后通过下列损失函数进行训练
L = α E ( p ^ , y c ) + ( 1 − α ) E ( p ^ , y r ) . \mathcal{L} = \alpha E(\hat{p}, y_c) + (1-\alpha)E(\hat{p}, y_r). L=αE(p^,yc)+(1−α)E(p^,yr).
实际上, α \alpha α就是一个调整标准训练和处理不平衡数据的权重.
采样方式
对于非均匀分布, 作者采取了如下方式构造采样分布, 假设每个类的样本数目为 N i , i = 1 , 2 , … , C N_i, i=1,2,\ldots,C Ni,i=1,2,…,C. 则采样比例为
P i = w i ∑ j = 1 C w j , P_i = \frac{w_i}{\sum_{j=1}^C w_j}, Pi=∑j=1Cwjwi,
其中 w i = 1 N i w_i=\frac{1}{N_i} wi=Ni1.
权重 α \alpha α
作者采用的是这样的一种方案
α = 1 − ( T T m a x ) 2 , \alpha = 1 - (\frac{T}{T_{max}})^2, α=1−(TmaxT)2,
其中 T T T为当前的epoch, T m a x T_{max} Tmax为总的训练epochs.
在实际测试中, 作者也尝试了一些别的方案, 不过别的方案不如此方案理想.
直观上的解释就是, 训练过程会有普通的训练渐渐偏向re-balance的训练.
Inference phase
在推断过程中, 设定 α = 0.5 \alpha=0.5 α=0.5.
代码
原文代码
BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition相关推荐
- BBN:Bilateral-Branch network with cumulative learning for long-tailed visual recognition
旷视研究院提出双边分支网络BBN:攻坚长尾分布的现实世界任务 - 知乎IEEE 国际计算机视觉与模式识别会议 CVPR 2020 (IEEE Conference on Computer Vision ...
- 《BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition》笔记
Paper:<BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition& ...
- 【无标题】RADICAL ANALYSIS NETWORK FOR ZERO-SHOT LEARNING IN PRINTED CHINESE CHARACTER RECOGNITION
印刷体汉字识别中零次学习的部件分析网络 (RADICAL ANALYSIS NETWORK FOR ZERO-SHOT LEARNING IN PRINTED CHINESE CHARACTER RE ...
- BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition
针对长尾分布中的不平衡分类问题,本文首次发现这些重新平衡方法能够实现令人满意的识别精度,这是因为它们可以显着地促进深度网络的分类学习.但是同时它们也在一定程度上破坏了学习到的深度特征的代表能力. 因此 ...
- 【BiSeNet】《BiSeNet:Bilateral Segmentation Network for Real-time Semantic Segmentation》
ECCV-2018 文章目录 1 Background and Motivation 2 Related Work 3 Advantages / Contributions 4 Method 5 Ex ...
- PRN(20200816):A Hierarchical Deep Convolutional Neural Network for Incremental Learning [Tree-CNN]
Roy D , Panda P , Roy K . Tree-CNN: A Hierarchical Deep Convolutional Neural Network for Incremental ...
- 小样本学习 | Learning to Compare: Relation Network for Few-Shot Learning
博主github:https://github.com/MichaelBeechan 博主CSDN:https://blog.csdn.net/u011344545 Learning to Compa ...
- 文献阅读笔记 | Reconstructing commuters network using machine learning and urban indicators
原文:Spadon, G., de Carvalho, A. C., Rodrigues-Jr, J. F., & Alves, L. G. (2019). Reconstructing co ...
- 【Paper】ConvLSTM:Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting
论文原文 论文下载 论文被引:1651(2020/03/01) 4827(2022/03/26) 论文年份:2015 文章目录 Abstract 1 Introduction 2 Preliminar ...
最新文章
- 人工智能伦理如何设定,从种群层面看人类的知识积累和进化
- STL: set相关算法
- PMCAFF微课堂 (已结束)| 京东平台产品负责人:如何打造一个支撑3200万日订单量的平台型产品
- Oracle11g服务详细介绍及哪些服务是必须开启的?
- 解决虚拟机 正在决定eht0 的ip信息失败 无链接-- 添加虚拟网卡
- [position]返回顶部
- java基础学习——14、代码格式
- poj 1872 A Dicey Problem (bfs+WordFinal题)
- LeetCode刷题目录
- pandas之combine_first() 合并重叠数据(修补)
- AspNetPager分页控件样式
- python刷屏代码_python 刷屏
- SAP MTO生产模式和计划策略组
- 微信小程序客服可以直接在手机回复吗,小程序客服功能怎么用手机回复,微信小程序客服手机版
- SSH密匙key介绍
- 国庆头像生成器小程序源码
- 计算机图形学与虚拟环境pdf,计算机图形学与虚拟现实环境.ppt
- 如何解决弹出 C:\WINDOWS\system32\Macromed\Flash\Flash32_11_2_202_228.ocx 问题。
- python羊车门问题_python羊车门问题的正确解答
- 视频、图形图像处理之Opencv技术记录(四)、OpenCV教程概述