论文链接:Gradient Harmonized Single-stage Detector
论文来自香港中文大学

一、论文出发点

   我们都知道,one-stage检测器一个极大的问题就是easy样本和hard样本之间的不平衡,致使少量的hard的样本淹没在大量的easy的样本中,使网络的学习偏向与easy样本,而忽略hard的样本。2016年的OHEM将所有的负样本根据loss的值进行排序,只取topk的负样本,将正负样本比例控制在1:3,但是这种方法直接抛弃了大量的样本。2017年,何凯明大神提出了focal loss,focal loss认为如果预测的概率p很高,例如大于0.9,这样的样本网络已经学习的很好了,对模型的提升效果不大,模型应该更多的关注那些预测概率很低的样本,因此模型的思想就是,在loss的前面加weight,对于高置信度的样本weight是极大抑制作用。

二、focal loss

交叉熵的公式如下:
focal loss的公式如下:

一个简单的思想:把高置信度p样本的损失再降低一些,例如r=2r=2r=2时,p = 0.968, (1−0.968)2=0.001(1 - 0.968)^2 = 0.001(1−0.968)2=0.001,损失衰减了1000倍,可以看到,置信度p越大,对应的loss衰减的就越大。
放一张focal loss论文中的曲线图:
可以看到曲线图中,衰减值rrr直接可以将高置信度的loss进行衰减。

三、GHM

  focal loss的问题是什么呢,可以看到,focal loss减少高置信度的权重,相对的提高低置信度的权重,但是置信度比较低的样本有可能是outliers(离群点),学习这些outliers是不利与模型的收敛的。那么,怎么样才能衰减easy 样本的同时,也不去过多关注特别难分的样本,GHM解决的就是这个问题。

3.1 梯度模长

GHM定义了一个梯度模长的概念:

ppp是模型预测的概率,p∗p^*p∗是样本的ground truth,p∗p^*p∗取值为0或1。
论文中指出,ggg是从交叉熵损失求导得来的,所以ggg可以代表样本的难易程度,ggg越大,样本难度比较大,并且可以指明这些样本对梯度的影响度。下图是论文中统计one-stage中的梯度范数:
可以看到梯度模长小于0.2表明是easy 样本,这些样本量很大,我们不希望去过多的关注,同时梯度模长大于0.9的,是hard样本,这些hard的样本可以认为是outliers,论文指出这些outliers可以不用过多关注。

3.2 梯度密度

从梯度范数图可以发现,easy样本和outliers的样本数量偏多,因此作者又定义了梯度密度,即单位梯度模长的样本个数:
δϵ(gk,g)\delta_{\epsilon}(g_k, g)δϵ​(gk​,g) 表明了样本1~N中,梯度模长分布在 (g−ϵ2,g+ϵ2)(g - \frac{\epsilon}{2}, g + \frac{\epsilon}{2})(g−2ϵ​,g+2ϵ​) 范围内的样本个数,lϵ(g)l_{\epsilon}(g)lϵ​(g)代表了 (g−ϵ2,g+ϵ2)(g - \frac{\epsilon}{2}, g + \frac{\epsilon}{2})(g−2ϵ​,g+2ϵ​)的区间长度。

论文阅读三:GHM《Gradient Harmonized Single-stage Detector》相关推荐

  1. 目标检测论文阅读:GHM(anchor based)

    目标检测论文阅读:GHM(anchor based) 论文链接:https://arxiv.org/abs/1811.05181 代码链接:https://github.com/libuyu/GHM_ ...

  2. 目标检测——梯度均衡机制GHM(Gradient Harmonized Mechanism)的理解

    论文:Gradient Harmonized Single-stage Detector 论文地址:Gradient Harmonized Single-stage Detectorhttps://a ...

  3. 联邦学习论文阅读三:ChainFL

    联邦学习论文阅读三:ChainFL Secure and Efficient Federated Learning Through Layering and Sharding Blockchain 论 ...

  4. 目标检测--Accurate Single Stage Detector Using Recurrent Rolling Convolution

    Accurate Single Stage Detector Using Recurrent Rolling Convolution CVPR 2017 商汤科技关于目标检测的文献 Code: htt ...

  5. 【阅读笔记】Gradient Harmonized Single-stage Detector

    Li B , Liu Y , Wang X . Gradient Harmonized Single-stage Detector[J]. 2018. https://github.com/libuy ...

  6. 论文精读:GHM:Gradient Harmonized Single-stage Detector

    Abstract 尽管两级探测器取得了巨大的成功,但单级探测器仍然是一种更加优雅和有效的方法,但在训练过程中存在两种众所周知的不和谐,即正负例子和硬性例子在数量上的巨大差异.在这项工作中,我们首先指出 ...

  7. 【论文阅读】Video Generation from Single Semantic Label Map-CVPR2019

    题目: Video Generation from Single Semantic Label Map 原文:https://arxiv.org/pdf/1903.04480v1.pdf pytorc ...

  8. 论文阅读 | Rethinking Coarse-to-Fine Approach in Single Image Deblurring

    前言:ICCV2021图像单帧运动去糊论文 论文地址:[here] 代码地址:[here] Rethinking Coarse-to-Fine Approach in Single Image Deb ...

  9. 论文阅读三:基于改进人工蜂群算法的SDN负载均衡策略研究

    名词解释: Artificial Bee Colony Algorithm, ABC:人工蜂群算法 Load balancing algorithm based on improved artific ...

最新文章

  1. Ubuntu下安装Apache+PHP+Mysql
  2. HTML5之地理信息应用 获取自己的位置
  3. 逃出你的肖申克(三):遇见20万年前的自己
  4. 机器学习的数学,从入门到不放弃(文末彩蛋)
  5. mailcore -- Mail port
  6. pdo mysql fedora_在Fedora 23 Server和Workstation上安装LAMP(Linux, Apache, MariaDB和PHP)
  7. .net应用程序中添加chm帮助文档打开显示此程序无法显示网页问题
  8. 如何使用浏览器控制台通过JavaScript抓取并将数据保存在文件中
  9. docker高级应用之智能添加与修改防火墙规则
  10. java如何获取本机IP
  11. 【HAVENT原创】NodeJS 短网址开发(调用第三方接口)
  12. poster--2011 Pacific-RimConference on Multimedia
  13. 魔方机器人之下位机编程----串口接收数据并解析
  14. 用gambit学博弈-完全信息静态博弈
  15. 阿里云企业物联网平台推出千里传音播报服务 高效打造云端一体智能硬件
  16. PHP面试题2019年腾讯工程师面试题和答案
  17. Flink学习笔记【巨详细!】(二)
  18. Trim函数的用法(笔记)
  19. HMI智能座舱自动化测试之性能测试
  20. 蓝宇风:高强度加密狗

热门文章

  1. Latex如何排版矩阵
  2. 如何将DotNetFX35SP1打进安装包
  3. android vold磁盘管理
  4. oracle数据库的安装及配置方法
  5. 集成算法系列之GBM
  6. 科技爱好者周刊:第 87 期
  7. 关于objectArx /CAD二次开发中“属性块”操作
  8. 计算机excel按F4是那个公式,功能键F4你真的会用?Excel四大F4快捷操作,轻松解决工作中问题...
  9. 联想小新padpro12.6 #Q706F 解锁输入TWRP教程
  10. vue-element-admin动态加载接口和报错解决