目标检测论文阅读:GHM(anchor based)

论文链接:https://arxiv.org/abs/1811.05181
代码链接:https://github.com/libuyu/GHM_Detection
今天介绍一篇AAAI 2019的文章,Gradient Harmonized Single-stage Detector。文章的motivation和focal loss有一点相似,都是致力于不平衡问题。

1. Background

首先,关于目标检测的类别不平衡问题就不再赘述了。有疑问可以去看focal loss了解。这里有一个问题,为什么focal loss调整权重就可以改善不平衡?作者认为这一问题本质上是各个样本产生的梯度不平衡问题,而改变了权重不同样本对总共梯度的贡献也就不同了。
作者这里萌生了一个想法,我们都知道传统图像处理中有直方图均衡化的概念,可以把图像各个高度不一的亮度分布拉成一条直线,那如果我统计一下梯度的分布,然后也拉成一条直线,是不是能更好地解决类别不平衡问题呢?而且这样有一个好处,那就是不用像focal loss一样设置两个超参数,对各个数据集自适应能力也比较强。

2. Method

GHM-C

直方图均衡化统计的是图像灰度,那如果梯度也要做一个分布图统计的是什么?作者这里根据求导公式给出了定义:

通过将梯度量化到0~1,可以得到类似这样的梯度分布图:

可以看到,0点附近的g非常小的easy样本其实是占大多数的。而在1附近的样本很多都属于outliers。我们这里直接说下作者最终简化的均衡化方法:

  1. 将0~1划分成M个区间
  2. 统计落在各个区间的g的数量
  3. 最后,计算分类损失的权重

    其中,Rind(g)是指落g落在的区间内,一共有多少样本落在这个区间;如果只有一个区间,那么GD(g)等于样本数,GHM-C损失函数等同于交叉熵损失函数。
    这里的样本指的是每个min-batch里面的样本数量,也就是说,每进来一个Min-batch,都会算一下所有样本落在各个区间的数量,计算权重,为了减少极端min-batch影响,作者这里用了滑动系数方法更新落在各个区间的样本数量:

GHM-R

首先,为了方便表示和统计回归问题的梯度,作者重新定义了回归问题的损失函数:


显然,ASL1和SL1都是类似的(outliers点梯度约为1,接近零点附近梯度比较小),而且ASL1导数连续,并且在0~1范围内,很容易定义g并得到分布:


注意到由于回归损失只统计正样本,和分类损失分布差异还是挺大的。统计g的分布,得到新的GHM函数,剩下的就和GHM-C一样了:

最后可以看一下拉伸后的梯度分布:

3. 实验结果

作为单阶段检测算法,这篇文章在COCO上取得的结果也还是不错的,有兴趣的可以看看。

目标检测论文阅读:GHM(anchor based)相关推荐

  1. 3D目标检测论文阅读多角度解析

    3D目标检测论文阅读多角度解析 一.前言 CNN(convolutional neural network)在目标检测中大放异彩,R-CNN系列,YOLO,SSD各类优秀的方法层出不穷在2D图像的目标 ...

  2. 3D目标检测论文阅读摘要

    3D目标检测论文阅读摘要 2D Object Detection 的研究已经非常成熟了,代表作品有RPN系列的FasterRCNN,One Shot系列的YOLOv1-YOLOv3,这里推荐一个2D ...

  3. 2019 sample-free(样本不平衡)目标检测论文阅读笔记

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自知乎,已获作者同意转载,请勿二次转载 (原文地址:https://zhuanlan.zhihu.com/p/100052168) 背景 < ...

  4. 毫米波目标检测论文 阅读笔记 | Radar Transformer: An Object Classification Network Based on 4D MMW Imaging Radar

    毫米波目标检测论文 | Radar Transformer: An Object Classification Network Based on 4D MMW Imaging Radar Jie Ba ...

  5. 三维目标检测论文阅读:VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection

    VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection 理解了PointPillars这篇文章后,看这篇文章就清 ...

  6. 目标检测论文阅读:DeFCN(POTO+3DMF)算法笔记

    标题:End-to-End Object Detection with Fully Convolutional Network 会议:CVPR2021 论文地址:https://ieeexplore. ...

  7. 【目标检测论文阅读笔记】Feature-Enhanced CenterNet for Small Object Detection in Remote Sensing Images

    Abstract: 与 anchor-based基于锚点的检测器相比,anchor-free无锚点检测器 具有灵活性和较低计算复杂度的优点.然而,在复杂的遥感场景中,受限的几何尺寸.目标的弱特征 以及 ...

  8. 目标检测论文阅读:Multi-scale Location-aware Kernel Representation for Object Detection(CVPR2018)

    Multi-scale Location-aware Kernel Representation for Object Detection 论文链接:https://arxiv.org/abs/180 ...

  9. 目标检测论文阅读:Cascade R-CNN: Delving into High Quality Object Detection(CVPR2018)

    Cascade R-CNN: Delving into High Quality Object Detection(CVPR2018) 论文链接:https://arxiv.org/abs/1712. ...

最新文章

  1. Java NIO 学习笔记(三)----Selector
  2. 26 | 案例篇:如何找出狂打日志的“内鬼”?
  3. ffplay.c学习-8-暂停、逐帧、⾳量
  4. C# 实验四 修改版 获取系统时间、点击加一秒功能
  5. 知道python网课答案_Python程序设计答案
  6. nssl1487-图
  7. 经典面试题(43):以下代码将输出的结果是什么?
  8. 存储空间的动态分配与释放
  9. Fiddler工具的使用与手机app数据抓包
  10. Xcode 5设置Deployment Target
  11. 矩阵求导法则,梯度求导方式
  12. mysql可以用表情符号_让MySQL支持emoji表情符号存储
  13. Zigbee和WiFi的信道重叠
  14. CMM/CMMI 的区别
  15. 腾讯云API弹性公网IP踩坑
  16. 你要的大数据/Python学习路线图来了!
  17. 自动控制原理笔记-控制系统的数学模型
  18. 企业邮箱“成员收发权限”功能详解【如何开通企业邮箱】
  19. 基于PIC16F876A的摇摇棒
  20. 浅析TD源链的未来发展趋势

热门文章

  1. 理解Kotlin密封类Sealed
  2. 第七次网页前端培训(JavaScript)
  3. 柏拉图团队-手把手教你发代币(二)remix入门
  4. c# log4net安装时在AssemblyInfo中提示找不到log4net解决办法
  5. 洛谷分支结构:小鱼的航程(改进版),C语言
  6. win10系统分区方案教程
  7. cgroup driver: cgroupfs还是systemd
  8. lucene4.0与IKAnalyzer的冲突
  9. ajax里的append,使用AJAX源和appendTo理解和实现jQuery自动完成
  10. 我支持刘翔,理由有三