Training Region-based Object Detectors with Online Hard Example Mining

code: https://github.com/abhi2610/ohem

本文针对 Fast R-CNN 检测系统,从样本训练的策略提出改进方法。

首先来看一下 Fast R-CNN

3 Overview of Fast R-CNN

FRCN(Fast R-CNN)的输入是图像和对应的一组候选区域,FRCN 网络可以分为两个子网络:一个是卷积子网络(由卷积层和最大池化层构成),另一个是 RoI 网络(由 RoI-pooling层,全链接层,两个误差损失层)。

在推理阶段,卷积子网络对输入图像进行卷积,得到一个卷积特征图,其尺寸依赖于输入图像尺寸。对于每个候选区域,RoI-pooling 层 将该候选区域映射到卷积特征图上面对应的区域,提取出一个固定长度的特征向量。每个特征向量输入到全链接层,给出两个输出:1)含有物体及物体类别的概率,2)包含物体的矩形框回归坐标。

3.1. Training
FRCN 和大多数深度网络一样,使用 SGD 随机梯度下降算法训练。每个样本的 RoI 的损失函数是分类log误差 加上 定位误差。

为了实现在 RoI 之间 共享卷积网络计算,SGD 最小批通过分等级创建。对每个最小批,N幅图像从数据库中采样,然后 B/N 个 RoI 从每个图像中采样。 这里设定 N=2, B=128。在 RoI 采样过程中使用了几个探索方法。本文主要的贡献就是取消了它们中的一些。

4 Our approach

the online hard example mining algorithm (OHEM) proceeds as follows:
对于一幅图像在 SGD t 步 迭代中,我们使用卷积子网络计算得到 卷积特征图,然后 RoI 网络使用这个特征图和该图像对应所有的候选区域进行前向计算,主要这一步主要涉及 RoI 池化, 几个全链接层, 每个RoI损失函数计算。这个损失误差表示当前网络对每个RoI 的处理能力。 难得样本可以通过对 所有 RoI 的损失误差进行排序,取当前网络表现最差的 前 B/N 个 RoI 样本。因为大部分前向计算通过卷积图共享计算。所以额外增加的计算很少。然后我们对这些难得样本进行后向计算,调整网络参数,使整个网络可以更好的处理这些难样本。

目标检测--Training Region-based Object Detectors with Online Hard Example Mining相关推荐

  1. 目标检测20年(Object Detection in 20 Years)

    Object Detection in 20 Years: A Survey Zhengxia Zou, Zhenwei Shi, Member, IEEE, Yuhong Guo, and Jiep ...

  2. Training Region-based Object Detectors with Online Hard Example Mining论文讲解

    转载自:https://zhuanlan.zhihu.com/p/58162337 Training Region-based Object Detectors with Online Hard Ex ...

  3. 目标检测开源代码汇总 object detection algorithm codes

    无人机目标检测 SlimYOLOv3: Narrower, Faster and Better for Real-Time UAV Applications https://arxiv.org/abs ...

  4. 目标检测--Selective Search for Object Recognition(IJCV, 2013)

    Selective Search for Object Recognition 作者: J. R. R. Uijlings, K. E. A. van de Sande, T. Gevers, A. ...

  5. CVPR 2021 Oral | OWOD:面向开放世界的目标检测 Towards Open World Object Detection

    Towards Open World Object Detection 论文:https://arxiv.org/abs/2103.02603 代码:https://github.com/Joseph ...

  6. AI_综述:3D目标检测于RGB-D(Object detection in RGB-D images)

    转载自:https://zhuanlan.zhihu.com/p/34887948 基于深度学习的图像目标检测(上) 基于深度学习的图像目标检测(下) 大牛讲堂 | 基于DenesBox的目标检测在自 ...

  7. 目标检测开源代码汇总 object detection algorithm codes (转)

    注:原文:https://blog.csdn.net/zhangjunhit/article/details/78901952 博主「O天涯海阁O」 无人机目标检测 SlimYOLOv3: Narro ...

  8. 目标检测中region proposal的作用

    作者:YJHMITWEB 链接:https://www.zhihu.com/question/265345106/answer/294410307 来源:知乎 著作权归作者所有.商业转载请联系作者获得 ...

  9. 实时目标检测--Pelee: A Real-Time Object Detection System on Mobile Devices

    Pelee: A Real-Time Object Detection System on Mobile Devices ICLR 2018 Code: https://github.com/Robe ...

最新文章

  1. 人脸识别 python调用face++ 功能测试
  2. hbuilder/hbuilderx 无法检测到模拟器
  3. Django Form -- 对单个表单的组合验证
  4. 计算机专业介绍范文英文,计算机专业个人简历英文范文
  5. JavaScript | 用户定义函数的一些示例
  6. mcp证书有什么用_初级会计职称有什么用?考下证书可以做什么工作?
  7. macos安装vscode_什么!你还没有安装Flutter!
  8. Java 使用BigDecimal类处理高精度计算
  9. R语言机器学习中数据可视化的杀手锏
  10. CV经典入门教程:《计算机视觉:算法与应用》第二版
  11. php 模板 {{}},PHP模板技术
  12. hwaddr和macaddr的区别
  13. 电子工程师的自我修养 - 恒流源电路分析
  14. 为什么计算机打开u盘这么慢,电脑读取u盘文件速度慢
  15. 百度DNS/阿里DNS/114DNS/谷歌DNS/OpenDNS 对比评测
  16. 用VB操作注册表 [转]
  17. JavaScript中常用数组方法总结
  18. 制作一个经典坦克大战
  19. App马甲包开发需要注意的地方
  20. 淘宝无线端店铺权重提升方法技巧步骤

热门文章

  1. NC:中科院动物所王关红等综述基因技术防控蚊媒疾病
  2. MPB:林科院袁志林组-提取杨树人工林土壤微生物菌体细胞的4种方法
  3. Nature:好导师的16个标准
  4. Nature Microbiology:微生物与海洋全球变化
  5. pandas使用apply函数将dataframe多个数据列整合为元组形式并生成新的数据列(combine multiple columns as a single column of tuples)
  6. R语言亚组分析 (Subgroup Analysis)及森林图绘制实战
  7. R语言ggplot2可视化自定义多个图例(legend)标签之间的距离实战(例如,改变数据点颜色和数据点大小图例之间的距离)
  8. R语言使用ggplot2包的快速可视化函数qplot绘制散点图(设置数据点的形状、大小)实战
  9. 为什么一般用自增列作为主键?
  10. R语言使用ggpubr包的ggarrange函数组合多张结论图:使用ggpubr包将多个可视化结论嵌套起来输出(ggarrange组合ggarrange组合后的图像)