Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
NIPS2015
https://github.com/ShaoqingRen/faster_rcnn

本文针对目标检测问题,在 Fast R-CNN 的基础上,提出 RPN 来改进候选区域提取,较大提升检测速度
Faster R-CNN = RPN+ Fast R-CNN, 而 RPN 中则相当于嵌套了一个小的 Fast R-CNN

3 Region Proposal Networks
我们直奔主题,聊聊 Region Proposal Network (RPN),一个 RPN 的输入时任意尺寸的图像,输出是一组矩形框候选区域,每个矩形框有一个objectness score,即属于某类物体的概率。我们用卷积网络对这个过程进行建模。 因为我们的最终目标是 和 目标检测网络 Fast R-CNN 共享计算,我们假定 RPN 和 Fast R-CNN 这两个网络是可以共享一组卷积层的。在我们的实验中, 我们分析了 ZF模型可以共享 5个卷积层, VGG 网络可以共享13个卷积层。

为了生成候选区域,我们在最后一个共享卷积层输出的卷积特征图上 滑动一个小网络(滑动模板匹配),这个小网络和 输入卷积特征图 n × n 区域是全链接的(这里我们设置 n=3)。注意这个 n=3对应输入图像中有效感受野还是挺大的,(171 and 228 个像素 for ZF and VGG)
每个滑动窗口内的卷积特征图上的特征被映射到一个低纬向量(ZF对应256维,VGG对应512维),然后这个向量被输入两个相邻全链接层 two sibling fully-connected layers,一个是矩形框回归层 a box-regression layer (reg),一个是矩形框分类层 a box-classification layer (cls)。
因为这个迷你网络以一种滑动窗口的方式运行,全链接层在所有的空间位置是共享的。这个架构很自然的实现方式如下:用一个 n × n 卷积层后面是两个相邻的 1 × 1 卷积层(分别对应 reg 和 cls)。 n × n 卷积层的输出后面应用 ReLUs

Translation-Invariant Anchors
在每个滑动窗口位置,我们同时预测 k 个候选矩形框,那么 reg layer 有 4k 个输出用于表示 k 个矩形框的坐标位置及尺寸大小信息。 cls layer 输出 2k 个概率用于表示每个矩形框包含/不包含物体的概率信息。 k个候选矩形框参数化表示为 k 个 reference boxes, called anchors。 每个 anchor 位于滑动窗口的中心位置,和 一个尺度及宽高比关联 scale and aspect ratio。这里我们使用 3个尺度和3个宽高比 得到 k=9 个 anchor 在每个滑动窗口位置。 对于一个尺寸为 W × H (typically ∼2,400) 的卷积特征图,一共有 WHk 个 anchor 。我们方法的一个重要属性是 平移不变性,对于 anchors 以及和 anchors 相关联的用于计算候选区域的函数都是一样的。
both in terms of the anchors and the functions that compute proposals relative to the anchors.

所谓的平移不变性就是 : 如果在图像中一个物体发生平移了,那么候选矩形框也应该平移,相同的函数可以在每个位置用于预测候选矩形框
If one translates an object in an image, the proposal should translate and the same function should be able to predict the proposal in either location.

简单的来说 RPN 就是在最后一层共享卷积层特征图上 使用 k个模板进行滑动窗口式物体检测,包括物体类别预测及矩形框位置回归。 也可以看做将检测问题变为分类问题。
RPN 里面嵌套了一个 Fast R-CNN,将每个滑动窗口看做一个候选矩形框,对该矩形框进行 CNN 分类操作。

重温目标检测--Faster R-CNN相关推荐

  1. 目标检测——Faster R-CNN论文阅读

    论文阅读--Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks 文章目录 论文阅读--Faste ...

  2. Faster R CNN

    Faster R CNN 3 FASTER R-CNN 我们的Faster R CNN 由两个模块组成,第一个模块是 proposes regions 的全卷积网络,第二个是使用 proposed r ...

  3. 目标检测Faster RCNN 批量标记数据集,生成xml,csv以及record文件

    目标检测Faster RCNN 批量标记数据集,生成xml,csv以及record文件 0.将png图片转换为jpg import os from PIL import Image# dirname_ ...

  4. 目标检测——Faster R_CNN使用smooth L1作为bbox的回归损失函数原因

    目标检测--Faster R_CNN使用smooth L1作为bbox的回归损失函数原因 前情提要-- 网上关于目标检测框架--faster r_cnn有太多太好的博文,这是我在组会讲述faster  ...

  5. 目标检测 Faster R-CNN运行及实时性DEMO测试

    faster-rcnn:Fast Region-based Convolutional Neural Networks基于区域的卷积神经网络 http://blog.csdn.net/column/d ...

  6. 重温目标检测--Fast R-CNN

    Fast R-CNN ICCV 2015 https://github.com/rbgirshick/fast-rcnn 本文在目标检测中起到一个承上启下的作用,从 R-CNN 经由 Fast R-C ...

  7. 【目标检测系列】CNN中的目标多尺度处理方法

    关注上方"深度学习技术前沿",选择"星标公众号", 技术干货,第一时间送达! [导读]本篇博文我们一起来讨论总结一下目标检测任务中用来处理目标多尺度的一些算法. ...

  8. 深度学习和目标检测系列教程 7-300:先进的目标检测Faster R-CNN架构

    @Author:Runsen Faster R-CNN 由于Fast R-CNN 过程中仍然存在一个瓶颈,即ROI Projection.众所周知,检测对象的第一步是在对象周围生成一组潜在的边界框.在 ...

  9. 遥感影像目标检测:从CNN(Faster-RCNN)到Transformer(DETR)

    我国高分辨率对地观测系统重大专项已全面启动,高空间.高光谱.高时间分辨率和宽地面覆盖于一体的全球天空地一体化立体对地观测网逐步形成,将成为保障国家安全的基础性和战略性资源.未来10年全球每天获取的观测 ...

最新文章

  1. 胡小明:大数据应用方向思考
  2. go操作网页元素_UI自动化21heliumS元素定位方式
  3. 配置vsftpd的遇到的坑及搭建虚拟账户
  4. 仰视源代码,实现strcpy
  5. html 如何判断文本溢出,判断文本是否溢出
  6. 自己设计java流程审核_关于工作流引擎取回审批的设计方案与实现过程
  7. 数据中心的运维管理原则(二)
  8. php+堆排序算法,排序算法-堆排序-php
  9. 关于使用layui中的tree的一个坑
  10. python绘画_python学画画(上)
  11. Gmap.net 怎么导入离线地图
  12. rac ogg to mysql_RAC环境下OGG的HA问题请教!
  13. python实时监控_python实时监控cpu小工具
  14. linux ls 输出格式,(转)linux 中使用ls指定输出时间格式
  15. 学习银行转账系统-代码摘取csdn
  16. 工厂如何引入ERP生产管理系统
  17. Tomcat 的部署+虚拟主机的配置
  18. ITIL 2011 -- 服务运营的5个流程简介 (上)
  19. Android音频处理知识(一)MediaRecorder录制音频
  20. 成功人士们最近有点烦

热门文章

  1. mustache 渲染文本一直渲染不出来
  2. 编程实现灰度处理函数
  3. tensorflow电子书(附下载链接)
  4. 第二课.PyTorch入门
  5. android matrix 简书,android matrix
  6. 推荐 | 几个最有价值的科研学术类资源
  7. Microbiome:宏基因组揭示冻土带、温带草原和热带土壤抗性的特征
  8. 蚂蚁森林合种计划(2020.11.14,7天有效,每周6更新)
  9. 水稻微生物组时间序列分析
  10. R语言data.table导入数据实战:data.table使用by函数进行数据分组(aggregate)