目标检测--R-FCN: Object Detection via Region-based Fully Convolutional Networks
R-FCN: Object Detection via Region-based Fully Convolutional Networks
Code: https://github.com/daijifeng001/r-fcn
https://www.arxiv.org/abs/1605.06409
本文针对目标检测问题,对候选区域进行分块处理,以此来解决分类和检测之间的一个矛盾:分类网络具有一定的平移不变性,而目标检测需要对位置保持敏感性。a dilemma between translation-invariance in image classification and translation-variance in object detection。
目标分块处理,一个很直接的结果就是对目标局部遮挡效果比较好。
本文没有探讨解决目标尺度问题。
1 Introduction
R-CNN 目标检测系列将目标检测问题分为两个步骤:卷积特征提取+候选区域分类,这两个步骤通过 RoI 池化层连接起来。卷积特征提取独立于RoI,RoI后面的计算不能共享计算。造成这种情况是由于历史原因:早期的网络模型如 AlexNet and VGG Nets 有两个子网络:卷积网络以空间池化层结束,全链接层。这个空间池化层就演变为后来的 RoI 池化层。
最近提出的分类网络如 Residual Nets (ResNets) [ 9 ] and GoogLeNets [ 24 , 26 ] 都是全卷积网络,很自然的想法就是对检测系统使用全卷积网络,不要RoI 池化层,这样可以共享计算。但是实验发现这样做的效果不好。ResNet paper
[ 9 ]又加入了 RoI 池化层,这样做提高了检测精度,但是增加了计算量,因为对每个候选区域的计算没有共享该计算。
去掉RoI 池化层为什么效果会不好了,这主要是因为类网络具有一定的平移不变性,而目标检测需要对位置保持敏感性。这里我们提出了一个简单的解决方法:对候选区域进行分块处理,这里使用了k×k = 3×3 , 这9个区域分别表示:上中下左中右。{ top-left, top-center,top-right, …, bottom-right}
输入一幅图像,经过卷积网络提取整个图像的卷积特征,然后使用一个 k*k*(C+1)-d 卷积网络提取 k*k position-sensitive score maps,假设 k=3, 就是将一个候选区域分成 3*3=9个块,对应9个 position-sensitive score maps,上图显示第一个 position-sensitive score map是 top-left,就是目标左上块的卷积响应图,其他响应图以此类推。得到9个分块响应图之后,对于一个候选区域,我们可以从这9个分块响应图中得到完整的候选区域响应图。再对这个完整的候选区域响应图进行处理,得到分类结果。
行人分块检测示意图:
候选区域框发生偏移的效果:
整个系统如下所示,使用 RPN提取候选区域,卷积计算都共享
R-FCN 和 Faster R-CNN 对比:
检测效果图:
目标检测--R-FCN: Object Detection via Region-based Fully Convolutional Networks相关推荐
- 目标检测数据集The Object Detection Dataset
目标检测数据集The Object Detection Dataset 在目标检测领域,没有像MNIST或Fashion MNIST这样的小数据集.为了快速测试模型,我们将组装一个小数据集.首先,我们 ...
- FCN的学习及理解(Fully Convolutional Networks for Semantic Segmentation)
大多数人接触"语义"都是在和文字相关的领域,或语音识别,期望机器能够识别你发出去的消息或简短的语音,然后给予你适当的反馈和回复.嗯,看到这里你应该已经猜到了,图像领域也是存在&qu ...
- 彻底讲透FCN语义分割开山之作Fully Convolutional Networks
FCN论文标题:Fully Convolutional Networks for Semantic Segmentation 论文下载地址:https://arxiv.org/abs/1411.40 ...
- 全卷积(FCN)论文阅读笔记:Fully Convolutional Networks for Semantic Segmentation
论文阅读笔记:Fully Convolutional Networks forSemantic Segmentation 这是CVPR 2015拿到best paper候选的论文. 论文下载地址:Fu ...
- 遥感图像中的小样本目标检测:Few-shot Object Detection on Remote SensingImages
论文下载:https://arxiv.org/pdf/2006.07826v2.pdf Abstract 在本文中,我们处理遥感图像上的目标检测问题.以前的方法已经发展了许多基于深度卷积的遥感图像目标 ...
- 无人驾驶中的目标检测--MODNet: Moving Object Detection Network for Autonomous Driving
MODNet: Moving Object Detection Network with Motion and Appearance for Autonomous Driving 这里讲视频动作识别中 ...
- 目标检测——day44 Tiny Object Detection in Aerial Images
航空图像中的小物体检测 资源下载 原文PDF 代码和数据集 I. INTRODUCTION A. contributions III. DATASET DETAILS A. Dataset Const ...
- 目标检测综述:Object Detection in 20 Years: A Survey
文章目录 1. INTRODUCTION 1.1 区别 1.2 目标检测中的困难和挑战 2. OBJECT DETECTION IN 20 YEARS 3. SPEED-UP OF DETECTION ...
- 【ICPR 2021】遥感图中的密集小目标检测:Tiny Object Detection in Aerial Images
SSPNet: Scale Selection Pyramid Network for Tiny Person Detection from UAV Images 简介: 数据集: M-CenterN ...
- 【3D目标检测】3D Object Detection for Autonomous Driving: A Survey
目录 概述 细节 背景 常用数据集及其评价指标 基于RGB图像的算法 基于点云的算法 基于RGB图像与点云模态融合的算法 概述 这是一篇21年的综述,介绍了3D目标检测背景.传感器以及基于传感器的算法 ...
最新文章
- IIS 配置Http重定向到Https
- 30年间,软件开发行业为何Bug纷飞?
- 三线压力传感器原理_进气压力传感器原理与检修
- debian jessie install note
- error: failed to push some refs to 'https://gitee.com/xxx/xxx'
- java继承序列化_java中序列化之子类继承父类序列化
- java中的位移运算符_java中的移位运算符(, , )
- java抽取注释_JAVA 注解教程(五)注解的提取
- Wide-Baseline Image Matching Using Line Signatures
- [POJ3080 Blue Jeans]
- Mac 修改VIM中C语言函数高亮显示
- 防(普通)病毒U盘的制作
- 如何寻找已知轮廓的最大内接圆
- Kibana 操作 ES+搜索
- golang的图片操作:缩放图片+合成图片
- Flashpaper序列号
- 用马青公式计算圆周率,Python语言
- 2013全国计算机二级vfp试题,2013年计算机二级VFP上机试题及答案解析29
- vue 中使用 marked + highlight.js 代码高亮
- eclipse全文搜索多个关键字
热门文章
- Windows下dump文件生成与分析
- RDKit | 基于RDKit和Cytoscape绘制分子相似图
- CentOS 7下源码编译安装新版本内核
- php五只猴子分椰子_PHP实现的猴王算法(猴子选大王)示例
- mSystems:生物地球化学进入病毒时代-采用多样的方法研究病毒和生物地球化学循环...
- GCB:西农韦革宏团队-土壤多营养级网络的复杂度增强农田系统生物多样性和多功能性的联系...
- 西湖大学鞠峰组:环境微生物的宏基因组学实例与新发现
- MPB:华南农大王文策组-​水禽肠道食糜微生物脂多糖含量的检测
- MPB:军科院杨瑞馥、毕玉晶等-​​培养组学方法优化(视频)
- 你所不知道的SCI, SCIE, 和ESCI