fasterrcnn中ROI Pooling 与 SPP 理解
介绍
ROI(Region of Interest) Pooling是Pooling的一种。在传统CNN中,Pooling层的作用主要有三个:
1、特征不变性,使模型更加关注是否存在某些特征而不是特征具体的位置,对于一些旋转和平移具有不变性
2、特征降维,使模型可以抽取更广泛围的特征,减小了下一层输入大小,进而减小计算量和参数个数
3、在一定程度防止过拟合,更方便优化
ROI Pooling是针对RoIs的Pooling,其特点是输入特征图尺寸不固定,但是输出特征图尺寸固定。
在Fast RCNN中, RoI是指Selective Search完成后得到的“候选框”在特征图上的映射
在Faster RCNN中,候选框是经过RPN产生的,然后再把各个“候选框”映射到特征图上,得到RoIs
ROI Pooling的思想来自于SPPNet中的Spatial Pyramid Pooling,在Fast RCNN中使用时,将SPPNet中多尺度的池化简化了为单尺度。
SPP(Spatial Pyramid Pooling)
简而言之,是将任意尺寸的feature map用三个尺度的金字塔层分别池化,再将池化后的结果拼接得到固定长度的特征向量(图中的256为filter的个数),送入全连接层进行后续操作。
ROI Pooling
ROI Pooling实例:
我们有一个8x8大小的feature map,一个ROI,以及输出大小为2x2.
- 输入固定大小的feature map
- region proposal 投影之后位置(左上角,右下角坐标):(0,3),(7,8)。
- 将其划分为(2x2)个sections(指定输出的大小为2x2),可以得到:
- 对每个section做max pooling,可以得到:
完整过程如下:
如上实例中显示了对一个ROI的处理过程,对于不同大小的ROI,该方法处理可以得到相同尺寸(2 x 2)的输出,在此案例中region proposals 是5 x 7大小的,在pooling之后需要得到2 x 2的,所以在5 x 7的特征图划分成2 x 2的时候不是等分的,行是5/2,第一行得到2,剩下的那一行是3,列是7/2,第一列得到3,剩下那一列是4。
fasterrcnn中ROI Pooling 与 SPP 理解相关推荐
- ROI Pooling 与 SPP 理解
介绍 ROI(Region of Interest) Pooling是Pooling的一种.在传统CNN中,Pooling层的作用主要有三个: 1.特征不变性,使模型更加关注是否存在某些特征而不是特征 ...
- Faster R-CNN源码中ROI Pooling的解析
如图可以看出来ROI Pooling使用RPN产生的Proposal和fearture map,ROIpooling其实使用的是feature map中的Proposal,如下图也可以看出来.Prop ...
- faster-rcnn中添加Mask中的RoiAlign层,使回归框更精确( roi_align_layer.cu:240] Check failed: error == cudaSuccess *)
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/e01528/article/details/80265118 具体的操作为什么这样做,可参照: 1. ...
- 【目标检测】概念理解:region proposal、bounding box、anchor box、ground truth、IoU、NMS、RoI Pooling
最近刚接触图像识别,理解一些概念十分困难,尤其是动不动就冒出个看不懂的英语,让人抓狂.查了不少资料后做一个总结并加上一些自己的理解,理解若有误,烦请大家指出,相互学习. 本文主要对region pro ...
- Faster-RCNN(一)之ROI Pooling层
Faster-RCNN可看作是在Fast-RCNN的基础上,加了RPN层.其网络结构如下图所示(图片源于网络 https://www.cnblogs.com/zyly/p/9247863.html): ...
- Faster-rcnn中Anchor的理解
文章目录 1,Anchor是如何生成的? 1.1 特征图如何得到 Anchor的生成过程 2,Anchor的作用是什么? 1,Anchor是如何生成的? 1.1 特征图如何得到 假设对于网络输入的图像 ...
- 目标检测算法中ROI提取方法比较+源码分析
本文主要介绍ROI提取结构在目标检测框架中的作用,并结合源码,理解它的实现方式.包含的算法有:ROI-pooling,ROI-align,Deformable-psroi-pooling. 目前,主流 ...
- RoI Pooling 与 RoI Align 有什么区别?
↑ 点击蓝字 关注视学算法 作者丨AlexChung@知乎 来源丨https://zhuanlan.zhihu.com/p/161540817 编辑丨极市平台 基本概念 RoI RoI(Region ...
- ROI Pooling层解析
ROI Pooling的意义 ROIs Pooling顾名思义,是Pooling层的一种,而且是针对RoIs的Pooling,他的特点是输入特征图尺寸不固定,但是输出特征图尺寸固定: 什么是ROI呢? ...
最新文章
- mysql怎么测试事物_mysql事务简单测试
- 关于android的4.2的0文件夹的详解
- 【区块链基础知识系列】 第9课 一文诠释什么是DAG
- 解决rtl8723be网卡故障
- 从《黎明杀机》看非对称对抗游戏的魅力
- .NET Core中Object Pool的简单使用
- 获取内存_如何获取一个进程所占用的内存
- [HTML]HTML5实现可编辑表格
- Android类参考---Fragment(五)
- DSP之时钟与定时器之四看门狗定时器
- 某些面向对象的思想--一步步更新
- 联网JAVA模拟器_java模拟器
- KMeans原理和密度聚类
- 【千月二开美化版】畅视福利影院APP源码+畅视影视源码+对接苹果CMS【已测试】
- VAX 过期重新安装办法。
- 【STM32H7】第30章 ThreadX GUIX炫酷实用的时钟表盘设计,结合硬件RTC实时时钟
- arch模型 matlab,ARCH模型(arch模型干嘛的)
- android adb 抓取log
- 学习笔记(1):零基础掌握 Python 入门到实战-用Python操作SQLite数据库
- php手游服务端开发教程,【手游服务端】梦想海贼王 卡牌系列一键端服务端游戏源码+教程...