(1)SPP层能达到什么样的效果?

由于全连接层对数据大小的输入是由要求的,比如要求是256*1才能输入到全连接层里面,那你288*1的特称图就不能输入到全连接层了。

SPP层能达到的效果是:不管你的特征图是size多大的(随便来一个size大小都可以),只要输入到SPP层里面,出来的特征图都是固定的、特定的size,比如就是固定的256*1,不管你输入特征图是多少,从SPP层里出来,最后都是256*1

(2)假设你输入特征图是M*M大小,想要得到一个N*N大小的输出特征图,需要size多大的池化核以多长的步长stride来对输入特征图做padding?

根据你输入的特征图的size和期望输出的特征图的size,来确定池化的window size和stride步长

比如:你输入一个C*M*M(其中C为通道数)的特征图,想要得到一个C*N*N的特征图

那么就可以求出:window size=M/N(向上取整),stride=M/N(向下取整)

(3)SPP就是将一个输入特征图得到多个大小不一样的输出特征图,然后将这些特征图进行flatten(铺平,展成一维数组),然后这些一维数组再进行拼接(concatenate)最后就可以将拼接得到的特征图送到FC(全连接层)去进行分类

下面的图里面就是一个输入特征图分别得到一个4*4的输出特征图,一个2*2特征图以及一个1*1特征图(通道数都为256),展平,拼接后得到256(16+4+1)*1大小的特征图。不管你输入特征图size是多少,都会得到一个4*4的输出特征图,一个2*2特征图以及一个1*1特征图

(4)SPP还可以和空洞卷积相结合,得到ASPP(atrous spatial pyramid pooling)

借鉴SPP金字塔池化的思想,用不同膨胀率的卷积核作卷积,一个输入特征图也可以得到几个不同的输出特征图(如下图:分别采用1*1卷积核卷积,3*3卷积核膨胀率dilation rate=6卷积,3*3卷积核膨胀率dilation rate=12卷积,3*3卷积核膨胀率dilation rate=18卷积,再将得到的四个结果进行concat拼接)

总结:一个输入特征图,得到几个固定大小(但大小不一样)的输出的特征图 ,自上而下从小到大摆放,就像一个上小下大的金字塔,所以叫金字塔池化。

SPP(spatial pyramid pooling) 空间金字塔池化相关推荐

  1. SPP: Spatial Pyramid Pooling

    paper:  Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition code:   https: ...

  2. 空间金字塔池化(Spatial Pyramid Pooling, SPP)原理和代码实现(Pytorch)

    想直接看公式的可跳至第三节 3.公式修正 一.为什么需要SPP 首先需要知道为什么会需要SPP. 我们都知道卷积神经网络(CNN)由卷积层和全连接层组成,其中卷积层对于输入数据的大小并没有要求,唯一对 ...

  3. Spatial Pyramid Pooling(空间金字塔池化)-变尺度CNN训练

    1. 需求创造好的产品,产品拓宽原始的需求 当前的深度神经网络一般都需要固定的输入图像尺寸(如224*224). 这种需求很明显是人为的,潜在性的弊端会降低识别精度(为了使图像尺寸相同,一定会涉及到图 ...

  4. [Neck] 空间金字塔池化【池化策略】(Space Pyramid Pool, SPP)模块和路径聚合网络【增强】(Path Aggregation Network, PANet)的结构

    文章目录 背景 yolo v4 中的空间金字塔池化(Space Pyramid Pool, SPP)模块和路径聚合网络(Path Aggregation Network, PANet)的结构 SPP ...

  5. 深入理解空间金字塔池化(SPP,ASPP)

    读Lawin Transformer这篇论文,里面有介绍到在Transformer结构中使用ASPP,有很多细节没有理解,于是打算从CNN里的SPP开始学习. SPP[Space Pyramid Po ...

  6. CNN应用之SPP(基于空间金字塔池化的卷积神经网络物体检测)-ECCV 2014-未完待续

    基于空间金字塔池化的卷积神经网络物体检测 原文地址:http://blog.csdn.net/hjimce/article/details/50187655 作者:hjimce 一.相关理论 本篇博文 ...

  7. 空间金字塔池化SPP

    空间金字塔池化 1.提出的原因 下面这里是我们在网上反复可以看见的话(所以关键是理解这些内容): 提出的原因: 在SPP提出之前,传统的网络具有它有两大缺点: 1.通常需要输入固定大小的图片来进行训练 ...

  8. 基于空间金字塔池化的卷积神经网络物体检测

    基于空间金字塔池化的卷积神经网络物体检测 原文地址:http://blog.csdn.net/hjimce/article/details/50187655 作者:hjimce 一.相关理论 本篇博文 ...

  9. 深度学习(十九)基于空间金字塔池化的卷积神经网络物体检测-ECCV 2014

    基于空间金字塔池化的卷积神经网络物体检测 原文地址:http://blog.csdn.net/hjimce/article/details/50187655 作者:hjimce 一.相关理论 本篇博文 ...

最新文章

  1. sql移除数据中的换行符和回车符
  2. POJ 2352 Stars (线段树)
  3. 今晚直播 | 清华大学​高天宇:对比学习及其在NLP中的应用
  4. 论文浅尝 | 通过阅读实体描述进行零样本的实体链接
  5. 【二分法】- leetcode
  6. HDFS(名称节点与数据节点)简介
  7. 关于一个跨域的小问题
  8. Floppy Zip Disk Rescue注册码分析
  9. linux测试进程内存,怎么测试进程运行时的内存用量
  10. 零零散散的一些知识点(二)
  11. github issue 搜索_启用 GitHub Issue 作为博客留言系统 - Farseerfc的小窝
  12. Unix网络编程之epoll函数模拟10万客户端链接服务器
  13. 大上显示器,你的护眼利器
  14. thinkphp使用paypal进行支付的做法详细步骤
  15. 计算机用户名取名,重命名电脑用户名
  16. 主流大数据调度工具对比(DolphinScheduler特点)
  17. Java技术栈学习路线
  18. 如何解除计算机的启动项,UEFI安全启动怎么关闭 关闭UEFI启动项的方法图解
  19. Navicat提示Access violation at address 004E9844 in module ‘navicat.exe’
  20. 交叉编译详解 - 概念篇

热门文章

  1. 最新蚂蚁金服三面+HR一面,面试经验总结及分享(拿offer)
  2. 多线程、多进程的区别及适用场景
  3. [转载]如何正确设计登录表单
  4. 2022,了不起的程序员日历来啦!
  5. 六、微服务版的单点登陆系统设计及实现
  6. 托福、雅思、托业、剑桥:英语证书谁领风骚?
  7. 浅谈王者荣耀的匹配算法
  8. fifaonline3服务器位置,fifaonline3 无法解析服务器发送的参数是怎么回事?
  9. iphone与iTunes同步应用程序时,保持iphone上的图标顺序
  10. 小白学 Python 爬虫(28):自动化测试框架 Selenium 从入门到放弃(下)