SPP(spatial pyramid pooling)

在spp出来之前,所有神经网络都是要输入固定尺寸的图片,比如经常遇到的224×224,图片输入网络前都要resize到224×224,导致图片变形,其中的信息也变形了,从而限制了识别精度。而SPP和ASPP就是为了解决这个问题,它可以让网络输入原图而不必resize。空间池化层实际就是一种自适应的层,这样无论你的输入是什么尺寸,输出都是固定的(21xchannel)

SPP的显著特点是:

  1. 不管输入尺寸大小,SPP 可以产生固定尺寸的输出
  2. 使用多个不同大小的pooling窗口
  3. SPP 可以使用同一图像不同尺寸(scale)作为输入, 得到同样长度的池化特征。

ROI Pooling是针对RoIs的Pooling,其特点是输入特征图尺寸不固定,但是输出特征图尺寸固定。ROI Pooling的思想来自于SPPNet中的Spatial Pyramid Pooling,在Fast RCNN中使用时,将SPPNet中多尺度的池化简化了为单尺度。

SPP,PPM、ASPP、FPN相关推荐

  1. 目标检测算法的大体框架-------backbone、head、neck

        在基于深度学习算法的目标检测算法其实大体上都是由三部分组成的,即backbone.head.neck.整个算法的设计流程基本都是:输入->backbone->neck->he ...

  2. SPP、ASPP与PPM

    SPP.ASPP与PPM SPP PPM ASPP SPP SPP模块是何凯明大神在2015年的论文<Spatial Pyramid Pooling in Deep ConvolutionalN ...

  3. 基于深度学习的目标检测算法对比分析(RCNN、SPP、YOLO、SSD、FPN、RetinaNet)

    目录 (1) RCNN与SPP的比较 (2) RCNN → Fast RCNN → Faster RCNN (3) YOLO与RCNN类方法比较 (4) YOLO与SSD的比较 (5) YOLO v1 ...

  4. 杂学——硬件:MIPI,压/速/频信号、并行转串行,SDI,PPM,单片机及开发板,交流直流,电容电阻,总线,RS485

    MIPI(移动产业处理器接口): MIPI DSI协议介绍 摄像头的MIPI接口.DVP接口和CSI接口(百度知道) MIPI接口资料汇总(精) 串行接口.并行接口.低压差分信号.差分布线: Alti ...

  5. YOLO、SSD、FPN、Mask-RCNN检测模型对比

    YOLO.SSD.FPN.Mask-RCNN检测模型对比 一.YOLO(you only look once) YOLO 属于回归系列的目标检测方法,与滑窗和后续区域划分的检测方法不同,他把检测任务当 ...

  6. 干货丨计算机视觉必读:图像分类、定位、检测,语义分割和实例分割方法梳理(经典长文,值得收藏)

    文章来源:新智元 作者:张皓 [导读]本文作者来自南京大学计算机系机器学习与数据挖掘所(LAMDA),本文直观系统地梳理了深度学习在计算机视觉领域四大基本任务中的应用,包括图像分类.定位.检测.语义分 ...

  7. 干货 | 一文概览主要语义分割网络,FCN、UNet、SegNet、DeepLab 等等等等应有尽有

    翻译不易,麻烦 Ctrl-C Ctrl-V 之后标注转载并加上原译者!! 部分内容翻译,部分内容原创. 内容较多,可以传送门直达.新网络待更- 文章目录 介绍 网络架构 Fully Convoluti ...

  8. Anchor-free新思路,统一目标检测、实例分割、姿态估计三种任务

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:https://zhuanlan.zhihu.com/p/366651996(授权转载) 作者:小马哥,编辑: ...

  9. Google面试题—有四个线程1、2、3、4。线程1的功能就是输出1,线程2的功能就是输出2,以此类推.........现在有四个文件ABCD...

    分类: windows编程 C++ 2012-10-27 19:56 3410人阅读 评论(1) 收藏 举报 有四个线程1.2.3.4.线程1的功能就是输出1,线程2的功能就是输出2,以此类推.... ...

最新文章

  1. Gson源码分析之Json结构抽象和注解使用
  2. idea 项目编译不成功-循环依赖的问题
  3. 物联网是“互联网+”的动力 智慧是核心
  4. 05设计模式——抽象工厂模式
  5. mysql shell 配置mysql_Windows Mysql shell 配置
  6. word-wrap、word-break、white-space
  7. Wise UNpacker 0.91A [with Delphi Source]
  8. 拓端tecdat|matlab使用移动平均滤波器、重采样和Hampel过滤器进行信号平滑处理
  9. 计算机思维在化学上的应用,信息技术在化学教育中的应用
  10. 2022年计算机软件水平考试信息系统管理工程师(中级)练习题及答案
  11. C语言将图片转化成Base64码
  12. 流量分析(wireshark使用)
  13. Python 使用 LibSVM
  14. error: dst ref refs/heads/master receives from more than one src
  15. 植物叶片——丙二醛MDA
  16. 洛谷P3803 fft模板
  17. 关于抖音如何热门,怎么上推荐获取更多的流量,获取更多的抖音粉丝
  18. 遨博协作机器人ROS开发 - 遨博E5 DH参数SolidWorks建模
  19. 还不会做销售分析?掌握这3个思路,让你秒变分析高手
  20. java版出库入库_Java实现商品的查找、添加、出库、入库操作完整案例

热门文章

  1. 删除chrome中特定的搜索记录
  2. redis的五种常用数据结构、Pub/Sub数据结构、Stream数据结构
  3. 框架:你会用又能写,但是你能说明白什么是框架吗
  4. 计算机中tan怎么计算公式,计算器arctan怎么按
  5. canvas 色彩、线型、渐变、图案、阴影
  6. 供应链管理:企业的三大核心职能之一
  7. 华为鸿蒙西北,华为联合西北工业大学开设“鸿蒙生态菁英班”: 50 人左右,锁定终端软件领域...
  8. 锦佰安科技与慢雾科技达成战略合作协议,共同为区块链生态安全保驾护航
  9. Go第 17 章 :反射
  10. android论坛功能开发教程,Android教程 如何免费生成论坛App