注:本学习笔记是自己的理解,如有错误的地方,请大家指正,共同学习进步。

本文学习自CVPR论文《Discriminative Spatial Pyramid》、《Discriminative Spatial Saliency for Image Classification》及《Beyond Bags of Features: Spatial Pyramid Matching
for Recognizing Natural Scene Categories》,在此感谢论文作者。

空间金字塔方法表示图像是传统BOF(Bag Of Features)方法的改进,传统BOF方法提取图像特征时,首先提取每张图像的SIFT特征描述,之后将所有图像的兴趣点的特征描述进行聚类形成BOW视觉词袋,最后对每张图像统计所有视觉关键词出现的频次。因此BOF是在整张图像中计算特征点的分布特征,进而生成全局直方图,所以会丢失图像的空间分布信息,无法对图像进行精确地识别。为了克服BOF的这一缺点,提出了空间金字塔方法,它是在不同分辨率上统计图像特征点分布,从而获取图像的空间信息。 图像被划分为金字塔各水平上的逐渐精细的网格序列,从每个网格中导出特征并组合为一个很大的特征向量。

1、图像尺度空间

SIFT中的图像尺度空间可以理解为用高斯对图像做了卷积,图像的分辨率还是那么大,像素还是那么多,只是细节被平均(平滑)掉了,原因就是高斯了,用周围的信号比较弱的像素和中间那个信号比较强的点做平均,平均值当然比最强信号值小了,这就起到了平滑的作用。如下图所示:

尺度可变高斯函数:

2、图像金字塔

金字塔是图像多尺度表示的主要形式,图像金字塔是以多分辨率来解释图像的一种有效但概念简单的结构。一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低的图像集合。如下图所示。

图像金字塔化一般包括二个步骤:1、利用低通滤波器平滑图像;2、对平滑图像进行抽样,从而得到一系列尺寸缩小的图像。

3、空间金字塔表示图像

《Discriminative Spatial Pyramid》

原始方法是首先提取原图像的全局特征,然后在每个金字塔水平把图像划分为细网格序列,从每个金字塔水平的每个网格中提取出特征,并把它们连接成一个大特征向量。但由于图像中每个局部区域反映的信息量不同,由此提出加权空间金字塔方法,及给每层每网格分配一个权重,按权重把每层每网格特征加权串联在一起。如下图:

左边图像是原始方法,右边是加权方法。

fkl表示第l层第k网格的特征向量,特征用d维向量表示,c(l)表示l层金字塔的网格数。原始方法中,一幅图像的空间金字塔特征向量表示为fs,如下:

加权方法表示为fw,如下:

4、空间金字塔匹配SPM

《Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories》

空间金字塔匹配Spatial Pyramid Matching(SPM),是一种利用空间金字塔进行图像匹配、识别、分类的算法。

如下图所示,将level(i)的图像划分为pow(4,i)个cell(bins),然后再每一cell上统计直方图特征,最后将所有level的直方图特征连接起来组成一个vector,作为图形的feature。

上面的黑圆点、方块、十字星代表一副图像上某个pitch属于k-means后词典中的某个词;

1)将图像划分为固定大小的块,如从左到右:1*1,2*2,4*4, 然后统计每个方块中词中的不同word的个数;

2)从从左到右,统计不同level中各个块内的直方图;

3)最后个将每个level中获得的直方图都串联起来,并且给每个level赋给相应的权重,从左到右权重依次增大;

4)将SPM放入SVM中进行训练和预测;

论文中的实验过程如下:

1)用 strong feature detector即SIFT进行特征检测,patch size=16*16,patch每次移动的步长spacing grid=8*8。

2)按照BOF相同的方法(即KMeans)构建包含M个words的dictionary。

3)利用图像金字塔把图像划分为多个scales的bins(空间金字塔分层分网格),然后计算落入每个bins中属于不同类别的word的个数,则图像X、Y最终的匹配度为(M为关键词个数):(个人对此匹配度核函数的理解是:这个核函数可当作SVM中的核函数,来匹配两幅图像是否为一类)

空间金字塔方法表示图像相关推荐

  1. 用于视觉识别的深度卷积网络空间金字塔池化方法

    摘要 现有的深卷积神经网络(CNN)需要一个固定大小的神经网络(例如224x224)的输入图像.这种要求是"人为的",可能会降低对任意大小/尺度的图像或子图像的识别精度.在这项工作 ...

  2. 空间金字塔匹配 matlab,基于核函数匹配的空间金字塔物体识别方法

    基于核函数匹配的空间金字塔物体识别方法 [技术领域]: [0001] 本发明涉及机器视觉领域,特别涉及一种基于核函数匹配的空间金字塔物体识别 方法. [背景技术]: [0002] 随着计算机和多媒体技 ...

  3. Spatial Pyramid Pooling(空间金字塔池化)-变尺度CNN训练

    1. 需求创造好的产品,产品拓宽原始的需求 当前的深度神经网络一般都需要固定的输入图像尺寸(如224*224). 这种需求很明显是人为的,潜在性的弊端会降低识别精度(为了使图像尺寸相同,一定会涉及到图 ...

  4. TGRS2021:Road Segmentation for Remote Sensing ImagesUsing Adversarial Spatial Pyrami对抗性空间金字塔网络的道路分割

    TGRS2022:Road Segmentation for Remote Sensing ImagesUsing Adversarial Spatial Pyramid Networks基于对抗性空 ...

  5. 深入理解空间金字塔池化(SPP,ASPP)

    读Lawin Transformer这篇论文,里面有介绍到在Transformer结构中使用ASPP,有很多细节没有理解,于是打算从CNN里的SPP开始学习. SPP[Space Pyramid Po ...

  6. [Neck] 空间金字塔池化【池化策略】(Space Pyramid Pool, SPP)模块和路径聚合网络【增强】(Path Aggregation Network, PANet)的结构

    文章目录 背景 yolo v4 中的空间金字塔池化(Space Pyramid Pool, SPP)模块和路径聚合网络(Path Aggregation Network, PANet)的结构 SPP ...

  7. SPM空间金字塔模型

    1 基本介绍 SPM 全称是Spatial Pyramid Matching,出现的背景是bag of visual words模型被大量地用在了图像表示(Image representation)中 ...

  8. 词袋模型和空间金字塔模型

    1 词袋模型 李菲菲认为图像可以类比文档,图像的子块或特征点可以看作是单词,则可以统计图像中所有特征的直方图表示图像,即得到图像的BoW(bag of words)模型.图1是BoW模型的示例图,对于 ...

  9. 基于空间金字塔网络的光流估计

    Optical Flow Estimation using a Spatial Pyramid Network 我们学习通过结合经典的空间金字塔公式和深度学习来计算光流.通过当前流量估计和计算流量更新 ...

最新文章

  1. 正面反击 Google、FB 等巨头,万维网之父携 Solid 归来
  2. 史上曾被认为不可能的十大科学难题全被实现
  3. 查看 PHP apache nginx mysql 是如何编译的
  4. FileUpload路径
  5. python pandas 排序_python – pandas:单独对每列进行排序
  6. matlab中仿真丢包,使用MATLAB进行误比特率(BER)仿真----转载
  7. 使用Leaflet创建地图拓扑图
  8. DeleteDC、ReleaseDC、DeleteObject - [Daliy APIs]
  9. win11怎么去除快速搜索 Windows11去除快速搜索的步骤方法
  10. Java 为图形填充渐变色
  11. Java程序员需要了解的几个开源协议介绍
  12. 使用openssl模拟CA和CA证书的签发
  13. java二进制文件转xml_简单Java类与XML之间的转换
  14. OpenvSwitch实现简单VLAN
  15. ZZULIOJ1026-1030Python解法
  16. 【ArcGIS微课1000例】0019:什么是Shapefile文件?Shapefile文件之全解
  17. 一文搞懂Handler机制原理
  18. python算程序员吗_2019为什么有人说Python程序员是假的程序员?
  19. 超有爱的并查集 6666
  20. MPB:猪胃肠道内容物和黏膜样品采集与微生物组成分析

热门文章

  1. 电脑 计算机服务打不开怎么办理,电脑xlsx打不开怎么办
  2. php文章远程图片,php保存远程图片到本地 php正则匹配文章中的远程图片地址
  3. ubuntu apt-get彻底卸载软件包
  4. 计算机基础知识应用文档,计算机基础知识与应用
  5. mfc将文件内容引入编辑框_南开大学黄津辉教授团队联合加拿大麦克马斯特大学Ravi教授团队发表微型MFC水质传感器实际废水检测适用性的研究...
  6. 手把手教你 Vue 服务端渲染
  7. spring web参数传递
  8. ubuntu下eclipse的svn插件使用javahl
  9. WebSocket在容器化管理平台的应用
  10. JMeter基础之——录制脚本