本文主要介绍:SPM(空间金字塔匹配)的基本原理和计算方法。

1 基本介绍

SPM 全称是Spatial Pyramid Matching,出现的背景是bag of visual words模型被大量地用在了图像表示(Image representation)中,但是BOVW模型完全缺失了特征点的位置信息。SPM考虑空间信息,将图像分成若干块(sub-regions),分别统计每一子块的特征,最后将所有块的特征拼接起来,形成完整的特征,这就是SPM中的Spatial。在分块的细节上,采用了一种多尺度的分块方法,即分块的粒度越大越细(increasingly fine),呈现出一种层次金字塔的结构,这就是SPM中的Pyramid。

如下图,对图像采用不同的尺度进行分块,得到不同尺度的图像,不同尺度构成层次关系:

上图中,不同的点可以看作不同的特征,每层中,点的个数,可以理解为该关键点或区域特征在该层次图像出现的频率,统计每个特征在不同层次图像中分布情况,可以得到每个特征的金字塔:

从level 2 到level 0类似The Pyramid Match Kernel中,直方图取不同间隔,即把level 2看做间隔为1,有16个bin,level 1间隔为2,得到4个bin....因此,对于两幅图像,用相同的尺度划分层次,并统计每个层次中每个cells中某特征出现的次数,得到该特征下的金字塔。

2 计算方法

可以用和The Pyramid Match Kernel相似的方法计算两个图形在该特征下的匹配程度(也可理解为相似度)。匹配方法如下:

每个层次的匹配点数:

说明:

1. SPM介绍了两幅图像匹配的方法。如要用于场景分类,上式就等于M(L+1)个直方图相交运算的和,其实也就等于一个更大的向量直接进行直方图相交运算而已。而这个向量,就等于每个被划分的图像子区域上的visual words直方图连在一起。这个特征,就是用来分类的特征。

2. 作者在实验中表明,不同L下,M从200取到400对分类性能影响不大,也就是降低了码书的大小对分类效果的影响。

3. 这个方法可以作为一个模板,每个分块图像(sub-region)中统计的直方图可以多种多样,简单的如颜色直方图,也可以用HOG,这就形成了PHOG(分层梯度直方图)。

4. 只不过这种空间分类信息仍然有局限性-----一幅相同的图像旋转90度,匹配的结果就不会太高了。所以模型隐含的假设就是图像都是正着存储的(人都是站立的,树都是站立的.......)。Spatial BOW (Spatial-bag-of-features[C])好像可以解决这个问题。

5. 另外空间Pyramid的分块方法也没有考虑图像中目标的完整性(仅仅是利用SIFT特征来描述了Object),即,在对图像分块时,可能会把一个目标分在不同块中。

理论原文:Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories

SPM——Spatial Pyramid Matching相关推荐

  1. 空间金字塔匹配Spatial Pyramid Matching 小结

    稀疏编码系列: (一)----Spatial Pyramid 小结 (二)----图像的稀疏表示--ScSPM和LLC的总结 (三)----理解sparse coding (四)----稀疏模型与结构 ...

  2. Spatial Pyramid Matching

    稀疏编码系列: (一)----Spatial Pyramid 小结 (二)----图像的稀疏表示--ScSPM和LLC的总结 (三)----理解sparse coding (四)----稀疏模型与结构 ...

  3. Spatial Pyramid Matching 小结

    稀疏编码系列: (一)----Spatial Pyramid 小结 (二)----图像的稀疏表示--ScSPM和LLC的总结 (三)----理解sparse coding (四)----稀疏模型与结构 ...

  4. 空间金字塔Spatial Pyramid的BOW和Pyramid HOG的多核

    经过我的实验,发现在基于模板法的object detection或者classification中,将Pyramid Histogram of Oriented Gradients (PHOG)和Sp ...

  5. Spatial Pyramid Pooling(空间金字塔池化)-变尺度CNN训练

    1. 需求创造好的产品,产品拓宽原始的需求 当前的深度神经网络一般都需要固定的输入图像尺寸(如224*224). 这种需求很明显是人为的,潜在性的弊端会降低识别精度(为了使图像尺寸相同,一定会涉及到图 ...

  6. Paper8:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

    Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 还未读

  7. [SPP-NET]Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

    基于空间金字塔池化的卷积神经网络物体检测 原文地址:http://blog.csdn.net/hjimce/article/details/50187655 作者:hjimce 一.相关理论 本篇博文 ...

  8. 目标检测--Spatial pyramid pooling in deep convolutional networks for visual recognition(PAMI, 2015)

    Spatial pyramid pooling in deep convolutional networks for visual recognition 作者: Kaiming He, Xiangy ...

  9. 语义分割——Spatial Pyramid Pooling (SPP)的作用

    1 前言 我们在DeepLabV3+中学习到了ASPP算法,ASPP就是使用了膨胀卷积的Spatial Pyramid Pooling (SPP)- 2 SPP的作用 --多尺度特征融合: --将不同 ...

最新文章

  1. Sharepoint学习笔记 –架构系列—09 Sharepoint的服务器端对象模型(Server Object Model) 1.物理对象层次结构
  2. 【51nod - 1050】循环数组最大子段和(dp)
  3. C++ vector用法
  4. centos安装最新版的docker-ce(二进制安装)
  5. IBM MQ 使用指南
  6. opboot怎么刷入固件_没有固件可刷的路由器,那就开个 SSH 折腾一下
  7. twrp两种方式刷入的mm管理器_Google Pixel C 刷入Magisk
  8. fiddler抓包后Jmeter实现登录接口
  9. 如何设置sap生产订单自动关闭
  10. WIN7镜像中增加USB3.0驱动和语言包
  11. matlab 计算 Lorenz 系统最大李雅普诺夫指数
  12. Delphi2010及注册码下载地址
  13. C++--最大公约数和最小公倍数
  14. Javascript和C#正则只保留英文、数字、汉语、空格
  15. Vue 轻量级后台管理系统基础模板
  16. Gitbub认证及代码提交
  17. r5 7600x和r7 7700x差距
  18. mysql面试题总结
  19. VS Code插件Code Runner使用python虚拟环境
  20. 程序人生-hello`s P2P

热门文章

  1. Folx Pro5 MAC激活密钥序列号下载V5.20.13943
  2. Panda3D绘制立方体
  3. 2019长沙理工大学计算机专业分数线,2019长沙理工大学各省各批次录取分数线汇总...
  4. COLUMBIA电影公司片头的女人是谁
  5. Xunsearch与Sphinx的预比较
  6. <input type = “button“>和<button></button>的区别
  7. [SCOI2012]滑雪 洛谷p2573
  8. P4924 [1007]魔法少女小Scarlet
  9. 熊掌号PHP,百度熊掌号广受站长关注,phpcm网站程序的熊掌号页面改造插件
  10. 俺是东北人,俺骄傲!