SPM:Spatial Pyramid Matching for Recognizing Natural Scene Categories 空间金字塔匹配

SPM即Spatial Pyramid Matching,是一种利用空间金字塔进行图像匹配、识别、分类的算法。SPM是BOF(Bag Of Features)的改进,因为BOF是在整张图像中计算特征点的分布特征,进而生成全局直方图,所以会丢失图像的局部/细节信息,无法对图像进行精确地识别。为了克服BOF的固有缺点,作者提出了SPM算法,它是在不同分辨率上统计图像特征点分布,从而获取图像的局部信息。

如上图所示,将level(i)的图像划分为pow(4,i)个cell(bins),然后再每一cell上统计直方图特征,最后将所有level的直方图特征连接起来组成一个vector,作为图形的feature。在后文的描述中cell和bins是等价的。

Pyramid Match Kernels:

1)假设存在两个特征集合X、Y,其中每个特征x的维度为d。将特征空间划分为不同的尺度,在尺度下把特征空间的每一维划出个bins,那么d维的特征空间就能划出个bins(论文中这么描述,但是在实际中是用K-means或BOW进行聚类,得到的每个类中心就是一个bin)。

2)  在level(i)中,如果点x,y落入同一bin中就称x,y点Match,每个bin中匹配的点的个数为min(Xi, Yi),其中Xi, Yi代表相应level下的第i个bin。

3)表示X、Y在level 下的直方图特征,表示level 中X、Y落入第i个bin的特征点的个数,那么在level 下匹配的点的总数为:

在后文中,我们把简写为

4)统计各个尺度下match的总数(就等于直方图相交)。由于细粒度的bin被大粒度的bin所包含,为了不重复计算,每个尺度的有效Match定义为match的增量

5)不同的尺度下的match应赋予不同权重,显然大尺度的权重小,而小尺度的权重大,因此定义权重为

6)两个点集X、Y的匹配程度pyramid match kernel为:

       (3)

 Spatial Matching Scheme

         上面的黑圆点、方块、十字星代表一副图像上某个pitch属于kmeans后词典中的某个词;
        1)将图像划分为固定大小的块,如从左到右:1*1,2*2,4*4, 然后统计每个方块中词中的不同word的个数;
2)从从左到右,统计不同level中各个块内的直方图;
        3)最后个将每个level中获得的直方图都串联起来,并且给每个level赋给相应的权重,从左到右权重依次增大;
        4)将spm放入svm中进行训练和预测;

论文中的实验过程如下:

1)用 strong feature detector即SIFT进行特征检测,patch size=16*16,patch每次移动的步长spacing grid=8*8。

2)按照BOF相同的方法(即KMeans)构建包含M个words的dictionary。

3)利用图像金字塔把图像划分为多个scales的bins,然后计算落入每个bins中属于不同类别的word的个数,则图像X、Y最终的匹配度为:

4)把所有level下的直方图特征连接起来组成一个维度为的feature,作为分类的特征向量。

SPM代码下载:http://www.cs.illinois.edu/homes/slazebni/

SPM空间金字塔匹配模型相关推荐

  1. 空间金字塔匹配 matlab,基于核函数匹配的空间金字塔物体识别方法

    基于核函数匹配的空间金字塔物体识别方法 [技术领域]: [0001] 本发明涉及机器视觉领域,特别涉及一种基于核函数匹配的空间金字塔物体识别 方法. [背景技术]: [0002] 随着计算机和多媒体技 ...

  2. SPM空间金字塔模型

    1 基本介绍 SPM 全称是Spatial Pyramid Matching,出现的背景是bag of visual words模型被大量地用在了图像表示(Image representation)中 ...

  3. 空间金字塔匹配Spatial Pyramid Matching 小结

    稀疏编码系列: (一)----Spatial Pyramid 小结 (二)----图像的稀疏表示--ScSPM和LLC的总结 (三)----理解sparse coding (四)----稀疏模型与结构 ...

  4. 用于视觉识别的深度卷积网络空间金字塔池化方法

    摘要 现有的深卷积神经网络(CNN)需要一个固定大小的神经网络(例如224x224)的输入图像.这种要求是"人为的",可能会降低对任意大小/尺度的图像或子图像的识别精度.在这项工作 ...

  5. 空间金字塔方法表示图像

    注:本学习笔记是自己的理解,如有错误的地方,请大家指正,共同学习进步. 本文学习自CVPR论文<Discriminative Spatial Pyramid>.<Discrimina ...

  6. 词袋模型和空间金字塔模型

    1 词袋模型 李菲菲认为图像可以类比文档,图像的子块或特征点可以看作是单词,则可以统计图像中所有特征的直方图表示图像,即得到图像的BoW(bag of words)模型.图1是BoW模型的示例图,对于 ...

  7. TGRS2021:Road Segmentation for Remote Sensing ImagesUsing Adversarial Spatial Pyrami对抗性空间金字塔网络的道路分割

    TGRS2022:Road Segmentation for Remote Sensing ImagesUsing Adversarial Spatial Pyramid Networks基于对抗性空 ...

  8. 基于空间金字塔网络的光流估计

    Optical Flow Estimation using a Spatial Pyramid Network 我们学习通过结合经典的空间金字塔公式和深度学习来计算光流.通过当前流量估计和计算流量更新 ...

  9. (AAAI-2019)用于行人重识别的水平金字塔匹配

    用于行人重识别的水平金字塔匹配 论文题目:Horizontal Pyramid Matching for Person Re-Identification paper是贝克曼研究所发表在AAAI201 ...

最新文章

  1. ASP.NET 文件操作实例
  2. ----uni-app之修改头像----
  3. C#综合揭秘——细说多线程(上)
  4. python哲学内容 多行胜于单行_Python3基础 __doc__ 单行与多行函数文档
  5. 【性能测试】如何用一条命令完全掌握linux系统性能监控(top高阶用法)
  6. NVIDIA Jetson Nano B01 安装Ubuntu 18.04.3 LTS
  7. 【Jmeter篇】临界区控制器Critical Section Controller业务流顺序负载压测
  8. 本地随机图床api源码
  9. 利用光盘恢复grub引导器
  10. java类后面的尖括号_泛型 - Java中的T(尖括号)是什么意思?
  11. 数据挖掘导论完整版pdf中文
  12. 快速开发:普元EOS平台简介
  13. 硬件 JavaScript - 一个【电阻分压器 - 计算器】
  14. 青少儿科学小实验:水的表面张力
  15. Graylog 3.3.8安装笔记(yum,docker,docker-compose)
  16. 免费PDF翻译,不限页数,不限字数,保留排版
  17. 记一次线上微信公众号迁移遇到的坑
  18. HTML的相关标记和属性
  19. NOIP11.15模拟 T2 三部曲
  20. 北京数字认证股份有限公司-数字证书认证管理解决方案

热门文章

  1. Springboot整合Quartz任务框架
  2. 吃鸡服务器维护2月8号,绝地求生正式服2月8日更新
  3. Arcgis更换布局模板_ArcGIS制图及出图小技巧—以土地利用图为例(干货超详细)...
  4. iOS下border一半不显示问题
  5. 注册域名,购买阿里云服务器,备案,域名解析图文教程简介
  6. WiFi大师安装教程(官方正版)
  7. shell编程扩展----文本编辑器
  8. 2023中职组网络搭建与运维赛项规程
  9. 基于Python的电影票房爬取与可视化系统的设计与实现
  10. Android之九宫格抽奖及大转盘抽奖