论文:赵仲秋,季海峰,高隽,胡东辉,吴信东.基于稀疏编码多尺度空间潜在语义分析的图像分类[J].计算机学报,2014,37(06):1251-1260.

文章摘要:
传统潜在语义分析方法无法利用图像中区域语义构成的上下文信息来获得图像目标空间分布信息,因此它丢掉了局部特征之间的空间关系信息。而基于最近邻矢量量化来构造共生矩阵具有较大的量化误差,使得特征描述缺乏鲁棒性,影响后续潜在语义分析获得特征的精确性。为了弥补这些不足,文中提出了一种基于稀疏编码的多尺度空间潜在语义分析的图像分类方法。首先通过空间金字塔方法对图像进行空间多尺度划分,然后利用稀疏编码对每个局部块特征进行软量化以形成共生矩阵,之后结合概率潜在语义分析(PLSA)获得每个局部块的潜在语义信息,再利用权值串接每个特定局部块中的语义信息得到图像多尺度空间潜在语义信息,最后用支持向量机(SVM)分类器完成图像的场景分类。在常见图像库上的实验表明,本文提出的基于稀疏编码的多尺度空间潜在语义分析方法平均分类精度比现有诸多方法均有明显提高,验证了其有效性和鲁棒性。实验还表明,空间金字塔匹配、稀疏编码共生矩阵以及PLSA降维这3个模块在该文方法中缺一不可,共同提升图像表征和分类性能。

从摘要中可知该文章所提出的稀疏编码多尺度空间潜在语义分析算法主要用到的模块主要有:空间金字塔,稀疏编码、概率潜在语义分析(PLSA)、支持向量机(SVM)。

图像分类方法主要可分为两类:基于全局特征、基于中层语义信息。 本文中指出基于图像的底层特征无法解决图像分类中的“语义鸿沟”问题,,即底层视觉特征和高层语义特征之间的不统一性。该问题即是底层特征难以捕捉重要特征,影响结果的正确率;并且全局特征存在的最显著的问题是特征无重点,数据量相对较大,占用资源严重;难以抓住有用信息。本文通过空间金字塔思想对图像进行空间分层和局部区域分块划分获得图像的局部块之间的空间关系,接着利用SC每个局部块进行软量化形成共生矩阵,再结合PLSA模型对每个局部块进行潜在语义挖掘以获得其潜在语义信息分布。最后通过权值将不同尺度上汇总的潜在语义信息进行串接得到图像最终的特征描述。画做图像可表示为:

本文的几个创新点(亮点):

1、NN-VQ → SC
SC利用了更多视觉字典中的基来表示特征描述子,而NN-VQ方法只选择1个基来表示局部特征描述子。本文采用SC方法取代原先的NN-VQ方法来进行量化形成共生矩阵,使 得生成的共生矩阵具有较小的重构误差。

2、本文借鉴PLSA主题模型在文本分析中的一些优良特性来对图像进行分析,将该模型用于图像局部区域潜在语义挖掘,使其获得的潜在语义特征具有较小的冗余性和歧义性。

3、图像多尺度空间潜在语义学习模型
以一个3层空间金字塔分块模型为例,第0层表示是原图像,第1层对图像进行2×2分块划分,第2层对图像进行4×4分块划分,则一共可以得到21个图像区域,如图:

4、训练和测试阶段
下图为基于稀疏编码多尺度空间潜在语义分析的图像分类的总体框架示意图.系统主要分为两个阶段:训练阶段和测试阶段。在训练阶段,通过本文提出的图像多尺度空间潜在语义模型学习得到最优的 PLSA模型,再结合该模型生成的图像多尺度空间潜在语义特征来训练SVM分类器模型,从而得到最优的SVM分类器模型.在测试阶段,首先结合训练阶段得到的最优PLSA模型参数P(w|z)及测试图像的每个局部区域软量化形成的共生矩阵,使用folding-in方法来计算测试图像的空间潜在语义信息分布,再联合训练阶段生成的最优SVM对该潜在语义信息分布向量进行分类,并将所得的置信度最高的语义类别作为该测试图像的类别标签从而实现测试图像分类。

本文结论

本文提出基于稀疏编码多尺度空间潜在语义分析的图像分类方法。通过图像分割的空间金字塔匹配提取目标空间位置信息;基于稀疏编码对局部区域进行特征软量化,形成共生矩阵,提高了共生矩阵对原始特征表述的准确性;最后,结合PLSA模型挖掘局部潜在语义信息,并串接每个局部的语义信息得到图像多尺度空间潜在语义信息.通过实验验证,本文方法同现有较好图像分类方法相比分类精度更高;而空间金字塔匹配、稀疏编码构建共生矩阵以及PLSA降维这3个模块在本文方法中缺一不可,使图像得到更精确的表征,共同提升图像分类性能。

赵仲秋《基于稀疏编码多尺度空间潜在语义分析的图像分类》论文阅读笔记相关推荐

  1. 论文阅读笔记(9):加权稀疏子空间表示——子空间聚类、约束聚类和主动学习的统一框架

    论文阅读笔记(9):WEIGHTED SPARSE SUBSPACE REPRESENTATION--A UNIFIED FRAMEWORK FOR SUBSPACE CLUSTERING, CONS ...

  2. 基于dota的目标检测(旋转框)论文阅读Oriented Object Detection in Aerial Images with Box Boundary-Aware Vectors

    基于dota的目标检测(旋转框)|论文阅读Oriented Object Detection in Aerial Images with Box Boundary-Aware Vectors 文章目录 ...

  3. 论文阅读笔记——基于CNN-GAP可解释性模型的软件源码漏洞检测方法

    本论文相关内容 论文下载地址--Engineering Village 论文阅读笔记--基于CNN-GAP可解释性模型的软件源码漏洞检测方法 文章目录 本论文相关内容 前言 基于CNN-GAP可解释性 ...

  4. 基于移动最小二乘法的曲线曲面拟合论文阅读笔记

    基于移动最小二乘法的曲线曲面拟合论文阅读笔记 论文地址:http://www.cnki.com.cn/Article/CJFDTotal-GCTX200401016.htm 一.Problem Sta ...

  5. 《基于改进YOLOv5的无人机图像检测算法》论文阅读

    原文链接:UAV Recognition and Tracking Method Based on YOLOv5 | IEEE Conference Publication | IEEE Xplore ...

  6. 基于sklearn.decomposition.TruncatedSVD的潜在语义分析实践

    文章目录 1. sklearn.decomposition.TruncatedSVD 2. sklearn.feature_extraction.text.TfidfVectorizer 3. 代码实 ...

  7. 基于深度学习的表面缺陷检测方法综述-论文阅读笔记

    //2022.3.2日阅读笔记 原文链接:基于深度学习的表面缺陷检测方法综述 (aas.net.cn) 个人对本篇综述内容的大致概括 论文首先介绍了表面缺陷检测中不同场景下的成像方案,主要根据表面颜色 ...

  8. 强化学习相关论文阅读笔记之稀疏奖励解决方法

    注:该系列文章为强化学习相关论文的阅读笔记,欢迎指正! 论文题目:<深度强化学习中稀疏奖励问题研究综述> 文章目录 1. 论文介绍 2. 论文结构 3. 研究背景 3.1 解决稀疏奖励的必 ...

  9. 【论文笔记】《基于深度学习的中文命名实体识别研究》阅读笔记

    作者及其单位:北京邮电大学,张俊遥,2019年6月,硕士论文 摘要 实验数据:来源于网络公开的新闻文本数据:用随机欠采样和过采样的方法解决分类不均衡问题:使用BIO格式的标签识别5类命名实体,标注11 ...

最新文章

  1. cto denalil
  2. 教育部:全国高考延期一个月,湖北北京再行决定
  3. 万众期待的《Cisco/H3C路由器配置与管理完全手册》开锣了
  4. 在屏幕上输出你好的python语句是_编程实现:在屏幕上输出中文字符“你好,世界”。(输出结果中不带双引号)_学小易找答案...
  5. 涨知识!船东提单和货代提单的区别!
  6. 万能驱动助理篡改主页为2345的解决办法
  7. 做老板欣赏的优秀员工 十大准则你达标吗?
  8. LINUX 第六章 Open WebMail完全安装手册
  9. 无敌打印(适用各种浏览器自带打印功能)
  10. 万人血书的前端开发自学资料(书籍+教程),它来了~
  11. Win10快捷键大全快速开发切换操作之道
  12. 快手磁力金牛和小店通的区别
  13. Python requests timeout 分析
  14. 2012年8月编程语言就业趋势
  15. LSTM Networks应用于股票市场探究
  16. Google Filament 源码学习(三):Material System (二)
  17. 前程无忧助力,再次举办湖北武汉网络专场招聘会
  18. 【CSS3】text-align属性
  19. [IOS APP]长恨歌-王安忆有声小说
  20. Clickhouse—时间窗口函数

热门文章

  1. 合规运营必备资质——ICP申请指南
  2. Cesium Entities部分要点
  3. 基于JAVA游戏资讯网站计算机毕业设计源码+系统+数据库+lw文档+部署
  4. 时间证明(time certificate)共识算法
  5. 简述linux系统应用架构,Linux系统架构和应用技巧
  6. 智能化运维管理平台,如何提高运维工作效率
  7. segnet和unet区别_图像分割:3D Unet网络性能一定优于2D Unet吗,如果优于,为什么优于?...
  8. C# 编写简单易用的 Windows 截屏增强工具
  9. SpringCloud-12-Eureka:自我保护机制
  10. 基于android的停车场管理系统,基于Android的智能停车场的制作方法