LIRE(Lucene Image Retrieval ) 是利用Apache Lucene 建立索引进行图像检索的开源软件库。该软件项目的网址是 http://lire-project.net。LIRE这个软件库可以很方便地建立Lucene索引进行基于内容的图像检索 (CBIR, content based image retrieval ),该库为检索提供了丰富的图像特征提取方法。这里提醒大家一下,如果使用LIRE时你要用Lucene 建立索引,请注意Lucene版本兼容问题。本文对LIRE 特征提取方法做简介,不介绍LIRE其他方面。

1 全局特征

LIRE源码解压后,在src\main\java\net\semanticmetadata\lire\imageanalysis\features路径下有global文件夹,里面有20个全局特征提取方法。

1.1 ACCID

ACCID特征的目的是寻找不同尺度下最重要的边缘特征,然后把它们和使用 CEDD描述子得到的模糊色彩方案一起储存在一个直方图里。

1.2 AutoColorCorrelogram

AutoCorrelogram特征基于颜色,算法参考Huang, J.; Kumar, S. R.; Mitra, M.; Zhu, W. & Zabih, R. (2007) "Image Indexing Using Color Correlograms", IEEE Computer Society. DOI: 10.1109/CVPR.1997.609412。一个颜色相关图(color correlogram) 是一个用颜色和像素间距离建立索引的三维数据表。它代表了一个图像中,颜色改变的空间相关性是如何随距离变化的。

1.3 BinaryPatternsPyramid

BinaryPatternsPyramid和PHOG一样,但PHOG是以方向渐变来量度,而这里用的是旋转不变性的局部二值模式(LBP, Local binary patterns)的直方图。

1.4 CEDD

CEDD是颜色和边缘方向性描述子,将图像的颜色和边缘方向性信息结合起来生成一个144字节的直方图。关于CEDD的更多知识可以参考 Savvas A. Chatzichristofis and Yiannis S. Boutalis, CEDD: Color and Edge Directivity Descriptor. A Compact Descriptor for Image Indexing and Retrieval, A. Gasteratos, M. Vincze, and J.K. Tsotsos (Eds.): ICVS 2008, LNCS 5008, pp. 312-322, 2008.

1.5 ColorLayout

ColorLayout是MPEG-7多媒体标准描述子中一种高效的颜色特征描述子。通过图像分割、代表颜色选择、离散余弦变换(DCT, Discrete Cosine Transform)、Z字形扫描四个步骤得到特征描述子。(用于CEDD)

1.6 EdgeHistogram

EdgeHistogram是MPEG-7多媒体标准描述子中一种高效的边缘特征描述子。用一个40个字节的数组构成一个边缘直方图描述子。通过图像分割、计算子图边缘直方图、归一化、计算图像边缘直方图等步骤得到特征描述子。(用于CEDD)

1.7 FCTH

FCTH是模糊颜色和纹理直方图特征。它从3个模糊单元的组合求得。先将图像分割,然后用两个模糊单元产生模糊颜色直方图,再在第三个模糊单元中将子图经小波变换生成模糊纹理直方图,最后模糊颜色直方图和模糊纹理直方图结合得到FCTH特征描述子。更多信息请参考:Savvas A. Chatzichristofis and Yiannis S. Boutalis, FCTH: Fuzzy Color and Texture Histogram - A Low Level Feature for Accurate Image Retrieval, in Proceedings of the Ninth International Workshop on Image Analysis for Multimedia Interactive Services, IEEE, Klagenfurt, May, 2008.

1.8 FuzzyColorHistogram 

FuzzyColorHistogram是一种模糊颜色直方图特征。传统颜色直方图对噪音敏感。模糊颜色直方图通过模糊算法产生模糊颜色直方图。

1.9 FuzzyOpponentHistogram

FuzzyOpponentHistogram是基于对色(对手颜色)空间的简单的模糊64-bin(维)对色直方图。更多信息参考Sande K E A V D , Gevers T , Snoek C G M . Evaluating color descriptors for object and scene recognition. IEEE Trans Pattern Anal Mach Intell[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(9):1582-1596.

1.10 Gabor

Gabor纹理特征通过对图像与gabor滤波器做卷积而得到,gabor滤波器定义为高斯函数与正弦函数的乘积。Gabor特征提取模拟了人类视觉刺激响应,广泛应用于视觉信息理解,例如人脸识别。

1.11 JCD

JCD特征将CEDD和FCTH结合在一个直方图里面。

1.12 JpegCoefficientHistogram

JpegCoefficientHistogram是JPEG 系数直方图特征。将图像分块,然后求离散余弦变换(DCT,Discrete Cosine Transform。JPEG图像压缩时要做DCT变换),计算DCT系数矩阵,再从得到的差分DCT系数矩阵求得直方图。适用于JPEG图像检索。

1.13 LocalBinaryPatterns

LocalBinaryPatterns是原始的局部二值模式特征。在图像每个3*3像素块中,以中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,大于中心像素值的像素点标记为1,反之为0,中心点周围8个点经比较产生8位二进制数,将其转换为十进制数作为中心像素点的LBP值,以此来反映该区域的纹理信息。

1.14 LuminanceLayout

LuminanceLayout描述子用于灰度或黑白图像。它将图像缩小到很小然后将它作为描述子。

1.15 OpponentHistogram

简单的64-bin(维)对色直方图,基于对色空间。参见1.9。

1.16 PHOG

PHOG描述子大体上就是将几个空间金字塔中不同层(可理解为图像缩小到不同分辨率)的边缘直方图结合在一起。更多信息参考 Anna Bosch, Andrew Zisserman & Xavier Munoz (2007) "Representing shape with a spatial pyramid kernel", CVIR 2007.

1.17 RotationInvariantLocalBinaryPatterns

一个简单的具有旋转不变性的局部二值模式特征。

1.18 ScalableColor

ScalableColor是MPEG-7 Scalable Color使用LireFeature的一个打包。可伸缩颜色描述符(Scalable Color Descriptor)是MPEG-7标准中颜色描述符的一种。它是固定于HSV空间的颜色直方图,用Haar变化编码,针对不同需求可改变尺寸。更多信息可参考:李志全, 黎建辉, 阎保平. MPEG-7可伸缩颜色描述符的研究[J]. 中国科学院大学学报, 2006, 23(2):192-197.

1.19 SimpleColorHistogram

SimpleColorHistogram提供一个简单的RGB颜色直方图,用于基于内容的图像检索。在LIRE的SimpleColorHistogram中,维数是可配置的,直方图归一化到每维8位。

1.20 Tamura

Tamura特征由Tamura提出,用粗糙度、对比度、方向度、 线像度、规整度和粗略度六个分量对应于心理学角度上纹理特征的六种属性。前三种最重要,所以LIRE的Tamura特征用前三个分量来实现。

2 局部特征

LIRE局部特征描述子包括:Simple、SelfSimilarities、Shapecontext、Sift、Surf。源码在src\main\java\net\semanticmetadata\lire\imageanalysis\features路径下local文件夹中。

2.1 Simple

Simple特征基于论文:Anagnostopoulos N , Boutalis Y , Kapoutsis A C , et al. Searching Images with MPEG-7 (& MPEG-7-like) Powered Localized dEscriptors: The SIMPLE answer to effective Content Based Image Retrieval[C]// International Workshop on Content-based Multimedia Indexing. IEEE, 2014。论文中,作者使用SURF检测子定义团状纹理突出部分,用MPEG-7 可伸缩颜色 Scalable Color ,颜色布局Color Layout以及边缘直方图Edge Histogram描述子以及CEDD来产生最终的局部特征描述子。

2.2 SelfSimilarities

SelfSimilarities特征基于论文:Chatfield K , Philbin J , Zisserman A . Efficient retrieval of deformable shape classes using local self-similarities[C]// IEEE International Conference on Computer Vision Workshops. IEEE Xplore, 2009。论文中,作者表示该特征描述子可用于快速检索图像,即使目标图像中物体缩放、图像颜色纹理发生变化、位置变化。此外,该特征对物体非刚性变形的鲁棒性也很好。

2.3 Shapecontext

Shapecontext特征基于论文: S. Belongie, J. Malik, and J. Puzicha, "Shape Matching and Object Recognition Using Shape Contexts," IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 24, no. 4, pp. 509-522, Apr. 2002。论文作者用新方法测量形状之间的相似性并将其用于物体识别。在该框架中,形状相似性量度通过两个步骤进行1)求两个形状间对应点;2)用这些对应来估算对准后的形变。为解决对应的问题,设计了shape context(形状上下文)描述子。这个shape context是一个参考点,它是周围余下点相对于它的分布。相对应的点会有近似的shape context。这样,两个相似的形状的对应点会有相似的shape context。

2.4 Sift

Sift是尺度不变特征变换(Scale-invariant feature transform)。它用不同尺度(标准差)的高斯函数对图像进行平滑,平滑后图像变化差别大的像素就是特征明显的点。 它对旋转、缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的鲁棒性。网上资料较多,大家也比较熟悉,这里不多说了。

2.3 Surf

Surf (Speeded Up Robust Features) 比SIFT要快数倍,而且其作者声称在不同图像变换方面比Sift更加稳健。Hessian矩阵是SURF算法的核心。Surf网上资料也很多,这里不多说了。

3 总结

LIRE提供的特征描述子中,ColorLayout、 ScalableColor是MPEG-7标准中颜色描述子中的其中两种;SimpleColorHistogram是经典的颜色直方图,OpponentHistogram是基于对色空间的直方图;FuzzyColorHistogram、FuzzyOpponentHistogram利用模糊算法处理减少噪音对Color Histogram、Opponent Histogram的干扰。LuminanceLayout是简单快速的明暗特征,AutoColorCorrelogram颜色改变随距离变化的空间相关性特征,这些都是属于图像的颜色特征描述。

EdgeHistogram是基本的边缘直方图特征, LocalBinaryPatterns是原始的局部二值模式特征,RotationInvariantLocalBinaryPatterns是旋转不变的局部二值模式;PHOG是图像不同分辨率下边缘直方图的结合(以方向渐变来量度),BinaryPatternsPyramid与PHOG不同的地方是使用旋转不变性的局部二值模式的直方图。这几个都是图像纹理特征的描述子。

CEDD把图像的颜色和边缘方向性信息结合起来生成直方图。ACCID把不同尺度下最重要的边缘特征,与使用 CEDD描述子得到的模糊色彩方案一起储存在一个直方图里。FCTH是颜色和纹理直方图模糊处理再结合的;JCD则把CEDD和FCTH联合在一起。

JpegCoefficientHistogram是JPEG 系数直方图特征,适用于JPEG压缩的图片。

Gabor纹理特征模拟了人类视觉刺激响应,广泛应用于视觉信息理解

Tamura用对应于心理学角度上纹理:特征粗糙度、对比度、方向度来进行图像纹理特征描述。

LIRE提供的局部特征描述子中Sift、Surf是最为人所知的。Simple是Surf、Scalable Color、Color Layout、Edge Histogram、CEDD等多种特征的综合。SelfSimilarities和Shapecontext是检测图像局部形状的特征。

LIRE提供的这些特征描述子各具特色,在不同的基于内容的图像检索应用中,需根据具体的需要进行选择,很显然一个基于内容的图像检索如果结合考虑了颜色、纹理和形状特征是会提高精确性的。结合不同特征时还应考虑速度、精确性(precision)和召回率(recall)。即使综合应用多种特征,往往也难以达到很高的精确性。为了提高精确性,可以对大样本提取特征再聚类分析后获取更具代表性的特征用于检索,甚至通过人工神经网(ANN)和支持向量机(SVM)等监督学习方法对大量样本进行训练建模来提高检索的精确性,但这在速度上肯定是收到很大影响的。

希望对LIRE了解更多的可以参考以下文献:

  1. Lux Mathias, Savvas A. Chatzichristofis. Lire: Lucene Image Retrieval- An Extensible Java CBIR Library. In proceedings of the 16th ACM International Conference on Multimedia, pp. 1085-1088, Vancouver, Canada, 2008. http://doi.acm.org/10.1145/1459359.1459577

[2]Lux Mathias. Content Based Image Retrieval with LIRE. In proceedings of the 19th ACM International Conference on Multimedia, pp. 735-738, Scottsdale, Arizona, USA, 2011. http://dl.acm.org/citation.cfm?id=2072432

[3]Mathias Lux, Oge Marques. Visual Information Retrieval using Java and LIRE. Morgan & Claypool, 2013. http://www.morganclaypool.com/doi/abs/10.2200/S00468ED1V01Y201301ICR025

基于内容的图像检索软件库LIRE的特征提取方法综述相关推荐

  1. 图像特征计算与表示——基于内容的图像检索

    1️⃣作业需求 给定不少于100幅合适的图像集合,尺寸可不一,任意选一张图像,并人工给定图像中的一个目标区域,如人脸.楼房.狗等,要求设计一个基于内容的图像检索方法,它能在剩余的图像中找出5张包含最类 ...

  2. 基于内容的图像检索系统设计与实现--颜色信息--纹理信息--形状信息--PHASH--SHFT特征点的综合检测项目,包含简易版与完整版的源码及数据!

    百度云提取源码以及数据包,直接下载压缩包解压就可以使用,数据就在压缩包文件dataset中. 简化版:只有-颜色信息–纹理信息–形状信息–PHASH–SHFT特征点的综合检测 [百度云链接,提取码:6 ...

  3. 基于内容的图像检索概述

    摘要:我们现在处于信息爆炸的时代,各种海量信息充斥在我们周围,如何能在海量的数据中搜索到我们想要的图像是个很有挑战性的研究课题.本文简要分析了目前基于内容的图像检索(CBIR)的几种主要方法,如颜色, ...

  4. 基于内容的图像检索系统(合集)

    基于内容的图像检索,即CBIR(Content-based image retrieval),是计算机视觉领域中关注大规模数字图像内容检索的研究分支.典型的CBIR系统,允许用户输入一张图片,以查找具 ...

  5. 基于内容的图像检索技术

    转:https://blog.csdn.net/u013087984/article/details/52038980 图像检索:基于内容的图像检索技术 2016年06月05日  图像检索  图像检索 ...

  6. 基于内容的图像检索系统的设计与实现

    基于内容的图像检索系统的设计与实现 摘 要:图像作为最基本.最重要的多媒体信息形式之一,已经随着信息技术和网络技术的发展,而越来越广泛地应用于许多领域.如何提供一个快速的.有效的图像信息检索系统已成为 ...

  7. vc++实现基于内容的图像检索系统(一)

    vc++实现基于内容的图像检索系统(一) 系统设计 下载数据集 检索用的图像数据,下载网址: http://cecas.clemson.edu/~stb/research/headtracker/se ...

  8. JAVA实现的基于内容的图像检索系统设计与实现

    1 图像检索系统工作流程 基于内容的图像检索技术是对输入的图像进行分析并分类统一建模,提取其颜色.形状.纹理.轮廓和空间位置等特征,建立特征索引, 存储于特征数据库中.检索时,用户提交查询的源图像,通 ...

  9. 多方法的基于内容的图像检索系统(CBIR)搭建--基于python

    多方法基于内容的图像检索系统(CBIR)搭建 代码实现地址 系统简介 随着数字图像的数量的急速增长,如何快速.高效地从海量图像数据库中检索出客户所需要的数据和信息是当前图像应用领域的重要问题.伴随着数 ...

最新文章

  1. ​【特征工程】时序特征挖掘的奇技淫巧
  2. LaTeX 修改参考文献的方法
  3. leetcode -python 三数之和原创
  4. 博客等级及其特权福利
  5. javafx如何带菜单_JavaFX技巧30:带有DropShadow的ScrollPane
  6. 玩转oracle 11g(17):命令学习5
  7. 【MyBatis框架】查询缓存-二级缓存-整合ehcache
  8. 电磁工程计算机辅助设计,《ANSYS工程应用教程-热与电磁学篇》
  9. 详解Python的max、min和sum函数用法
  10. Windows Azure真实案例--Lokad 公司通过软件+服务高效提供先进的预测服务
  11. JavaScript的String对象使用
  12. CComPtr和 CComQIPtr用法
  13. Mentor软件盗版
  14. mysql实现开始时间和结束时间的查询
  15. 再见SNDA,在离职之后
  16. python Requests+正则表达式爬取猫眼电影top100
  17. 点点动画~画出懂你的3D魔方
  18. 2021创新创业(张玉臣,叶明海,邵鲁宁)99分期末考试答案
  19. 小孔成像总结_初中物理解题技巧+方法总结,可以说很到位了!
  20. linux进程暂停与恢复

热门文章

  1. 软件技能代码之外的生存指南笔记
  2. 对spring JdbcTemplate 代码的一些理解
  3. 在Excel 2007中创建“迷你图”
  4. 物联卡中心:一文详述物联网卡的办理及激活流程!
  5. 【Hadoop--04】Hadoop读文件
  6. 爬虫练习-12306自动购票升级版
  7. SSM甜品店系统计算机毕业论文java毕业设计选题源代码
  8. 小程序获取用户信息无法得到问题
  9. Android自定义View使用详细分析与绘制流程全解
  10. node.js中exports与module.exports的区别