三种基于感知哈希算法的相似图像检索技术

时间 2014-09-26 11:32:46  CSDN博客
原文  http://blog.csdn.net/xaut_zjb/article/details/39578063
主题 算法 哈希表

大家都用google或baidu的识图功能,上面就是我搜索一幅图片的结果,该引擎实现相似图片搜素的关键技术叫做“感知哈希算法”(Perceptual hash algorithm),它的作用是对每张图片生成一个“指纹”(fingerprint)字符串,然后比较不同图片的指纹。结果越接近,就说明图片越相似。达到图片比较目的且利用信息指纹比较有三种算法,这些算法都很易懂,下面分别介绍一下:

1、基于低频的均值哈希

一张图片就是一个二维信号,它包含了不同频率的成分。如下图所示,亮度变化小的区域是低频成分,它描述大范围的信息。而亮度变化剧烈的区域(比如物体的边缘)就是高频的成分,它描述具体的细节。或者说高频可以提供图片详细的信息,而低频可以提供一个框架。

而一张大的,详细的图片有很高的频率,而小图片缺乏图像细节,所以都是低频的。所以我们平时的下采样,也就是缩小图片的过程,实际上是损失高频信息的过程。下面5张图依次是原图,放缩至64*64、32*32、16*16、8*8的图。

   

均值哈希算法主要是利用图片的低频信息,其工作过程如下:

(1)缩小尺寸:去除高频和细节的最快方法是缩小图片,将图片缩小到8x8的尺寸,总共64个像素。不要保持纵横比,只需将其变成8*8的正方形。这样就可以比较任意大小的图片,摒弃不同尺寸、比例带来的图片差异。

(2)简化色彩:将8*8的小图片转换成灰度图像。

(3)计算平均值:计算所有64个像素的灰度平均值。

(4)比较像素的灰度:将每个像素的灰度,与平均值进行比较。大于或等于平均值,记为1;小于平均值,记为0。

(5)计算hash值:将上一步的比较结果,组合在一起,就构成了一个64位的整数,这就是这张图片的指纹。组合的次序并不重要,只要保证所有图片都采用同样次序就行了。(我设置的是从左到右,从上到下用二进制保存)。

//均值Hash算法string HashValue(Mat &src){string rst(64,'\0');Mat img;if(src.channels()==3)cvtColor(src,img,CV_BGR2GRAY);elseimg=src.clone();/*第一步,缩小尺寸。将图片缩小到8x8的尺寸,总共64个像素,去除图片的细节*/resize(img,img,Size(8,8));/* 第二步,简化色彩(Color Reduce)。将缩小后的图片,转为64级灰度。*/uchar *pData;for(int i=0;i<img.rows;i++){pData = img.ptr<uchar>(i);for(int j=0;j<img.cols;j++){pData[j]=pData[j]/4;           }}/* 第三步,计算平均值。计算所有64个像素的灰度平均值。*/int average = mean(img).val[0];/* 第四步,比较像素的灰度。将每个像素的灰度,与平均值进行比较。大于或等于平均值记为1,小于平均值记为0*/Mat mask= (img>=(uchar)average);/* 第五步,计算哈希值。*/int index = 0;for(int i=0;i<mask.rows;i++){pData = mask.ptr<uchar>(i);for(int j=0;j<mask.cols;j++){if(pData[j]==0)rst[index++]='0';elserst[index++]='1';}}return rst;}

计算一个图片的hash指纹的过程就是这么简单。如果图片放大或缩小,或改变纵横比,结果值也不会改变。增加或减少亮度或对比度,或改变颜色,对hash值都不会太大的影响。最大的优点:计算速度快!这时候,比较两个图片的相似性,就是先计算这两张图片的hash指纹,也就是64位0或1值,然后计算不同位的个数(汉明距离)。如果这个值为0,则表示这两张图片非常相似,如果汉明距离小于5,则表示有些不同,但比较相近,如果汉明距离大于10则表明完全不同的图片。

2、增强版:pHash

均值哈希虽然简单,但受均值的影响非常大。例如对图像进行伽马校正或直方图均衡就会影响均值,从而影响最终的hash值。存在一个更健壮的算法叫pHash。它将均值的方法发挥到极致。使用离散余弦变换(DCT)来获取图片的低频成分。

离散余弦变换(DCT)是种图像压缩算法,它将图像从像素域变换到频率域。然后一般图像都存在很多冗余和相关性的,所以转换到频率域之后,只有很少的一部分频率分量的系数才不为0,大部分系数都为0(或者说接近于0)。下图的右图是对lena图进行离散余弦变换(DCT)得到的系数矩阵图。从左上角依次到右下角,频率越来越高,由图可以看到,左上角的值比较大,到右下角的值就很小很小了。换句话说,图像的能量几乎都集中在左上角这个地方的低频系数上面了。

pHash的工作过程如下:

(1)缩小尺寸:pHash以小图片开始,但图片大于8*8,32*32是最好的。这样做的目的是简化了DCT的计算,而不是减小频率。

(2)简化色彩:将图片转化成灰度图像,进一步简化计算量。

(3)计算DCT:计算图片的DCT变换,得到32*32的DCT系数矩阵。

(4)缩小DCT:虽然DCT的结果是32*32大小的矩阵,但我们只要保留左上角的8*8的矩阵,这部分呈现了图片中的最低频率。

(5)计算平均值:如同均值哈希一样,计算DCT的均值。

(6)计算hash值:这是最主要的一步,根据8*8的DCT矩阵,设置0或1的64位的hash值,大于等于DCT均值的设为”1”,小于DCT均值的设为“0”。组合在一起,就构成了一个64位的整数,这就是这张图片的指纹。

//pHash算法string pHashValue(Mat &src){Mat img ,dst;string rst(64,'\0');double dIdex[64];double mean = 0.0;int k = 0;if(src.channels()==3){cvtColor(src,src,CV_BGR2GRAY);img = Mat_<double>(src);}   else{img = Mat_<double>(src);}     /* 第一步,缩放尺寸*/resize(img, img, Size(8,8));/* 第二步,离散余弦变换,DCT系数求取*/dct(img, dst);  /* 第三步,求取DCT系数均值(左上角8*8区块的DCT系数)*/for (int i = 0; i < 8; ++i) {for (int j = 0; j < 8; ++j) {dIdex[k] = dst.at<double>(i, j);mean += dst.at<double>(i, j)/64;++k;}}/* 第四步,计算哈希值。*/for (int i =0;i<64;++i){if (dIdex[i]>=mean){rst[i]='1';}else{rst[i]='0';}}return rst;}

结果并不能告诉我们真实性的低频率,只能粗略地告诉我们相对于平均值频率的相对比例。只要图片的整体结构保持不变,hash结果值就不变。能够避免伽马校正或颜色直方图被调整带来的影响。与均值哈希一样,pHash同样可以用汉明距离来进行比较。(只需要比较每一位对应的位置并算计不同的位的个数)

三、差异哈希算法(dHash)

相比pHash,dHash的速度要快的多,相比aHash,dHash在效率几乎相同的情况下的效果要更好,它是基于渐变实现的。

步骤:

1.缩小图片:收缩到9*8的大小,一遍它有72的像素点

2.转化为灰度图:把缩放后的图片转化为256阶的灰度图。(具体算法见平均哈希算法步骤)

3.计算差异值:dHash算法工作在相邻像素之间,这样每行9个像素之间产生了8个不同的差异,一共8行,则产生了64个差异值

4.获得指纹:如果左边的像素比右边的更亮,则记录为1,否则为0.

需要说明的是这种指纹算法不仅可以应用于图片搜索,同样适用于其他多媒体形式。除此之外,图片搜索特征提取方法有很多,很多算法还有许多可以改进的地方,比如对于人物可以先进行人脸识别,再在面部区域进行局部的哈希,或者背景是纯色的可以先过滤剪裁等等,最后在搜索的结果中还可以根据颜色、风景、产品等进行过滤。

三种基于感知哈希算法的相似图像检索技术相关推荐

  1. 基于感知哈希算法的中药标本相似图片的搜索

    一 前言 笔者最近在开发中药标本相似图片的搜索,就是根据用户上传的图片,然后到中药标本库里找到相似的图片,从而帮助用户识别标本,获取标本信息.查阅了大量资料,看到了阮一峰的一篇文章,经过一个月的开发终 ...

  2. 相似图片检测:感知哈希算法之aHash,dHash,pHash的Python实现

    相似图片检测:感知哈希算法之aHash,dHash,pHash的Python实现 原文:http://blog.sina.com.cn/s/blog_56fd58ab0102xpqf.html 感知哈 ...

  3. 相似图片检测:感知哈希算法之dHash的Python实现

    原文:https://blog.csdn.net/haluoluo211/article/details/52769325 相似图片检测:感知哈希算法之dHash的Python实现 某些情况下,我们需 ...

  4. python 生成列向量_python_mmdt:一种基于敏感哈希生成特征向量的python库(一)

    概述 python_mmdt是一种基于敏感哈希的特征向量生成工具.核心算法使用C实现,提高程序执行效率.同时使用python进行封装,方便研究人员使用. 本篇幅主要介绍涉及的相关基本内容与使用,相关内 ...

  5. 感知哈希算法原理与实现

    今天忽然想做一个图像识别的APP,但是在两张图片相似度的问题上产生了问题,感知哈希算法并不能解决这个问题,只是我在试着解决问题的过程中学到的一点知识. 这里的关键技术叫做"感知哈希算法&qu ...

  6. mmd python error_python_mmdt:一种基于敏感哈希生成特征向量的python库(一)

    概述 python_mmdt是一种基于敏感哈希的特征向量生成工具.核心算法使用C实现,提高程序执行效率.同时使用python进行封装,方便研究人员使用. 本篇幅主要介绍涉及的相关基本内容与使用,相关内 ...

  7. 感知哈希算法(Perceptual hash algorithm)的OpenCV实现

    1.前言 目前"以图搜图"的引擎越来越多,可参考博文: http://blog.csdn.net/forthcriminson/article/details/8698175 此篇 ...

  8. 谷歌百度以图搜图 感知哈希算法 C#简单实现

    /// <summary>/// 感知哈希算法/// </summary>public class ImageComparer{ /// <summary>/// ...

  9. 感知哈希算法(Perceptual hash algorithm) 以图搜图

    1.序 目前"以图搜图"的引擎越来越多,可参考博文: http://blog.csdn.net/forthcriminson/article/details/8698175 此篇博 ...

  10. 感知哈希算法——找出相似的图片

    参考Neal Krawetz博士的这篇文章, 实现这种功能的关键技术叫做"感知哈希算法"(Perceptual Hash Algorithm), 意思是为图片生成一个指纹(字符串格 ...

最新文章

  1. TopShell管理服务
  2. 车联网 python_利用百度车联网提供的天气查询接口用python查询天气信息
  3. redis复制_Redis复制
  4. 命令行linux iso,linux – 有没有办法从命令行更改.iso文件卷id?
  5. .net常用面试核心技术点(持续更新中)
  6. 支付宝回应 AI 换脸风险;新 iPhone 或将于 13 号接受预订;Linux Lite 4.6 发布 | 极客头条...
  7. 推荐两份学习 Kotlin 和机器学习的资料
  8. 高斯消元--模板,原理
  9. 计算机二级考试办公软件高级应用题型,计算机二级考试题型
  10. Qt Quick简单教程
  11. mysql 全文索引无效_为什么MySQL全文索引不起作用?
  12. js:腾讯云播放器无法自动播放的问题
  13. 次世代3D建模高低模的搭配方式你知道吗?
  14. file:/usr/local/hive/iotmp/89de7dfe-8f26-4a6e-87b4-bacd16c2b2c8/hive_2021-11-05_05-06-07_555_3392062
  15. 阿里王坚:每一个物体都将是互联网终端
  16. 无人船成渡过大西洋将来发展又会如何?
  17. WordPress网站程序如何搭建教程详细流程步骤
  18. Docker系列(八):Kubernetes横空出世背后的秘密
  19. 单样本t检验中指标分析
  20. Unity 2d 用两种方式(shader textMeshPro)分别实现文字波浪形态

热门文章

  1. 博客平台、Markdown编辑器与hexo admin简介
  2. CentOS6.5安装python3.7
  3. OSPF计算环路:RFC:2328与RFC1583
  4. 三省2:hadoop是什么鬼1
  5. iOS 开发的9个超有用小技巧
  6. 【shell基础】条件测试
  7. 易语言-MD5加密16位和32位方法
  8. HTML元素分类【三种类型】
  9. tomcat 实现域名crm.test.com訪问
  10. 网络安全——Base64编码、MD5、SHA1-SHA512、HMAC(SHA1-SHA512)哈希