1.序
目前“以图搜图”的引擎越来越多,可参考博文:
http://blog.csdn.net/forthcriminson/article/details/8698175
此篇博文中列出了很多“以图搜图”的引擎,之前很好奇他们是如何进行检索的,偶然间看到了一篇博客,上面说Google和Tineye主要利用的算法是感知哈希算法(Perceptual hash algorithm),它的作用是对每张图片生成一个”指纹”(fingerprint)字符串,然后比较不同图片的指纹。结果越接近,就说明图片越相似,里面介绍的原理也比较简单,正好目前也在做图像检索方面的课题,就用OpenCV实现了一下,供大家参考,本篇博文主要介绍如何通过OpenCV实现均值Hash和pHash算法,基本原理和流程会在代码的注释中详细说明。

2.均值Hash算法
//均值Hash算法

 string HashValue(Mat &src)  {  string rst(64,'\0');  Mat img;  if(src.channels()==3)  cvtColor(src,img,CV_BGR2GRAY);  else  img=src.clone();  /*第一步,缩小尺寸。 将图片缩小到8x8的尺寸,总共64个像素,去除图片的细节*/  resize(img,img,Size(8,8));  /* 第二步,简化色彩(Color Reduce)。 将缩小后的图片,转为64级灰度。*/  uchar *pData;  for(int i=0;i<img.rows;i++)  {  pData = img.ptr<uchar>(i);  for(int j=0;j<img.cols;j++)  {  pData[j]=pData[j]/4;            }  }  /* 第三步,计算平均值。 计算所有64个像素的灰度平均值。*/  int average = mean(img).val[0];  /* 第四步,比较像素的灰度。 将每个像素的灰度,与平均值进行比较。大于或等于平均值记为1,小于平均值记为0*/  Mat mask= (img>=(uchar)average);  /* 第五步,计算哈希值。*/  int index = 0;  for(int i=0;i<mask.rows;i++)  {  pData = mask.ptr<uchar>(i);  for(int j=0;j<mask.cols;j++)  {  if(pData[j]==0)  rst[index++]='0';  else  rst[index++]='1';  }  }  return rst;  }  
  1. pHash算法
//pHash算法  string pHashValue(Mat &src)  {  Mat img ,dst;  string rst(64,'\0');  double dIdex[64];  double mean = 0.0;  int k = 0;  if(src.channels()==3)  {  cvtColor(src,src,CV_BGR2GRAY);  img = Mat_<double>(src);  }     else  {  img = Mat_<double>(src);  }       /* 第一步,缩放尺寸*/  resize(img, img, Size(8,8));  /* 第二步,离散余弦变换,DCT系数求取*/  dct(img, dst);   /* 第三步,求取DCT系数均值(左上角8*8区块的DCT系数)*/  for (int i = 0; i < 8; ++i) {  for (int j = 0; j < 8; ++j)   {  dIdex[k] = dst.at<double>(i, j);  mean += dst.at<double>(i, j)/64;  ++k;  }  }  /* 第四步,计算哈希值。*/  for (int i =0;i<64;++i)  {  if (dIdex[i]>=mean)  {  rst[i]='1';  }  else  {  rst[i]='0';  }  }  return rst;  }  

4.汉明距离计算
通过上面两段代码就可以计算出图像的Hash值,检索的时候一般采用汉明距离来进行判断两幅图像的相似性,一般情况下认为汉明距离小于5,就可以认为两幅图像时相似的。汉明具体计算实现:
//汉明距离计算

 int HanmingDistance(string &str1,string &str2)  {  if((str1.size()!=64)||(str2.size()!=64))  return -1;  int difference = 0;  for(int i=0;i<64;i++)  {  if(str1[i]!=str2[i])  difference++;  }  return difference;  }  

5.算法性能测试

      为了验证该算法的性能,我进行了一些简单的测试,发现非等比例的图像缩放对均值Hash算法的性能有很大影响,如我进行测试的图像时640*480的,当我将其缩放为100*100时,两幅图像之间的汉明距离为28,两幅图像的Hash值相差较大,这说明非等比例的图像缩放会会使得基于均值Hash算法的图像检索出现错误,而pHash算法则在计算汉明距离后为4,这说明pHash算法对尺度的变化的鲁棒性强于均值Hash算法。接下来我又对其对旋转的鲁棒性进行了一定的测试,测试图像如下所示


均值Hash算法测试结果:

pHash算法测试结果:

从测试结果中可以看出无论是均值Hash算法还是pHash算法,对旋转都不具有鲁棒性,只是pHash算法相对来说好一些, 一个真正的可商用的“以图搜图”引擎, 仍然需要对其进行改进,类似于原文中说的一样,如果不对其进行改进,目前只能由于以缩略图查找原图的情况。

6.相关JAVA实现

均值Hash算法:http://blog.csdn.net/luoweifu/article/details/7733030
pHash算法:http://blog.csdn.net/luoweifu/article/details/8220992

感知哈希算法(Perceptual hash algorithm) 以图搜图相关推荐

  1. 感知哈希算法(perceptual hash algorithm),

    感知哈希算法(perceptual hash algorithm),它的作用是对每张图像生成一个"指纹"(fingerprint)字符串,然后比较不同图像的指纹.结果越接近,就说明 ...

  2. 感知哈希算法——找出相似的图片

    参考Neal Krawetz博士的这篇文章, 实现这种功能的关键技术叫做"感知哈希算法"(Perceptual Hash Algorithm), 意思是为图片生成一个指纹(字符串格 ...

  3. 【转】感知哈希算法——找出相似的图片

    Google 图片搜索功能 在谷歌图片搜索中, 用户可以上传一张图片, 谷歌显示因特网中与此图片相同或者相似的图片. 比如我上传一张照片试试效果: 原理讲解 参考Neal Krawetz博士的这篇文章 ...

  4. 基于感知哈希算法的中药标本相似图片的搜索

    一 前言 笔者最近在开发中药标本相似图片的搜索,就是根据用户上传的图片,然后到中药标本库里找到相似的图片,从而帮助用户识别标本,获取标本信息.查阅了大量资料,看到了阮一峰的一篇文章,经过一个月的开发终 ...

  5. Google 以图搜图 - 相似图片搜索原理 - Java实现

    前阵子在阮一峰的博客上看到了这篇<相似图片搜索原理>博客,就有一种冲动要将这些原理实现出来了. Google "相似图片搜索":你可以用一张图片,搜索互联网上所有与它相 ...

  6. 以图搜图 - Google 相似图片搜索原理 - Java实现

    转自:http://blog.csdn.net/luohong722/article/details/7100058 前阵子在阮一峰的博客上看到了这篇<相似图片搜索原理>博客,就有一种冲动 ...

  7. Google 以图搜图 - 相似图片搜索原理 - Java实现 (转)

    前阵子在阮一峰的博客上看到了这篇<相似图片搜索原理>博客,就有一种冲动要将这些原理实现出来了. Google "相似图片搜索":你可以用一张图片,搜索互联网上所有与它相 ...

  8. 实战 | 多种方法实现以图搜图

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自:AI 算法与图像处理 概述 以图搜图技术是日常生活中常用 ...

  9. 感知哈希算法(Perceptual hash algorithm)的OpenCV实现

    1.前言 目前"以图搜图"的引擎越来越多,可参考博文: http://blog.csdn.net/forthcriminson/article/details/8698175 此篇 ...

最新文章

  1. 爱立信与SK电讯等开展5G测试 将加强VR/AR及云服务连接速度
  2. 如何把不同尺寸ico格式图标_还在为图标设计犯难?这篇告诉你图标设计so easy!...
  3. 数据备份 另一服务器_狡兔三窟-数据备份
  4. Zuul网关原理及源码解读(草稿版)
  5. 图解ARP协议(四)代理ARP原理与实践(“善意的欺骗”)
  6. 3 Git 分支 - 分支管理
  7. 3 年工作经验程序员应有的技能
  8. WEB安全基础-SQL注入演示
  9. mpvue两小时,产出一个《点钞辅助工具》小程序
  10. lintcode-87-删除二叉查找树的节点
  11. 基于TCP/UDP的socket编程
  12. MySQL中table_schema的基本操作
  13. Android H5交互实现拍照显示
  14. 还原 对于 服务器“DESKTOP-BNNIISU\SQLEXPRESS”失败。  (Microsoft.SqlServer.SmoExtended)
  15. The Tangled Web: A Guide to Securing Modern Web Applications 原版pdf
  16. python除法运算定律_小数乘法和小数除法知识点整理(转)
  17. Telegram APIs中文介绍
  18. Thinkphp3.2如何where查询条件如何同时添加字符串条件和数组条件
  19. AWS认证攻略 – E哥的AWS Solution Architecture Associate 认证攻略
  20. 安装了Visual Studio Team System Web Access 2008 Power Tool

热门文章

  1. 抽奖活动 - 免费抽奖赢取DALI调试工具
  2. 【Docker】Docker 快速入门(精讲)
  3. 大前端xiu7.3主题wordpress主题下载xiu7.3免费下载
  4. hge source explor 0xA graphics Ⅰ
  5. 目前大多数数字电子计算机,计算机机考单选19-22.docx
  6. win10自带IE浏览器自动变成Edge了
  7. 经典SQL数据库面试题以及答案—Oracle版本-SQL全部在plsql开发编写-欢迎提问
  8. python使用演示文稿-python 操作PPT练习
  9. GALgame打开出现错误......
  10. 蓝桥杯嵌入式学习STM32之外部中断EXTI详解