文章目录

  • 前言
  • 一、建立高斯差分金字塔
    • 1、建立高斯金字塔
    • 2、建立高斯差分金字塔
    • 3、建塔过程中参数的设定及相关细节问题
  • 二、关键点(key points)位置确定
    • 1、阈值化
    • 2、在高斯差分金字塔中找极值点
    • 3、调整极值点位置
    • 4、舍去低对比度的点
    • 5、边缘效应的去除(难点)
  • 三、为关键点赋予方向
    • 1、亚像素点尺度去对应离散点尺度
    • 2、统计
    • 3、找到主方向
  • 四、构建关键点的描述符
    • 1、旋转至主方向所在方向
    • 2、确定关键点附近区域的大小。
    • 3、在确定的区域上做128维描述符统计
  • 总结

前言

SIFT(Scale Invariant Feature Transform)即尺度不变特征变换算法,该特征向量集具有对图像缩放,平移,旋转不变的特征。在对图片进行特征提取及匹配时,对于光照、仿射和投影变换也有一定的不变性,是一个鲁棒性较强的特征提取与匹配算法。


以下是SIFT特征提取与匹配算法的处理流程。

一、建立高斯差分金字塔

1、建立高斯金字塔

我们知道对于高斯核来说,可以用不同的方差σ计算得到不同的高斯核。通过不同尺度的高斯核对原始图像进行卷积(此处方差σ我们称为尺度),卷积过后得到最下方的Octave1图组。而高斯金字塔上方的Octave2图组是由Ovtave1图组进行隔点取点对Octave1图组进行下采样后,再用不同尺度的高斯核进行卷积得到的。也就是:

  1. 对Octave1图组中的图片进行隔点取点下采样
  2. 对下采样后的图组进行不同尺度的高斯核卷积

通过以上两个步骤,得到Octave2图组。那依次类推,Octave3是由Octave2下采样后再卷积得到的…这样,我们得到了高斯金字塔,如下图所示。

2、建立高斯差分金字塔

我们现在已经得到了图像的高斯金字塔。还不能结束,我们最终的目的是得到高斯差分金字塔。
由于相同图组中的图像大小是一样的,我们将相邻两层的图像像素点相减(此处的相减就是传统意义上的减号),得到差分层。这样我们对不同Octave层都进行此操作,得到高斯差分金字塔,如下图所示。

3、建塔过程中参数的设定及相关细节问题

此处的参数主要是指两个:

  • O:高斯金字塔中,要有多少个Octave图组
  • S:高斯金字塔中,每个Octave组要有多少层

如上图第一个公式,我们要选择多少组其实可以自己设定。但原SIFT论文中给出了建议值。

  • 对于O的选择:M、N指原图像的长和宽,求最小值后开log再减3
  • 对于S的选择:n指我们希望提取多少个图片中的特征。一般2个的话n也就是取2,加上3后S取5

现在萌生了第一个问题,3是怎么来的呢?为什么两个公式中都有3?
答:对于这个问题,我们从结果来分析原因。我们可以看到上图2中的高斯差分金字塔,对于原高斯金字塔中的5张图,进行像素点相减操作后只能得到4张图。对于4张图片我们要找特征点,我们是在尺度空间(在前文中提到方差也就是尺度)中寻找极值点,那除了x、y两个平面方向,还有一个尺度方向,我们可以理解为z轴。那对于最上面的差分层来说,由于它上面已经没有图片了,我们无法在z方向对它进行求导,也就是说我们无法在最上层的差分层找极值点了。同理,最下层的差分层也无法找极值点。
那最上层和最下层都无法找极值点,减去2。此时要注意,我们从高斯金字塔到高斯差分金字塔的变换过程中也损失了1层。再加上损失的这层,2+1,也就是3的由来了。

第二个疑问,SIFT为什么要建立高斯金字塔这样的一种结构?
答:由于高斯金字塔是逐步下采样得到的一个金字塔状。我们希望算法在对图像进行处理的时候,对于不同拍摄距离得到的图片具有远近特征的不变性。无论摄像机拿的远近,对于同一个物体都可以识别。那高斯金字塔这种下大上小的结构也就模拟了这种构想。同样,用高斯核去卷积实际上是模拟了近处清晰、远处模糊。并且数学上有相关证明:高斯核是唯一一个可以模拟近处清晰、远处模糊的线性核。这也就是为什么我们只能用高斯核的原因。

第三个疑问,建塔过程中的σ如何配置的呢?
答:如下图所示,我们令k=2开n次方。对于Octave1中的第一层,我们直接用σ,第二层就乘上一个σ,即kσ,以此类推。对于Octave2中的第一层,我们取Octave1中的倒数第三层,因为倒数第三层的σ为k^nσ,也就是为了凑2σ,达到一个隔点取点的降采样效果。

第四个疑问,σ0又是如何设置的呢?
由于我们相继本身拍出的相片也不是完全清晰的,也具有一个模糊尺度。在论文中我们认为模糊尺度为0.5,我们希望第一次高斯核卷积后尺度可以达到1.6。那我们用1.52的方差σ0去卷积,就可以得到1.6的尺度。实际上这个过程是利用了高斯核的类勾股数性质,如图右下方公式。
注:用0.5尺度的高斯核去卷积,将得到的结果再用1.52尺度的高斯核去卷积。以上操作跟直接用1.6尺度的高斯核去卷积得到的图片,效果是一样的。

二、关键点(key points)位置确定

1、阈值化

abs(val) > 0.5*T/n                            T=0.04

以上公式,通过阈值化去掉噪声点。

2、在高斯差分金字塔中找极值点

由于我们是在尺度空间中进行极值点的查找的,除了平面x、y轴外还有个尺度的σ轴,所以我们要在26个点(三层)中找到极大值点或极小值点,如下图所示。

我们通过这种方式,实际上是在离散空间中找到极值点的。实际上,真实极值点存在的位置可能并不是在这些个离散点上的,而是在离散空间中我们找到的极值点附近的点。所以我们通过一些方式找到一个精确的亚像素位置的真正极值点。
那么,用什么方式来进行这个真实极值点寻找呢?泰勒展开。

3、调整极值点位置

在检测到的极值点X0附近做三元二阶泰勒展开,也就是做一个X0处函数的近似,如下图。

得到f(X)后,我们对f(X)求导,如下:

此处,我们得到的X一帽,相当于是我们得到的X0相对于真实极值点的位移量。我们将这个值反代入f(X)中,就得到了真实极值点的值,如下。

当然,在算法实现时,我们求得真实极值点是一个迭代的过程。有三种情况:

  • 设置的迭代条件:X一帽的三个分量x、y、σ均小于0.5时,方可成立。此时位移量已经足够小了,我们就认为已经收敛了。
  • 出现函数不收敛的情况,那我们将这么点直接舍去。
  • 函数已经收敛,但解超出了一定范围,舍去。

4、舍去低对比度的点

若|f(X)| < T/n,则舍去X

通过以上公式,舍去对比度较低的点,很可能是个噪声点。

5、边缘效应的去除(难点)

首先,我们引入一个海参矩阵,如下:

矩阵中的值,实际上就是上文求真实极值点过程中,框选的四个值。

海参矩阵可以描述函数的局部的曲率。我们希望某个点在x、y两个方向的曲率差不多,否则的话它很可能是一个边缘点。根据数学上的概念,海参矩阵的特征值和曲率是呈正比的。
此处我们不去算它的特征值,太麻烦了。通过引入迹和行列式来代替特征值α和β的关系,如下:

  1. 若Det(H)<0,说明两个特征值已经异号了,也就是曲率肯定是不接近的,存在边缘效应,直接舍去X点。

  2. 若Det(H)>0且α>β,说明γ>1,如下:

由于(γ+1)^2/γ化简后是一个对勾函数,γ>1,也就变成了一个单增函数。那么在γ=1时就是他的最小值。由于γ=α/β,γ的值越小则曲率越低,我们为γ设置一个阈值,建议取10。也就是:

三、为关键点赋予方向

此时我们已经确定了关键点,下面要做的就是为关键点赋予方向。假设我们找到的关键点如下图,红点是关键点。

1、亚像素点尺度去对应离散点尺度

首先,我们在高斯金字塔上找到和关键点的σ值最接近的某个高斯图层所对应的尺度σx。(也就是从亚像素点尺度去对应离散点的尺度)

2、统计

统计 以该特征点为圆心,以1.5倍的σx为半径的圆内的所有梯度方向及其梯度幅值,并做1.5σ的高斯滤波。(此处做高斯滤波的意义就是为了加权,使得离中心越近的点权值越高)

3、找到主方向

通过统计结果找到该特征点的主方向,也可能存在辅方向(>80%则有)。对于有两个方向的特征点,实际上我们是以两个特征点去处理的。

四、构建关键点的描述符

通过上文操作,我们已经确定了关键点的xy位置信息、尺度σ以及方向。为了方便后续关键点匹配,我们最后一步要做的就是构建关键点的描述符。在SIFT算法中,描述符其实是一个128维的向量。在特征点匹配过程中,通过k近邻等方式对特征点进行匹配。

1、旋转至主方向所在方向

将特征点周围的区域旋转至主方向所对应的方向。这也是SIFT算法具有旋转不变性的原因所在。

2、确定关键点附近区域的大小。

如下图所示,论文中的区域大小是这样设置的。m取3,mσ是指每个小区域的边长大小。d是指所确定的区域中在x、y方向上有多少个小区域,论文中取4。

3、在确定的区域上做128维描述符统计

在4×4个子区域中,包含了很多梯度方向。经过高斯加权后,在每个子区域中统计8个方向的梯度长度。128维向量是怎么来的呢?16*8。16是指16个子区域,8是指8个方向。那么我们按照顺序将128个梯度长度标记即可得到关键点的描述符。

完成关键点进行描述后,我们就可以用K近邻等方式对最接近的两个关键点进行匹配。这样也就完成了特征点的匹配工作啦!

总结

本文具体介绍了SIFT算法的原理及流程。之前用SIFT、SURF、ORB等算法做过相关项目,但仅仅是跑了代码,算法原理也没有很理解。这次终于把SIFT部分梳理通透啦!

SIFT算法详解——图像特征提取与匹配相关推荐

  1. 图像相似度算法--SIFT算法详解

    尺度不变特征变换匹配算法详解 Scale Invariant Feature Transform(SIFT) Just For Fun zdd  zddmail@gmail.com or (zddhu ...

  2. SIFT算法详解(二)

    目录(?)[-] 尺度不变特征变换匹配算法详解 Scale Invariant Feature TransformSIFT Just For Fun zdd  zddmailgmailcom SIFT ...

  3. SIFT算法详解:Scale Invariant Feature Transform

    尺度不变特征变换匹配算法详解 Scale Invariant Feature Transform(SIFT) Just For Fun zdd  zddmail@gmail.com or (zddhu ...

  4. KMP算法详解:使用部分匹配表PMT来理解KMP算法,使用Java实现

    有些算法,适合从它产生的动机,如何设计与解决问题这样正向地去介绍.但KMP算法真的不适合这样去学.最好的办法是先搞清楚它所用的数据结构是什么,再搞清楚怎么用,最后为什么的问题就会有恍然大悟的感觉.我试 ...

  5. Brook_icv《SIFT特征详解》难点的辅助阅读内容

    在我学习SIFT时,遇到了我认为整理得最好的一篇文章Brook_icv<SIFT特征详解>.作者文字严谨,阅读略带美感,让人舒服,以致于我改变以前的写作方式,尝试一种新的方式,即以大牛的文 ...

  6. 图像特征提取与匹配——SIFT算法

    图像特征提取与匹配--SIFT算法 尺度不变特征转换(Scale-invariant feature transform 或 SIFT)是一种用来侦测与描述影像中局部性特征的算法,它在空间尺度中寻找极 ...

  7. SIFT特征点提取及描述论文算法详解

    SIFT特征点提取及描述论文算法详解 1. 尺度空间极值检测(Scale-space extrema detection) 1.1 尺度空间和极值 1.2 DoG和LoG的关系 1.3 构建高斯尺度差 ...

  8. 特征提取(三)SURF算法详解

    转自:https://www.cnblogs.com/jinjidexuetu/p/90ace4e8de574e3d5f4e6ac16a0dc157.html 另外加了些自己的理解 一.原理: Sif ...

  9. SURF特征提取算法详解

    上一节我们已经介绍了SIFT算法,SIFT算法对旋转.尺度缩放.亮度变化等保持不变性,对视角变换.仿射变化.噪声也保持一定程度的稳定性,是一种非常优秀的局部特征描述算法.但是其实时性相对不高. SUR ...

最新文章

  1. 谷歌数字图书馆_如何在没有联系的情况下找到6位数字的工作-提示使我获得了Google和其他技术巨头的工作机会...
  2. sklearn特征的提取(下)
  3. OpenCV脱色的实例(附完整代码)
  4. fastdfs redis java,大文件上传_断点续传_文件分片传输_fastdfs_前后端一站式解决方案...
  5. 今天学习Flex3.2嵌入图片,值得说道的是如何嵌入scale-9 缩放的图像
  6. ARIMA模型的介绍
  7. git clone 出现错误
  8. Linux查询用户创建的后台程序
  9. grafana 改端口_grafana配置
  10. Wix学习整理(6)——安装快捷方式
  11. eclipse下彻底删除SVN插件
  12. ArcGIS应用(十六)Arcgis 点对连线制作航空线路图
  13. 安防摄像头移动侦测和遮挡侦测基本原理
  14. 丘比特之箭python代码_心形丘比特之箭_可爱漂亮的非主流情侣QQ空间留言代码
  15. 软件工程项目分析(四) 瀚海星云新版网站 By 郭家华
  16. 微信小程序的socket.io即时通讯开发(基于E聊SDK)
  17. python soup attrs_python模块之beautifulSoup
  18. FPGA驱动千兆以太网PHY但电脑只显示百兆
  19. 决策引擎应用场景的特性
  20. 金蝶EAS8.61 金蝶SHR8.61 金蝶EAS8.6 金蝶EAS8.5 金蝶EAS8.2 金蝶EAS8.0 金蝶EAS7.5 金蝶EAS7.03 金蝶EAS7.01 金蝶EAS7.0

热门文章

  1. 电脑基础知识-电脑不认新硬盘时该怎么办?
  2. fabu gewewew
  3. 教你用手机模拟模拟 门禁卡、考勤卡、会员卡、停车卡、电梯卡等等,模拟后可用手机代替刷卡,无需root
  4. 浏览器显示你的连接不是专用连接怎么解决?
  5. Oracle官网下载旧版本jdk
  6. C++ MFC (一)
  7. linux radius mysql_linux中怎么配置radius服务器
  8. CSDN通过哪些方法获取积分
  9. Python中正则匹配TAB及空格的小技巧
  10. 基于bootdo制作一个restful模块