Hariis角点的描述子通常是由角点周围像素块的灰度值,以及用于比较的归一化互相关矩阵构成的。其中,两个(相同大小)像素块的相关矩阵定义为:

基础的互相关矩阵为 ,等同于矩阵点乘。而归一化相关时相关矩阵的变形,具体为:

2.2 SIFT(尺度不变特征变换)

SIFT可以解决的问题:

  • 目标的旋转、缩放、平移(RST)
  • 图像仿射/投影变换(视点viewpoint)
  • 目标的尺度/距离
  • 弱光照影响(illumination)
  • 部分目标遮挡(occlusion)
  • 杂物场景(clutter)
  • 噪声

SIFT实现步骤简述:(实质可归位在不同尺度空间上查找相同特征点(关键点)的问题)

  1. 提取关键点
  2. 对关键点附加详细的信息(局部特征),即描述符
  3. 通过特征点(附带上特征向量的关键点)的两两比较找出相互匹配的若干对特征点,建立景物间的对应关系

SIFT查找的关键点:一些十分突出的点,不会因光照、尺度、旋转等因素的改变而消失,比如角点边缘点暗区域的亮点以及亮区域的暗点
因此需要了解尺度空间的概念:通过对原始图像进行尺度变换,获得图像多尺度下的空间表示。从而实现边缘、角点检测和不同分辨率上的特征提取,以满足特征点的尺度不变性
尺度空间中各尺度图像的模糊程度逐渐变大,能够模拟人在距离目标由近到远时目标在视网膜上的形成过程。尺度越大图像越模糊。
尺度不变性:
在不同尺度空间找到比较接近的尺度对应关系。

高斯滤波器:构造一个滤波函数,满足高斯分布,删除噪声影响。高斯函数方差越大,当前像素点周边信息越多;方差越小,当前像素点信息越多。
高斯金字塔的构建可分为两步:

  1. 对图像做高斯平滑;
  2. 对图像做降采样。

高斯图像金字塔共o组、s层,则有:

  • σ——尺度空间坐标;
  • s——sub-level层坐标;
  • σ0——初始尺度;
  • S——每组层数(一般为3~5)

最后可将组内和组间尺度归位:


  • i——金字塔组数
  • n——每一组的层数

为了让尺度体现其连续型,在简单采样的基础上加上了高斯滤波。一幅图像可以产生几组图像,一组图像包括几层(interval)图像。

DoG(Difference of Gaussian)函数

DoG在计算只需相邻高斯平滑后图像相减,因此简化了计算。

DoG高斯差分金字塔
对应DoG算子,需构建DoG金字塔。可以通过高斯差分图像看出图像上的像素值变化情况(如果没有变化,也就没有特征。特征必须是变化尽可能多的点)。DoG图像描绘的是目标的轮廓。

DoG的局部极值点
特征点是由DoG空间的局部极值点组成的。为了寻找DoG函数的极值点,每一个像素点要和它所有的相邻点比较,看其是否比它的图像域和尺度域的相邻点大或者小。
中间的监测点和它通尺度的8个相邻点和上下相邻尺度对应的9×2个点共26个点比较,以确保在尺度空间和二维空间都检测到极值点。

去除边缘响应
由于DoG函数在图像边缘有较强的边缘响应,因此需要排除边缘响应。
DoG函数的峰值点在边缘方向有较大的主曲率,而在垂直边缘的方向有较小的主曲率。主曲率可以通过计算在该点位置尺度的2×2的Hessian矩阵得到,导数由采样点相邻差来估计:

Dxx表示DoG金字塔中某一尺度的图像x方向求导两次。
与Harris角点的区别?
基于Hessian的检测器比基于Harris的检测器更稳定、更可重复。

D的主曲率和H的特征值成正比。令α,β为特征值,则

该值在两特征值相等时达最小。建议阈值T为1.2,即时保留关键点,反之剔除。

通过尺度不变性求极值点,可以使其具有缩放不变的性质。而利用关键点领域像素的梯度方向分布特性,可以为每个关键点指定方向参数方向,从而使描述子对图像旋转具有不变性
通过求每个极值点的梯度来为极值点赋予方向。

  • 像素点的梯度表示:
  • 梯度幅值:
  • 梯度方向:

方向直方图的生成
确定关键点的方向采用梯度直方图统计法,统计以关键点为原点,一定区域内的图像像素点对关键点方向生成所做的贡献。统计方向[0,2π]f分为8个方向,梯度幅值越大贡献越大。统计后哪个纺线最大,即作为当前方向主方向。
关键点主方向:极值点周围区域梯度直方图的主峰值也是特征点方向。
关键点辅方向:在梯度方向直方图中,当存在另一个相当于主峰值80%能量的峰值时,则将这个方向认为是该关键点的辅方向。为其也生成一个特征向量。
这可以增强匹配的鲁棒性,Lowe的论文指出大概有15%关键点具有多方向,但这些点对撇啤的稳定性至为关键。

《计算机视觉》集大网课笔记【2】相关推荐

  1. 《计算机视觉》集大网课笔记【7】

    目标检测算法 问题及简史 滑动窗口法:不断在图像中切出小的图像块,检测完所有图像块后再进行置信度判断,留下的方框作为检测结果.①对图像尺寸进行缩放.②图像窗口尺寸变化. AdaBoost:加大错分样本 ...

  2. 《计算机视觉》集大网课学习笔记【6】

    图像分割 图像分割的任务 基于聚类的图像分割 可以使用K-means算法,在图像的灰度或颜色空间实现像素点的聚类.不同的类别不一定具有空间紧致性. 也可以在颜色空间上融入位置信息,如(r,g,b,x, ...

  3. 《计算机视觉》集大网课学习笔记【4】

    多视图几何与三维重建 对极几何与基础矩阵 对极点 = 基线(baseline)与像平面相交点 = 光心在另一幅图像中的投影 设X在C,C'坐标系中的相对坐标分别为p,p',则有 p = Rp' + T ...

  4. 《计算机视觉》集大网课学习笔记【5】

    图像检索 图像检索的概念 对于大场景数据集(如城市场景),只有少于0.1%的图像对具有匹配关系 解决方法:利用图像整体特征实现匹配/检索,而非局部特征点 Bag of Words算法流程 找到图像中的 ...

  5. MySQL高级-04-授课笔记

    MySQL高级-04-授课笔记 一.MySQL存储引擎 1.MySQL体系结构 体系结构的概念 任何一套系统当中,每个部件都能起到一定的作用! MySQL的体系结构 体系结构详解 客户端连接 支持接口 ...

  6. 深度学习中模型攻击与防御(Attack DL Models and Defense)的原理与应用(李宏毅视频课笔记)

    文章目录 0 前言 1 Attack(模型攻击) 1.1 Attack on Image Recognition Network Model(对图像识别网络模型的攻击) 1.1.1 Loss Func ...

  7. 飞桨领航团AI达人创造营第三课笔记

    第三课笔记目录 课后感慨 作业完成记录 制作数据集 训练模型 参考案例 代码解读 unzip git 数据集划分解读 文件选择 问题解决 链接指引 课后感慨 课程是越来越难了,有点难跟上了.但得益于群 ...

  8. 学堂在线部分网课笔记---Web设计与应用

    学堂在线部分网课笔记 Web设计与应用 第六章 敏捷的前端框架 6.2.1 bootstrap响应式布局(一) 容器 非固定宽度 固定宽度 Viewport viewport的作用是什么? width ...

  9. 《机器学习中的数学》第一课笔记1.1

    <机器学习中的数学>第一课笔记 链接 使用链接利用python掌握机器学习http://www.afenxi.com/post/8798 林轩田视频(讲的有点深,未必hold得住):htt ...

最新文章

  1. 我们为你精选了一份Jupyter/IPython笔记本集合 !(附大量资源链接)-下篇
  2. SAP S4 BP事务代码的业务伙伴和供应商,客户之间的表关系
  3. Android 获取SDCard中某个目录下图片
  4. 使用谷歌浏览器模拟微信(android或ios)浏览器
  5. php 传递类名,php 对象和数组序列化 serialize()返回字符串方便存储和传递 unserialize()反序列化 不丢失类型和结构...
  6. undo the local changes
  7. jquery 控制frameset frame节点内容(在子窗口中把该窗口中的焦点处的text内容填
  8. jvm-内存结构--分类索引
  9. 安卓开发2019年终总结(写的很水,千万别打开)
  10. 基于原生Wine6.0.2稳定版打补丁解决ukylin-wine图标显示异常和deepin-wine闪退的问题,Ubuntu运行QQ接近完美(附补丁)。
  11. POE交换机和普通交换机哪里不同
  12. 写一函数,将一个3*3的整型矩阵转置
  13. 微软测试管理框架(Microsoft Test Manager)
  14. Reporting报表开发知识汇总[个人原创]
  15. ML之ME:Best-KS分箱/KS值(分类预测问题中评价指标、数据分箱方法)的简介(KS与ROC的关系)、使用方法、案例应用之详细攻略
  16. Redis 的 RDB 和 AOF
  17. ACM-ICPC 2018 沈阳赛区网络预赛 J Ka Chang(树分块)
  18. 算法导论第21章思考题
  19. CFT Show 信息收集篇
  20. input输入框实时监测

热门文章

  1. 禾穗HERS | 有了这份清单,妳就是世界上最幸福的10%
  2. SoundTouch为声音添加特效(soundstretch)
  3. nagios安装与配置教程(详细版)【入门教程】2020-11-16
  4. iOS UIAlertController的强制旋转
  5. centos7 yum redis安装及使用
  6. 什么是Dirichlet分布?
  7. 拥有对抗复杂时代的底层能力,数据达人云集的宝藏圈子,邀您加入!
  8. Java学习之基本语法
  9. 华为 Matebook14 卡屏
  10. 张逸:老鸟对菜鸟的一些建议