1 致谢

感谢网友zouxy09的介绍,

原文链接如下:

http://dataunion.org/20584.html

2 HOG算法介绍

方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要提醒的是,HOG+SVM进行行人检测的方法是法国研究人员Dalal在2005的CVPR上提出的,而如今虽然有很多行人检测算法不断提出,但基本都是以HOG+SVM的思路为主。

3 主要步骤

3.1 标准化gamma空间和颜色空间

为了减少光照因素的影响,首先需要将整个图像进行归一化。在图像的纹理强度中,局部的表层曝光贡献的比重较大,所以,这种压缩处理能够有效地降低图像局部的阴影和光照变化。因为颜色信息作用不大,通常先转化为灰度图。

3.2 计算像素点的梯度

计算图像横坐标和纵坐标方向的梯度,并据此计算每个像素位置的梯度方向值;计算梯度不仅能够捕获轮廓,人影和一些纹理信息,还能进一步弱化光照的影响。

最常用的方法是:首先用[-1,0,1]梯度算子对原图像做卷积运算,得到X方向(水平方向,以向右为正方向)的梯度分量gradscal_x,然后用[1,0,-1]T梯度算子对原图像做卷积运算,得到Y方向(竖直方向,以向上为正方向)的梯度分量gradscal_y。然后再用以上公式计算该像素点的梯度大小和方向。

3.3 为每个细胞单元构建梯度方向直方图

第三步的目的是为局部图像区域提供一个编码,同时能够保持对图像中人体对象的姿势和外观的弱敏感性。

我们将图像分成若干个“单元格”,即文章中的cell,例如每个cell为6*6个像素。假设我们采用9个bin的直方图来统计这6*6个像素的梯度信息。也就是将cell的梯度方向360度分成9个方向块,如图所示:例如:如果这个像素的梯度方向是20-40度,直方图第2个bin的计数就加一,这样,对cell内每个像素用梯度方向在直方图中进行加权投影(映射到固定的角度范围),就可以得到这个cell的梯度方向直方图了,就是该cell对应的9维特征向量(因为有9个bin)。

像素梯度方向用到了,那么梯度大小呢?梯度大小就是作为投影的权值的。例如说:这个像素的梯度方向是20-40度,然后它的梯度大小是2,那么直方图第2个bin的计数就不是加一了,而是加二,即梯度大小就是投票(voting)的权值。

3.4 把细胞单元组合成大的块(block),块内归一化梯度直方图

由于局部光照的变化以及前景-背景对比度的变化,使得梯度强度的变化范围非常大。这就需要对梯度强度做归一化。归一化能够进一步地对光照、阴影和边缘进行压缩,即把值的范围归一化到较为理想的范围内(这一点跟机器学习中参数的归一化十分类似)。

作者采取的办法是:把各个细胞单元组合成大的、空间上连通的区间(blocks)。这样,一个block内所有cell的特征向量串联起来便得到该block的HOG特征。这些区间是互有重叠的,这就意味着:每一个单元格的特征会以不同的结果多次出现在最后的特征向量中。我们将归一化之后的块描述符(向量)就称之为HOG描述符。

区间有两个主要的几何形状——矩形区间(R-HOG)和环形区间(C-HOG)。R-HOG区间大体上是一些方形的格子,它可以有三个参数来表征:每个区间中细胞单元的数目、每个细胞单元中像素点的数目、每个细胞的直方图通道数目。

例如:行人检测的最佳参数设置是:3×3细胞/区间、6×6像素/细胞、9个直方图通道。则一块特征区的特征数为:3*3*9。

3.5 收集HOG特征

最后一步就是将检测窗口中所有重叠的块进行HOG特征的收集,并将它们结合成最终的特征向量供分类使用。

3.6 检测器窗口及其上下文的设置

Dalal他们使用的检测窗口大小为64X128像素点;窗口周围包括了一个行人周围16像素点的间隔。

3.7 分类器

默认情况下,使用的是软化线性向量机;也可以使用高斯核向量机。

3.6 总结:那么一个图像的HOG特征维数是多少呢?

根据Dalal他们提出的HOG特征提取的过程:把样本图像分割为若干个像素的单元(cell),把梯度方向平均划分为9个区间(bin),在每个单元里面对所有像素的梯度方向在各个方向区间进行直方图统计,得到一个9维的特征向量,每相邻的4个单元构成一个块(block),把一个块内的特征向量联起来得到36维的特征向量,用块对样本图像进行扫描,扫描步长为一个单元。最后将所有块的特征串联起来,就得到了人体的特征。例如,对于64*128的图像而言,每16*16的像素组成一个cell,每2*2个cell组成一个块,因为每个cell有9个特征,所以每个块内有4*9=36个特征,以8个像素为步长,那么,水平方向将有7个扫描窗口,垂直方向将有15个扫描窗口。也就是说,64*128的图片,总共有36*7*15=3780个特征。

计算机视觉(CV)中HOG算法的主要步骤相关推荐

  1. 计算机视觉CV中RANSAC算法的学习笔记~

    1 致谢 感谢网友叶晚zd的博客, 原文链接如下: https://blog.csdn.net/u013925378/article/details/82907502 2 RANSAC算法介绍 随机抽 ...

  2. 计算机视觉CV中RANSAN算法的学习笔记

    1 前言 正在学习RANSAN算法~ 2 单应矩阵 计算单应矩阵时,对特征点匹配的数量没有上限,只有下限,最低要求要求4个点对.

  3. 计算机视觉CV中特征点提取SIFT算法的学习笔记

    1 SIFT算法介绍 SIFT算法,即 Scale-Invariant Feature Transform,尺度无关的特征变换算法. 2 SIFT算法的主要步骤 2.1 生成特征点 2.1.1生成尺度 ...

  4. 计算机视觉CV中特征点提取SURF算法的学习笔记

    1 致谢 感谢网友tongle.Wang的帮助, 链接如下: https://blog.csdn.net/ecnu18918079120/article/details/78195792 2 SURF ...

  5. 计算机视觉CV中特征点方法相关函数的学习笔记~

    1 致谢 感谢网友大奥特曼打小怪兽的帮助 原文链接如下: https://www.cnblogs.com/zyly/p/9646201.html 1 前言 特征点方法是计算机视觉传统目标检测方法中很常 ...

  6. 计算机视觉CV中的论文写作英语(by Youki)

    1 标点符号 引号: ~键(位于左上角处) 2 引用他人语句 斜体+双引号包括 3 常见连接词 除此之外: Additionally, In Addition, Moreover 可以看到-: It ...

  7. 算法可以申请专利么_国内提供计算机视觉(CV)算法岗位的公司名单

    Summary:国内提供计算机视觉(CV)算法岗位的公司名单 Author:Amusi Date:2019-09-15 微信公众号:CVerhttps://github.com/amusi/CV-Jo ...

  8. 计算机视觉中的算法幻想性视错觉

    生成深度学习一直是人工智能前沿的核心思想之一.我们将重点研究卷积神经网络是如何利用迁移学习来思考或对图像中的模式进行可视化的.它们可以生成前所未见的用于描绘卷积神经网络的思考甚至梦境中的图形模式.De ...

  9. CV之FD之HOG:图像检测之基于HOG算法、简介、代码实现(计算图像相似度)之详细攻略

    CV之FD之HOG:图像检测之基于HOG算法.简介.代码实现(计算图像相似度)之详细攻略 图像检测之基于HOG算法.简介.代码实现(计算图像相似度)之详细攻略 相关文章:CV之FD之HOG:图像检测之 ...

最新文章

  1. 在WPF中将图片转换成3D图像并可以旋转
  2. java中的多态与继承_【Java学习笔记之十六】浅谈Java中的继承与多态
  3. Java常用设计模式————抽象工厂模式
  4. ROS仿真-记一次错误 gazebo-2 process has died exit code 2
  5. java liunx 日期格式化_java关于windows环境下显示日期格式正常,linux环境上异常的问题...
  6. 锤子科技回应天猫店商品全线下架:可去京东购买
  7. python ddos 检测系统_python 检查是否存在ddos攻击
  8. uploadify 火狐不兼容问题解决方案
  9. 计算机职业学校杭州,杭州2021年计算机学校是干什么的
  10. 商务与经济统计学习笔记整理/安德森/第13版
  11. Java实现word转HTML
  12. 文件名批量修改工具V1.0 绿色版
  13. 网络工程师知识-盘点网工调试工具常用console线汇总
  14. WINDOWS10您需要 TrustedInstaller 提供的权限才能对此文件进行更改
  15. Policy Gradient (PG)与Proximal Policy Optimization (PPO)算法详解
  16. 关于找不到nsWindows.nsh的问题
  17. jQuery仿天猫完美加入购物车
  18. 8421码,5421码,2421码和余3码的分类及转换
  19. 蓝牙HC05模块探究-设置AT指令
  20. section怎么制造图框_cad中如何制作带属性块的图框

热门文章

  1. linux系统中db2创建表空间,为DB2数据库创建表空间
  2. php jmail 乱码,ASP实例:解决Jmail发送邮件标题出现乱码
  3. 差距只是客观存在的事实,与服不服无关。
  4. 谈谈浮动和清除浮动?
  5. Servlet的学习之Request请求对象(3)
  6. Real-time 节点
  7. System.ArgumentException: 已添加项。字典中的关键字:“RegEx”所添加的关键字:“RegEx” 异常的解决办法...
  8. 问题跟踪软件URTracker和Windows域的集成
  9. 数据库和 MIDP,第二部分:数据映射
  10. 利用汇编挖掘编程语言的本质