文章目录

  • 强大的实时人脸检测
    • 摘要
    • 1 简介
    • 2 贡献总结
    • 3 积分图
    • 4 积分图计算特征值
    • 5 训练强分类器

强大的实时人脸检测

摘要

本文介绍了一种视觉对象检测框架,该框架能够在实现高检测率的同时非常快速地处理图像。 有三个主要贡献。 首先是引入了一种称为“积分图像”的新图像表示形式,它可以非常快速地计算出探测器使用的特征。 第二种是基于AdaBoost的学习算法,该算法选择了少量的关键视觉特征并产生了非常有效的分类器[6]。 第三个贡献是一种在“级联”中组合分类器的方法,该方法允许快速丢弃图像的背景区域,同时将更多的计算花费在有前途的类似对象的区域上。 提出了在面部检测领域的一组实验。 该系统产生的人脸检测性能可媲美以前最好的系统[18、13、16、12、1]。 在传统台式机上实施的人脸检测以每秒15帧的速度进行。

1 简介

本文汇集了新的算法和见解,以构建用于鲁棒且极其快速的对象检测的框架。该框架在面部检测任务上得到了证明,并部分受其启发。为此,我们构建了一个正面人脸检测系统,该系统可实现检测和假阳性率,相当于最佳公开结果[18、13、16、12、1]。该面部检测系统与以前的方法最明显的区别在于其能够极其迅速地检测面部。
在384 x 288像素的图像上运行时,在传统的700 MHz 的英特尔奔腾Ⅲ上以每秒15帧的速度检测到面部。在其他面部检测系统中,辅助信息(例如视频序列中的图像差异或彩色图像中的像素颜色)已用于实现高帧频。我们的系统仅使用单个灰度图像中显示的信息即可实现高帧速率。这些替代信息源也可以与我们的系统集成,以实现更高的帧速率。
我们的对象检测框架有三个主要贡献。 我们将在下面简要介绍这些想法,然后在随后的部分中详细介绍它们。

本文的第一个贡献是一种称为积分图像的新图像表示,该图像可以非常快速地进行特征评估。 某些动机是由Papageorgiou等人的工作引起的。 我们的检测系统不能直接在图像强度上工作[10]。 像这些作者一样,我们使用了一组让人想起Haar Basis函数的功能(尽管我们还将使用比Haar过滤器更复杂的相关过滤器)。 为了在许多尺度上非常快速地计算这些特征,我们引入了图像的积分图像表示(积分图像与计算机图形[3]中用于纹理映射的求和面积表非常相似)。 可以使用每像素几个操作从图像中计算出积分图像。 一旦计算出,这些类似Harr的特征中的任何一个都可以在恒定时间内在任何规模或位置进行计算。

本文的第二个贡献是使用AdaBoost 通过选择少量重要特征来构造分类器的方法。 在任何图像子窗口中,类似Harr的特征的总数非常大,远大于像素数。 为了确保快速分类,学习过程必须排除大多数可用功能,并专注于少数关键功能。 在Tieu和Viola的推动下,特征选择是通过对AdaBoost过程的简单修改来实现的:弱学习者受到约束,因此返回的每个弱分类者只能依赖于单个特征[2]。 结果,选择新的弱分类器的增强过程的每个阶段都可以视为特征选择过程。 AdaBoost提供了一种有效的学习算法,并在泛化性能上有很强的界限[14,9,10]。

本文的第三个主要贡献是一种将连续更复杂的分类器以级联结构进行组合的方法,该方法通过将注意力集中在图像的有希望的区域上来显着提高检测器的速度。 关注焦点方法背后的概念是,通常可以快速确定图像中可能出现对象的位置[19、8、1]。 仅为这些有前途的区域保留更复杂的处理。 这种方法的关键度量是注意过程的“假否定”率。 必须是所有或几乎所有对象实例都由注意过滤器选择的情况。
我们将介绍一种方法,训练一个非常简单又有效的分类器,它作为关注算子的一种“有监督的”聚焦[1]。人脸检测专注过滤器将滤除人脸图像的超过50%部分而保留人脸的99%(正如一个大的数据集上评估的)。这种过滤器十分有效;据评估为每位置/尺度20个简单操作(大约60个微处理器指令)。
那些没被初始分类器拒绝的子窗口会被一系列分类器处理,后一个分类器要比前一个分类器稍微复杂一点。如果任意一个分类器拒绝了子窗口,后续程序将不再处理它。级联检测程序的结构本质上是一种退化的决策树,这与Fleuret 和 Geman(2001), Amit 和 Geman (1999年)的工作相关。

完整的人脸检测级联包含38个分类器,总共超过80,000次操作。然而级联结构能达到非常短的平均检测时间。在一个包含507个人脸和7500万子窗口的复杂数据集上,检测每个子窗口的人脸平均使用270条微处理或指令。对比之下,这个系统大约比Rowley 等人 (1998年)构建的人脸检测系统快15倍。

2 贡献总结

1 使用积分图——获取特征。
2 使用Real Adaboost——选择人脸特征,将人脸部分保留,非人脸部分去除。
3 使用cascade分类器——把偌分类器自举成强分类器,然后提高计算速度,达到实时性。

3 积分图

在获取矩形特征后,需要计算矩形特征值。
概念如下:坐标点A(X,Y)的积分是其左上角所有像素之和,也就是图中整个阴影区域的像素。

计算公式:

4 积分图计算特征值

5 训练强分类器


Robust Real-time Face Detection. Paul Viola, Michael Jones. IJCV 2004.相关推荐

  1. PAUL VIOLA 鲁棒的实时人脸检测:Robust Real-Time Face Detection

    PS: 本文系本人本科期间翻译,由于那时刚接触学术论文,水平有限,其中难免出现翻译得不专业之处,此文翻译仅供参考...有时间的话,本人再修改修改哈 国际计算机视觉期刊57(2), 137–154, 2 ...

  2. GCN-Based User Representation Learning for Unifying Robust Recommendation and Fraudster Detection

    GCN-Based User Representation Learning for Unifying Robust Recommendation and Fraudster Detection 点击 ...

  3. Adversarial Representation Learning for Robust Patient-Independent Epileptic Seizure Detection(文章剖析)

    Adversarial Representation Learning for Robust Patient-Independent Epileptic Seizure Detection(文章剖析) ...

  4. A Survey of Robust LiDAR-based 3D Object Detection Methods for Autonomous Driving(激光雷达3D目标检测方法)论文笔记

    原文链接:https://arxiv.org/pdf/2204.00106.pdf III. SotA 将基于点云的3D目标检测分为4类,即基于点的.基于体素的.基于前视图的和基于多视图的方法. A. ...

  5. 干货丨人脸识别必读的N篇文章

    来源:机器视觉 概要:人脸检测/跟踪的目的是在图像/视频中找到各个人脸所在的位置和大小:对于跟踪而言,还需要确定帧间不同人脸间的对应关系. 一 .人脸检测/跟踪 人脸检测/跟踪的目的是在图像/视频中找 ...

  6. 人脸识别必读的N篇文章

    来源:机器视觉 概要:人脸检测/跟踪的目的是在图像/视频中找到各个人脸所在的位置和大小:对于跟踪而言,还需要确定帧间不同人脸间的对应关系. 一 .人脸检测/跟踪 人脸检测/跟踪的目的是在图像/视频中找 ...

  7. 【人脸识别】人脸识别必读论文

    导师布置了任务,让我们没人每周精读几篇大牛论文,并且写ppt.因为最近研究的主题是人脸识别,刚好看到有人总结了人脸识别那些必看的文章(各位可以直接移步去链接),于是就想不如按照这个顺序读,并且写写停滞 ...

  8. 【AI in 美团】深度学习在OCR中的应用

    背景 计算机视觉是利用摄像机和电脑代替人眼,使得计算机拥有类似于人类的对目标进行检测.识别.理解.跟踪.判别决策的功能.以美团业务为例,在商家上单.团单展示.消费评价等多个环节都会涉及计算机视觉的应用 ...

  9. 如何基于深度学习实现图像的智能审核?

    背景 美团每天有百万级的图片产生量,运营人员负责相关图片的内容审核,对涉及法律风险及不符合平台规定的图片进行删除操作.由于图片数量巨大,人工审核耗时耗力且审核能力有限.另外对于不同审核人员来讲,审核标 ...

最新文章

  1. php preg_match 只匹配第一个字符_PHP正则表达式核心技术完全详解 第12节知识补充 断言匹配
  2. 【20160924】GOCVHelper MFC增强算法(1)
  3. 无重复数字的随机数字数组
  4. 删除两个字符串中的特定字符使其相等,统计删除的字符的ASCII和
  5. 阮一峰react demo代码研究的学习笔记 - demo 6 debug - how check works
  6. ubuntu虚拟机联网
  7. jl计算机二级c语言考什么,计算机等级考试二级C语言考前密卷(9)2
  8. MFC控件——ListCtrl控件[翻译](续)
  9. python监控机器(第1版)
  10. 「Python」conda与pip升级所有的包
  11. 【java】创建一个线程,可以对其名称进行设置
  12. 前端开发必要的9个开源框架
  13. 2020传道(原中国开源圈)开源寄语
  14. 计算机指纹驱动程序,联想笔记本指纹识别驱动安装教程【详解】
  15. 惠普bios硬重置_惠普BIOS密码重置工具|惠普笔记本BIOS密码重置工具 - 万方软件下载站...
  16. 概率论 方差公式_2021考研数学概率论与数理统计常考内容
  17. SSM基于web的教务管理系统 毕业设计-附源码261620
  18. muma很可能在陪你玩游戏
  19. 云栖社区2017中国开发者调查报告
  20. 浅谈敏捷 - Scrum

热门文章

  1. 树莓派显示器屏幕休眠
  2. ENVI无法加载从USGS上下载的LANDSAT8数据(MTL)
  3. Android指示灯控制
  4. AcrelEMS-SW智慧水务能效管理平台在污水处理厂中的应用-Susie 周
  5. IOS逆向学习-签名机制
  6. UE5运行第三人称案例,角色不受控的解决方法
  7. 自定义prometheus exporter实现监控阿里云RDS
  8. CocosCreator控制物体移动
  9. windowBuilder Pro下载
  10. Python简单图片爬虫