A Convolutional Neural Network Cascade for Face Detection

思想:使用若干个简单的网络级联,合成一个强分类器
作者训练了6个网络,分类回归穿插,流程如下:

网络设计要点:

1.第一级12-net要尽量快,保证召回率的同时,过滤大量非人脸,在每一个尺度,使用NMS,recall达到99%
2.第二级24-net的输入为第一级检测的样本,首先与gt匹配,标定出正负样本,然后分类,另外,第二级使用了多尺度,即将两个stage的fc进行concate。同样,在每一个尺度,使用NMS,recall达到97%
3.第三级48-net网格稍微加深,过程同stage2,本次所有的尺度一块使用NMS
4.回归网络使用bounding box的方式

Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks

思想:同上一篇文章,只不过作者将分类和回归合并使用多任务的方式进行训练。

要点:
1.第一级P-Net使用了全卷积网络
特征图每一个点代表12*12的patch,但是中间只pooling了一次,相当于划窗为2
IOU:[0,0.3]为负样本,[0.65,1]为正样本,[0.4,0.65]为半样本,正负样本用于分类,正半样本用于回归
第二级R-Net的样本选择:对于一幅图像,P-Net的检出框与gt计算IOU,并找出IOU最大对应的gt
如果IOU<0.3,标记为负样本
如果IOU在[0.4,0.65],标记为半样本,计算calibration
如果IOU>0.65,标记为正样本,计算calibration
R-Net的输入图像,是P-Net检出来的box进行crop
2.第一级P-Net测试时使用多尺度
假设最小检测人脸为100,那么
a.在极端情况下,人脸对应12*12的区域,代表原图可以缩小12/100倍,作为初始尺度
b.然后建立尺度金字塔,每个尺度缩小1/1.4倍,这时最小检测人脸不断增加
c.原图一直缩小,直到原图缩到12*12大小,代表整个图就是一个人脸,如果限制了最大人脸,则缩到对应 尺度为止
3.有关NMS:
第一级:每个尺度先单独nms,然后再合并一起nms,nms用的是原始的划窗大小,没有回归调整
第二三级:都是在前一级的基础上nms,最后再回归调整之后nms

Cascade CNN相关推荐

  1. 人脸检测(十六)--Cascade CNN

    转自:https://blog.csdn.net/xzzppp/article/details/51692907 论文:A Convolutional Neural Network Cascade f ...

  2. 深度学习在人脸检测中的应用 | CSDN 博文精选

    作者 | 梁志成.刘鹏.陈方杰 责编 | 唐小引 转载自CSDN(ID:csdnnews) 在目标检测领域,可以划分为人脸检测与通用目标检测,往往人脸这方面会有专门的算法(包括人脸检测.人脸识别.人脸 ...

  3. 中科院自动化所博士带你入门CV物体检测算法

    物体检测通常是指在图像中检测出物体出现的位置及对应的类别,它是计算机视觉中的根本问题之一,同时也是最基础的问题,如图像分割.物体追踪.关键点检测等都依赖物体检测. 从应用来看,物体检测已广泛应用于大家 ...

  4. 基于锚框与无需锚框的通用物体检测算法

    物体检测通常是指在图像中检测出物体出现的位置及对应的类别,是计算机视觉的根本问题,也是最基础的问题.它广泛应用于日常生活中,如浏览器的拍照识图.自动驾驶行人车辆检测.道路目标检测(人行道检测)及图像分 ...

  5. 详解通用物体检测算法:基于锚框与无需锚框

    物体检测通常是指在图像中检测出物体出现的位置及对应的类别,它是计算机视觉中的根本问题之一,同时也是最基础的问题,如图像分割.物体追踪.关键点检测等都依赖物体检测. 从应用来看,物体检测已广泛应用于大家 ...

  6. 一文综述人脸检测算法(附资源)

    文章来源:SIGAI 本文共9400字,建议阅读10+分钟. 本文将和大家一起回顾人脸检测算法的整个发展历史. [导读] 人脸检测是目前所有目标检测子方向中被研究的最充分的问题之一,它在安防监控,人证 ...

  7. MachineLN博客目录

    MachineLN博客目录 https://blog.csdn.net/u014365862/article/details/78422372 本文为博主原创文章,未经博主允许不得转载.有问题可以加微 ...

  8. 人脸检测发展:从VJ到深度学习(下)

    人脸检测发展:从VJ到深度学习(下) 2016-08-11 16:36 转载 深度学习大讲堂 0条评论 雷锋网按:本文作者邬书哲, 中科院计算所智能信息处理重点实验室VIPL课题组博士生,研究方向:目 ...

  9. 大牛讲堂 | 邬书哲:物体检测算法的革新与传承

    大牛讲堂 | 邬书哲:物体检测算法的革新与传承 本文作者:大牛讲堂 2016-11-10 10:01 导语:​邬书哲博士对山世光博士此前讲到的内容在细节上做了补充:R-CNN系列.YOLO和SSD.C ...

最新文章

  1. leetcode - 150. Evaluate Reverse Polish Notation
  2. Python爬虫-Scrapy-CrawlSpider与ItemLoader
  3. linux kernel中的栈的介绍
  4. 专业音频如何把电平转换成dbu_这是我见过最细致的音频系统增益设置指南,跟着学起来!...
  5. SpriteKit在复制节点时留了一个巨坑给开发者,需要开发者手动把复制节点的isPaused设置为false...
  6. Hibernate性能优化之EHCache缓存
  7. vco为什么低频下起振困难_为什么协作如此困难?
  8. 使用谷歌浏览器全文搜索资源文件中的关键词
  9. 股灾情形下搞了个满堂红,我也是醉了
  10. Java集合框架源码解读(3)—LinkedHashMap的实现原理及用法
  11. 如何在Windows上制作一个包含.lib和.dll的Rust Crate包
  12. linux的解压zip文件,Linux解压zip文件命令
  13. 最新二次开发知宇自动发卡系统源码/全网对接/功能齐全
  14. 网页版微信协议登陆,没什么用...
  15. [Spark进阶]--深入Spark Locality Level
  16. 国外lead,广告联盟常见的任务类型和操作方法
  17. 尚硅谷java学习笔记第五天(数组上)
  18. 华硕Eee PC 设置U盘启动
  19. 齐二TK6916/20/26/32系列数控落地铣镗床简介7
  20. FDC2214学习笔记——如何从数字量确定电容值,胎教级别计算电容教程

热门文章

  1. 苹果手表充不进电是什么原因
  2. matlab画立体星星教程,抖音星空画的人怎么画 制作教程完整视频步骤分享
  3. springBoot整合mybatis-plus 报错 No qualifying bean of type
  4. 大气湍流退化图像复原技术研究及DSP实现
  5. 计算机教师继续教育心得,教师继续教育培训个人心得体会(精选6篇)
  6. 清洁机器人--音频方案之基于国民MCU IO控制的唯创WT588 语音播放方案
  7. Linux·centos 钉钉下载安装
  8. linux文件赋予用户权限,Linux 给用户赋予操作权限
  9. 【Cloudaily】大数据国家工程实验室揭牌,华为发布OpenLab全球建设计划
  10. 查看window7开机日志