日本东北大学改进单阶段人脸检测—兼具速度与精度优势
点击我爱计算机视觉标星,更快获取CVML新技术
近日来自日本东北大学与Laboro.AI公司的研究人员公开一篇改进的单阶段人脸检测算法论文,其不仅保持了速度的优势而且在主流的人脸数据集上达到与双阶段人脸检测算法相当的精度。
作者信息:
按照算法流程划分,在目标检测领域一直存在着两大分支:
1.双阶段(Two-Stage)目标检测。网络先生成大量的目标候选区域和特征(或者像素),然后再通过另一个网络在其基础上进行目标分类和包围框位置回归。比如Faster R-CNN算法。
2.单阶段(Single-Stage)目标检测。在基础网络不同的深度提取特征图,每一层特征图都有与其对应的预定义的anchors,在这些特征图上直接进行目标分类和位置回归的卷积操作,得到最终的目标检测的结果。比如SSD算法。
双阶段目标检测算法往往能取得更高的检测精度,但单阶段的算法速度往往比较快,这在实际工程中是很重要的。
在人脸检测领域同样有如上的两条路线。
该文作者希望改进单阶段人脸检测算法,使其兼具速度和精度的优势。
问题提出
受启发于SSD、SFD、SSH算法,作者基于ResNet-101骨干网构建了单阶段的人脸检测基模型,透过研究发现导致模型虚警率(false positives)较高的主要因素有:
1.上下文信息缺失。尤其对小人脸特别明显,本身可区分度不高,上下文信息缺失更加难以检测。
2.感受野太大。大的感受野提供了冗余信息。
3.分类和检测共享相同的特征图。网络难以平衡分类和回归的损失函数。
4.anchors太过密集。提高了召回率但也提高了虚警率。
作者针对以上问题设计了对应改进策略,使得改进后的算法在主流的人脸检测数据集上精度都达到了state-of-the-art。
网络架构
如下图,
主要包括:Base convolutional layers( ResNet-101),Extra convolutional layers,Detection convolutional layers。
改进策略
1.融合更高层的特征图。
2.Detection模块分类和回归任务分离。
3.改进训练时anchors分配策略,降低数量。
实验证明,经过上述改进,降低了虚警率,如下图:
实验结果
作者分别在AFW、Pascal Face、FDDB、Wider Face四个数据集上进行了实验,达到了与双阶段检测算法state-of-the-art相当的精度。
甚至作者将该算法与Face++、Picase、Face.com商业公司的产品相比较,精度上也毫不逊色。
作者在Titan X GPU硬件上与其他算法进行了推断速度的比较,在精度可比较的范围,该文算法速度更具优势。在640*480图像上推断速度是26ms。
在Wider Face Validation hard set取得75.0%AP时每幅图像推断速度36ms,相比较CVPR2018的论文 Seeing Small Faces from Robust Anchor’s Perspective取得75.7%AP的推断速度是大于150ms。
人脸检测示例:
可惜的是,目前并未发现该文有开源代码。
论文地址:
https://arxiv.org/pdf/1902.01559v1.pdf
加入专业讨论群
加入52CV-人脸相关专业讨论群,扫码添加52CV君拉你入群:
(请务必注明:人脸)
喜欢在QQ交流的童鞋,可以加52CV官方QQ群:928997753。
(不会时时在线,如果没能及时通过验证还请见谅)
更多技术干货,详见:
"我爱计算机视觉"干货集锦分类汇总(2019年1月20日)
长按关注我爱计算机视觉
日本东北大学改进单阶段人脸检测—兼具速度与精度优势相关推荐
- RetinaFace:单阶段人脸检测方法
论文地址:RetinaFace:Single-stage Dense Face Localisation in the Wildhttps://arxiv.org/pdf/1905.00641.pdf ...
- 计算机视觉:单阶段目标检测模型YOLO-V3
计算机视觉:单阶段目标检测模型YOLO-V3 单阶段目标检测模型YOLO-V3 YOLO-V3 模型设计思想 产生候选区域 生成锚框 生成预测框 对候选区域进行标注 标注锚框是否包含物体 标注预测框的 ...
- 单阶段目标检测重要论文总结
文章目录 一.Yolov1 1.论文简介 2.检测原理 3.结构设计 4.疑难问题 5.论文总结 二.Yolov2 1.论文简介 2.更好.更快.更强 1)为什么更好? 2)为什么更快? 3)为什么更 ...
- 单阶段目标检测算法之YOLOv1详解
官方网站C语言版本:https://pjreddie.com/darknet/yolov1/ tensorflow版本的代码下载: https://github.com/hizhangp/yolo_t ...
- 单阶段目标检测方法SSD介绍与分析
SSD目标检测算法,完整详细讲解 SSD(single shot multi-box detector) 1. 简介 2. 模型结构 backbone neck head SSD(single sho ...
- 一种改进的快速人脸检测算法
人脸检测是计算机视觉及相关领域的关键技术,在智能人机交互.视频会议.安全监控等方面都有着广阔的应用前景.目前人脸检测方法主要有基于知识的方法和基于统计学习的方法[1].其中,基于知识的检测算法首先抽取 ...
- YOLOv7如何提高目标检测的速度和精度,基于优化算法提高目标检测速度
目录 一.学习率调度 二.权重衰减和正则化 三.梯度累积和分布式训练 1.梯度累积 2.分布式训练 四.自适应梯度裁剪 大家好,我是哪吒. 上一篇介绍了YOLOv7如何提高目标检测的速度和精度,基于模 ...
- 怎么把人脸检测的速度做到极致
首先,我承认这个题目有点标题党.之所以写这篇,因为发现微信微博上有很多公司介绍他们的技术,但都是说如何如何牛,但缺少技术细节,对读者帮助有限.因此写一点相对干货多的东西,希望能帮助大家.如有谬误,也请 ...
- 单阶段目标检测模型YoLo系列(一):YoLoV3详解及代码实现
目录 1.YoLoV3网络结构 1.1 Backbone:Darknet-53 1.2 构建特征金字塔 1.3 YoLo Head 2.yolov3模型预测结果的解码 2.1 先验框 2.2 检测框解 ...
最新文章
- 解决Linux CENTOS服务器 tree命令出现乱码 解析原因
- MySQL设计之三范式
- 微信公众号监听返回按钮问题解决
- reflow 和 repaint
- 超大规模数据中心容量在四年内翻了一番,中国占比15%
- 近世代数--外直积--外直积是什么?关于阶的性质?
- mysql update返回_MySQL中,当update修改数据与原数据相同时会再次执行吗?
- 【异常(待解决)】org.apache.http.NoHttpResponseException: api.weixin.qq.com:443 failed to respond...
- 逆水寒7月19服务器维护,逆水寒7月19日更新维护公告 更新内容汇总
- DLL注入(CreateRemoteThread方式)
- 杭电2540遮挡判断
- 200多个恶意NPM程序包针对Azure 开发人员,发动供应链攻击
- WinAVI FLV Converter v1.0 注册码
- 把实体 转为json 数据格式---jackson 的详细用法_Jackson快速入门
- 计数器—verilog
- 阿里云Centos7服务器域名解析和Nginx配置
- 马士兵—JVM—内存溢出—2.arthas阿里线上Java诊断工具
- SEO与SEM是什么?有何区别?
- IOC在墨者革离中的理解
- 机器视觉在服务机器人中的应用
热门文章
- Spring JDBC开发
- 如何开始 java core java
- python求1到n的平方和小于1000_C语言,求1到1000以内17倍数平方和,谢谢了
- 程序怎么在matlab运行不了,这个程序在MATLAB 7.0中为什么运行不起来 那个工具箱怎么装...
- java URL连接ftp_java – URLConnection FTP列表文件
- 计算机在线问答,网络信息安全知识:公安机关发现影响计算机信息系统安全的隐患时,()。...
- java函数参数 省略号_[转] java使用省略号代替多参数.pdf
- 【script】python使用cx_Oracle模块访问Oracle
- php类实例化js,php中如何实例化一个类_后端开发
- Esxi 6.5u2升级Esxi 6.7