RetinaFace: Single-stage Dense Face Localisation in the Wild

作者: 帝国理工,伦敦米德尔塞克斯大学,InsightFace
paper: https://arxiv.org/pdf/1905.00641.pdf
github: https://github.com/deepinsight/insightface/tree/master/RetinaFace

摘要: 虽然在未受控制的人脸检测方面取得了巨大进步,但野外准确有效的面部定位仍然是一个开放的挑战。这篇文章提出了一个强大的单阶段人脸检测器,名为RetinaFace,它利用联合监督和自我监督的多任务学习,在各种人脸尺度上执行像素方面的人脸定位。具体来说,我们在以下五个方面做出了贡献:(1)我们在WIDER FACE数据集上手动注释五个面部标志,并在这个额外的监督信号的帮助下观察硬面检测的重要改进。 (2)我们进一步增加了一个自监督网格解码器分支,用于与现有的受控分支并行地预测像素三维形状的面部信息。 (3)在WIDER FACE硬测试装置上,RetinaFace的性能优于现有技术平均预测(AP)1.1%(达到AP等于91.4%)。 (4)在IJB-C测试集上,RetinaFace使最先进的方法(ArcFace)能够改善他们在面部验证中的结果(FAR = 1e-6的TAR = 89.59%)。 (5)通过采用轻量级骨干网络,RetinaFace可以在单个CPU内核上实时运行,以实现VGA分辨率的显示。

1. 人脸检测任务引言

  1. 与通用物体检测不同,人脸检测具有较小的比率变化。1:1到1:1.5
  2. 但是人脸的尺度变化比较大,从几个像素到几千个像素
  3. 借鉴MTCNN,加入5个人脸关键点,提升检测算法在hard部分的精度
  4. 通过自监督学习使用网格解码器分支来预测与现有监督分支并行的像素级三维人脸形状

2. 相关工作

图像金字塔or特征金字塔

一阶段or二阶段

背景建模

SSH等通过在特征图中引入上下文建模提高小人脸的检测。可变性卷积(DCN)也有助于提高精度

多目标损失

在人脸检测中加入人脸关键点的检测有助于提高box的回归精度。如果MASK RCNN增加一个分割分支一样。

3. Retinaface

3.1 多损失

  • 分别是分类(focal loss),box回归(IOU loss),人脸关键点,密集的回归损失(这个不懂)

3.2 密集回归损失

  • 采用mesh decoder来编码连接形状和纹理信息
    。。。这个不太懂

4. 实验

  • 采用wider face数据进行训练
  • 根据图片的清晰质量,标注了人脸的5个关键点,有些不可见的则不标注

4.2 应用细节

  • 加入了FPN
  • 在5个金字塔特征图中加入了独立的上下文模块提高建模能力
  • 还用可变形卷积网络(DCN)替换了横向连接和上下文模块中的所有3×3个卷积层
  • 多正样本,采用同样的损失头和不同的特征图在计算多损失
  • anchor的设定:在从P2到P6的特征金字塔级别上使用特定比例的锚点
  • 采用OHEM优化正负anchor不平衡的问题

图像增强

  • 因为wider face有20%的小人脸,于是在增强的时候,以图像的短边为基准,随机resize [0.3, 1],在调整成640*640的方形块,如果人脸的中心点在方形块中,则保留这个人脸。

测试策略

  • 翻转,多尺度,投票策略(实际应用这些都没啥用),不过竞赛的时候,这些还是很有用的。

分析

  • 加DCN有用,0.x的提升
  • 加上关键点分支有用, 1左右的提升

文章创新点

  1. 整个模型整合了:人脸检测、人脸对齐、像素级的人脸分析、3D密集通信回归(这个不太懂)。
  2. 通过利用强监督和自监督多任务损失函数来实现上述功能。
  3. 基于单阶段设计,我们提出了一种名为RetinaFace的新型像素智能人脸定位方法,该方法采用多任务学习策略同时预测人脸分数,面部框,五个点和三维位置。每个面部像素的对应关系
  4. Mesh Decoder使用图卷积神经网络进行加速

结果





文章的思路(最关键)

  1. 为了速度,所以在一阶段的通用检测器上进行改进,而retina检测算法又是当前精度最高的。
  2. 加入了上下文建模模块,DCN等小的部件
  3. 加入了人脸关键点分支,这个确实有一定作用
  4. 多损失函数的融合。
  5. 自监督方法的引入。(个人认为这是最可以借鉴的一点,也是借鉴之后具有通用性和可复制性的一点)

人脸检测——RetinaFace相关推荐

  1. 原创 人脸检测 RetinaFace

    原创 人脸检测 RetinaFace 2019-07-08 20:36:26 ShellCollector 阅读数 574更多 分类专栏: 深度学习 视觉相关 版权声明:本文为博主原创文章,遵循 CC ...

  2. 瑞芯微转化人脸检测retinaface模型

    瑞芯微转化人脸检测retinaface模型 一.运行docker 二.转换步骤 1.使用https://netron.app/查看模型的输入及输出 2.设置转换模型参数 3.运行文件生成rknn模型文 ...

  3. 人脸检测——RetinaFace解读

    <RetinaFace: Single-stage Dense Face Localisation in the Wild> 论文地址:https://arxiv.org/pdf/1905 ...

  4. 人脸检测 RetinaFace

    ap不高,挺快,号称1000fps https://github.com/ShiqiYu/libfacedetection 这个6ms,能检测近距离人脸,无关键点 mxnet https://gith ...

  5. RV1126_python人脸识别Retinaface+MobilefaceNet

    RV1126_python人脸识别Retinaface+MobilefaceNet RV1126 具备RKNN 模块支持大部分如Pytorch.MXNet.Caffe.tensorflow.keras ...

  6. RetinaFace,最强开源人脸检测算法

    作者 | CV君 来源 | 我爱计算机视觉(ID:aicvmlaicvmlaicvml) 人脸检测为目标检测的特例,是商业化最早的目标检测算法,也是目前几乎各大 CV 方向 AI 公司的必争之地. W ...

  7. 史上最强轻量级人脸检测,全面超越retinaface

    本人历时一年,自研一款轻量级人脸检测,模型大小5.43m,在widerface验证集上精度如下: MAP@0.5 Result on validation set of WiderFace Style ...

  8. 人脸检测算法_目前最强!开源人脸检测算法:RetinaFace

    加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...

  9. 目前最强开源人脸检测算法RetinaFace

    点击我爱计算机视觉标星,更快获取CVML新技术 人脸检测为目标检测的特例,是商业化最早的目标检测算法,也是目前几乎各大CV方向AI公司的必争之地. WIDER FACE数据集是由香港中文大学发布的大型 ...

  10. 收藏 | 人脸检测之Retinaface

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:作者丨pengtougu,Sansa Shi(已授权) 来源丨https://zhuanlan.zhihu.c ...

最新文章

  1. 基于RDKit探索DrugBank
  2. Direct2D教程(三)简单几何图形
  3. python怎么安装各种模块_Python2.7安装和常用模块安装
  4. python培训学校-西安有没有好点的Python培训学校
  5. 使用django创建一个单表查询的图书管理系统
  6. 这篇文章来自我的微信朋友圈,并不特别好玩,但能够给创业者补点財务知识...
  7. html5片转为base64,base64和图片的互转(HTML5的File实现)
  8. [转] 史上最全英文免费编程电子书列表
  9. 教你用300行Python代码实现一个人脸识别系统
  10. 支持linux的midi键盘,十款人气MIDI键盘推荐,适合各个阶段的音乐人
  11. VCIP2020:基于深度学习合成参考帧
  12. yolov5检测图片用detect.py
  13. Rediskey的基本操作
  14. phpstorm关闭语法检查的解决方案
  15. 在docker下安装运行vue
  16. 通过 命令行PowerShell 开启、关闭 Windows 10 移动热点,可修改SSID、密码。解决神州网信政府版win10无法管理windows自带移动热点问题。
  17. 跟着大宇学MySQL------目录帖
  18. 2022年信息学部物联网工程学院学生科协机器学习科普
  19. 解读 | 2019 年 10 篇计算机视觉精选论文(中)
  20. 【一周头条盘点】中国软件网(2018.5.2~2018.5.4)

热门文章

  1. 计算机显卡驱动全部卸载,如何卸载显卡驱动重新安装?Win10卸载显卡驱动+重装显卡驱动的方法...
  2. 05|音频降噪概述(1)一传统降噪方法
  3. PLC扩展模块总线连接方式?IO扩展模块和主模块。西门子用到的总线中的一种背板总线简单介绍扩展模块中也有控制芯片(CPU)(或者类似SPI协议芯片),除了扩展模块(SM)还有扩展板(SB)
  4. word中图片为嵌入式格式时显示不全_毕设时,在word中插入图片时,图片的格式改为嵌入式后图片藏于文字下方怎么办?...
  5. Postman强大的接口的前置、后置处理教程
  6. 外部方式启动AndroidStudio模拟器
  7. SNMP中的MIB是什么?
  8. 电子学会机器人等级考试三四级考试大纲
  9. 我在淘宝帮别人写代码,月入10万!
  10. excel几个数相加等于某个数_『excel表如何从一列数据中筛选出合计等于某数的某些数?』...