本文转载自知乎,作者来自媒智科技,介绍了其今天刚刚开源的人脸检测工程TinaFace,已获作者授权转载,请勿二次转载。

https://zhuanlan.zhihu.com/p/315511581

这几年人脸检测的benchmark越刷越高,方法也越来越复杂,提出的模块或者方法大都专门为人脸检测设计,不易复现和使用,比如DSFD里的FEM、PAL、IAM,ASFD里的AutoFEM、PAL、IAM、DRMC loss,HAMBox里的PA、OAM、RAL等等。

WIDER FACE验证集hard结果

WIDER FACE测试集hard结果

鉴于此,我们设计了一个简单而又强大的人脸检测模型——TinaFace,该模型基于RetinaNet,相比RetinaNet只做了很小的改动:

  • 将BN换成GN;

  • 加了一个IoU预测分支;

  • 在backbone上嵌入了DCNv1;

  • 将框回归的loss从smooth l1 loss替换为DIoU loss。

在仅使用ResNet50作为backbone的情况下,TinaFace在WIDER FACE的验证集和测试集中的hard上达到了当前的state of the art。我们只看hard的原因在于WIDER FACE的easy和medium都包含在hard之中,hard体现的是一个人脸检测器在所有人脸上的检测效果。

具体来说,在单模型,backbone仅为ResNet50的情况下:

1、验证集上

1.1、不使用TTA的TinaFace:TinaFace的AP为93.0%,比基于ResNet152的ASFD(使用TTA)高0.5%,比基于ResNet152的DSFD(使用TTA)高1.8%;

1.2、使用TTA的TinaFace:TinaFace的AP为93.4%,比基于ResNet50的HAMBox(使用TTA)高0.1%。

2、测试集上

2.1、不使用TTA的TinaFace:TinaFace的AP为92.1%,与基于ResNet152的ASFD(使用TTA)一样,比基于ResNet152的DSFD(使用TTA)高2.1%;

2.2、使用TTA的TinaFace:TinaFace的AP为92.4%,比基于ResNet50的HAMBox(使用TTA)高0.1%。

TinaFace非常简单,基于RetinaNet,所添加的模块在在通用的目标检测框架(比如mmdetection、vedadet)中都是现成的。而且训练不需要大batch,即使你的显存只有11G,也可以复现TinaFace。也正因为TinaFace使用的模块都非常经典、成熟,TinaFace也会比较容易部署。

我们的代码开源地址在文末,基于vedadet,里面提供当前最好结果的权重,以及训练、测试、推理代码,无论大家是想做研究、打比赛、还是仅仅想体验state of the art的效果,这个repo都能满足你。

vedadet能做到的不仅于此,vedadet是我们基于mmdetection开发的单阶段目标检测框架,适用任意目标检测任务,无论是人脸检测还是通用目标检测。

vedadet提供训练、测试、推理特性,后续会支持转ONNX/TensorRT,以及基于TensorRT的Python前端SDK或者C++前端SDK。

想了解实验细节的朋友可以参见论文TinaFace: Strong but Simple Baseline for Face Detection (文末附下载)。实验中使用的数据分析工具我们也开源了——volkscv。

TinaFace 代码:

https://github.com/Media-Smart/vedadet/tree/main/configs/trainval/tinaface

volksdep: 一个实用TensorRT部署和加速PyTorch、Onnx和TensorFlow模型的开源库

https://github.com/Media-Smart/volksdep

FlexInfer:一个灵活的Python前端推断库

https://github.com/Media-Smart/flexinfer

cheetahinfer:一个基于TensorRT的纯C++推断SDK

https://github.com/Media-Smart/cheetahinfer

vedadet:一个基于PyTorch的单阶段目标检测工具箱

https://github.com/Media-Smart/vedadet

volkscv:一个计算机视觉研究与部署的基础Python库

https://github.com/Media-Smart/volkscv

论文下载:

论文目前还没有公开arXiv地址,在我爱计算机视觉 公众号后台回复“tinaface”,即可收到PDF下载。

END

备注:人脸

人脸技术交流群

人脸检测、识别、对齐、重建、表情识别、表情迁移等技术,

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

TinaFace:人脸检测新纪录!相关推荐

  1. TinaFace:人脸检测新纪录

    作者丨mileistone@知乎 来源丨https://zhuanlan.zhihu.com/p/315511581 编辑丨极市平台 这几年人脸检测的benchmark越刷越高,方法也越来越复杂,提出 ...

  2. 收藏 | TinaFace:人脸检测新纪录

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:作者丨mileistone@知乎 来源丨https://zh ...

  3. 人脸检测总结报告(2018_1_20-2018_1_30)

    一.总述 根据Yang,Kriegman,and Ahuja(2002)的分类,人脸检测的方法分为基于特征的.基于模板的和基于表观的方法. 基于特征的方法,尝试寻找有区分性的图像特征的位置,比如眼睛. ...

  4. 面孔相册按脸给照片分类 这是靠小米人脸检测技术实现的

    昨天,小米科技联合创始人黄江吉在微博上宣布小米人脸检测算法团队研发的新算法在FDDB人脸检测准确率榜上取得排名第一,随后小米科技董事长兼CEO雷军也第一时间转发了这条微博,指出FDDB是由马萨诸塞大学 ...

  5. 人脸检测算法对比分析

    人脸识别包括以下5个步骤:人脸检测.图像预处理.特征提取.匹配.结果输出. 人脸检测是人脸识别中的第一个环节,是一项关键技术.人脸检测是指假设在输入图像中存在一个或者多个人脸区域的情况下,确定图像中全 ...

  6. 曾刷新两项世界纪录,腾讯优图人脸检测算法 DSFD 正式开源...

    雷锋网(公众号:雷锋网) AI 科技评论按:近年来,卷积神经网络在人脸检测中取得了很大的成功,然而这些方法在处理人脸中多变的尺度,姿态,遮挡,表情,光照等问题时依然比较困难.为此,腾讯优图推出名为 D ...

  7. 曾刷新两项世界纪录,腾讯优图人脸检测算法 DSFD 正式开源

    雷锋网(公众号:雷锋网) AI 科技评论按:近年来,卷积神经网络在人脸检测中取得了很大的成功,然而这些方法在处理人脸中多变的尺度,姿态,遮挡,表情,光照等问题时依然比较困难.为此,腾讯优图推出名为 D ...

  8. 重磅!刷新两项世界纪录的腾讯优图人脸检测算法DSFD开源了!

    近日,知名开源社区Github上有个名为DSFD(Dual Shot Face Detector)的算法引起了业内关注,它正是来自于腾讯优图.目前,该算法已经被计算机视觉顶级会议CVPR 2019接收 ...

  9. 跳过人脸检测和关键点定位,Facebook等提出实时3D人脸姿态估计新方法

    本文转载自机器之心. 来自 Facebook AI 和美国圣母大学的研究者提出了一种 6 自由度的实时 3D 人脸姿态估计技术,可以不依赖人脸检测和人脸关键点定位独立运行. 人脸检测是给照片中的每个人 ...

最新文章

  1. redhat7配置本地yum、163 yum、epel 源
  2. #!/usr/bin/env python与#!/usr/bin/python的区别
  3. 原本挂起的线程继续执行
  4. SAP CDS view自学教程之八:SAP Fiori Elements里不同类型的annotation
  5. beetl 页面标签_05.Beetl标签函数以及定界符、占位符介绍---《Beetl视频课程》
  6. 自定义注解判空简单示例
  7. oracle12c order by,oracle 数据库中order by 的一些高级用法
  8. 面试中的智力题及编程实践(二)
  9. php file取不到手机相册,webuploader移动端选择文件无法打开手机相册的解决办法...
  10. SaltStack系列(二)之常用模块介绍
  11. 易语言API HOOK DeviceIOControl修改磁盘序列号
  12. 中兴流媒体服务器,中兴通讯增强型MEC边缘服务器,满足5G业务极致体验需求
  13. 使用python刷访问量
  14. 企业网站内容维护日常工作有哪些
  15. win7环境安装ubuntu16.04双系统
  16. linux给文件夹腹权限,文件的权限_腹有诗书气自华的技术博客_51CTO博客
  17. Codeforces Round #703 (Div. 2)A. Shifting Stacks
  18. 区块链行业前景还好吗?区块链技术有没有经过时间的检验?
  19. 传统网吧风光不再 玩家上座率不足50%
  20. JavaWeb(后端)

热门文章

  1. 基于MeanShift的目标跟踪算法及实现(转载)
  2. 一个XML Schema及XML文档(联系人)
  3. 数据竞赛入门-金融风控(贷款违约预测)一、赛题介绍
  4. 6-4 使用函数统计指定数字的个数_高手不可不学的Excel引用函数(上)
  5. python snmp采集交换机信息_交换机和大机技术术语(大全)
  6. android控件单位,Android控件相对位置及长度单位
  7. boost.asio基础篇 小白入门注解
  8. python模拟登录webspare_全面解读python web 程序的9种部署方式
  9. csv格式清洗与转换python123,Python Pandas 清理错误格式数据
  10. html5图像映射坐标怎么看,html学习之创建图像映射