点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★,与你不见不散

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:作者丨mileistone@知乎

来源丨https://zhuanlan.zhihu.com/p/315511581

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

这几年人脸检测的benchmark越刷越高,方法也越来越复杂,提出的模块或者方法大都专门为人脸检测设计,不易复现和使用,比如DSFD里的FEM、PAL、IAM,ASFD里的AutoFEM、PAL、IAM、DRMC loss,HAMBox里的PA、OAM、RAL等等。

WIDER FACE验证集hard结果

WIDER FACE测试集hard结果

鉴于此,我们设计了一个简单而又强大的人脸检测模型——TinaFace(https://github.com/Media-Smart/vedadet/tree/main/configs/trainval/tinaface),该模型基于RetinaNet,相比RetinaNet只做了很小的改动:

  • 将BN换成GN;

  • 加了一个IoU预测分支;

  • 在backbone上嵌入了DCNv1;

  • 将框回归的loss从smooth l1 loss替换为DIoU loss。

在仅使用ResNet50作为backbone的情况下,TinaFace在WIDER FACE的验证集和测试集中的hard上达到了当前的state of the art。我们只看hard的原因在于WIDER FACE的easy和medium都包含在hard之中,hard体现的是一个人脸检测器在所有人脸上的检测效果。

具体来说,在单模型,backbone仅为ResNet50的情况下。

1、验证集上

1.1、不使用TTA的TinaFace:TinaFace的AP为93.0%,比基于ResNet152的ASFD(使用TTA)高0.5%,比基于ResNet152的DSFD(使用TTA)高1.8%

1.2、使用TTA的TinaFace:TinaFace的AP为93.4%,比基于ResNet50的HAMBox(使用TTA)高0.1%

2、测试集上

2.1、不使用TTA的TinaFace:TinaFace的AP为92.1%,与基于ResNet152的ASFD(使用TTA)一样,比基于ResNet152的DSFD(使用TTA)高2.1%

2.2、使用TTA的TinaFace:TinaFace的AP为92.4%,比基于ResNet50的HAMBox(使用TTA)高0.1%

TinaFace非常简单,基于RetinaNet,所添加的模块在在通用的目标检测框架(比如mmdetection、vedadet(https://github.com/Media-Smart/vedadet))中都是现成的。而且训练不需要大batch,即使你的显存只有11G,也可以复现TinaFace。也正因为TinaFace使用的模块都非常经典、成熟,TinaFace也会比较容易部署。

我们的代码开源地址为TinaFace,基于vedadet,里面提供当前最好结果的权重,以及训练、测试、推理代码,无论大家是想做研究、打比赛、还是仅仅想体验state of the art的效果,这个repo都能满足你。

vedadet能做到的不仅于此,vedadet是我们基于mmdetection开发的单阶段目标检测框架,适用任意目标检测任务,无论是人脸检测还是通用目标检测。vedadet提供训练、测试、推理特性,后续会支持转ONNX/TensorRT(https://github.com/Media-Smart/volksdep),以及基于TensorRT的Python前端SDK(https://github.com/Media-Smart/flexinfer)或者C++前端SDK(https://github.com/Media-Smart/cheetahinfer)。

想了解实验细节的朋友可以参见论文TinaFace: Strong but Simple Baseline for Face Detection(https://arxiv.org/abs/2011.13183)。实验中使用的数据分析工具我们也开源了——volkscv(https://github.com/Media-Smart/volkscv)。

end

这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 

目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟

王博的公众号,欢迎关注,干货多多

王博的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章(上)

博士笔记 | 周志华《机器学习》手推笔记第八章(下)

博士笔记 | 周志华《机器学习》手推笔记第九章

点个在看支持一下吧

收藏 | TinaFace:人脸检测新纪录相关推荐

  1. TinaFace:人脸检测新纪录

    作者丨mileistone@知乎 来源丨https://zhuanlan.zhihu.com/p/315511581 编辑丨极市平台 这几年人脸检测的benchmark越刷越高,方法也越来越复杂,提出 ...

  2. TinaFace:人脸检测新纪录!

    本文转载自知乎,作者来自媒智科技,介绍了其今天刚刚开源的人脸检测工程TinaFace,已获作者授权转载,请勿二次转载. https://zhuanlan.zhihu.com/p/315511581 这 ...

  3. 人脸检测总结报告(2018_1_20-2018_1_30)

    一.总述 根据Yang,Kriegman,and Ahuja(2002)的分类,人脸检测的方法分为基于特征的.基于模板的和基于表观的方法. 基于特征的方法,尝试寻找有区分性的图像特征的位置,比如眼睛. ...

  4. 面孔相册按脸给照片分类 这是靠小米人脸检测技术实现的

    昨天,小米科技联合创始人黄江吉在微博上宣布小米人脸检测算法团队研发的新算法在FDDB人脸检测准确率榜上取得排名第一,随后小米科技董事长兼CEO雷军也第一时间转发了这条微博,指出FDDB是由马萨诸塞大学 ...

  5. 人脸检测算法对比分析

    人脸识别包括以下5个步骤:人脸检测.图像预处理.特征提取.匹配.结果输出. 人脸检测是人脸识别中的第一个环节,是一项关键技术.人脸检测是指假设在输入图像中存在一个或者多个人脸区域的情况下,确定图像中全 ...

  6. 收藏 | 人脸检测之Retinaface

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:作者丨pengtougu,Sansa Shi(已授权) 来源丨https://zhuanlan.zhihu.c ...

  7. 曾刷新两项世界纪录,腾讯优图人脸检测算法 DSFD 正式开源...

    雷锋网(公众号:雷锋网) AI 科技评论按:近年来,卷积神经网络在人脸检测中取得了很大的成功,然而这些方法在处理人脸中多变的尺度,姿态,遮挡,表情,光照等问题时依然比较困难.为此,腾讯优图推出名为 D ...

  8. 曾刷新两项世界纪录,腾讯优图人脸检测算法 DSFD 正式开源

    雷锋网(公众号:雷锋网) AI 科技评论按:近年来,卷积神经网络在人脸检测中取得了很大的成功,然而这些方法在处理人脸中多变的尺度,姿态,遮挡,表情,光照等问题时依然比较困难.为此,腾讯优图推出名为 D ...

  9. 重磅!刷新两项世界纪录的腾讯优图人脸检测算法DSFD开源了!

    近日,知名开源社区Github上有个名为DSFD(Dual Shot Face Detector)的算法引起了业内关注,它正是来自于腾讯优图.目前,该算法已经被计算机视觉顶级会议CVPR 2019接收 ...

最新文章

  1. python代码块所属关系的语法-天元高校邦数据科学通识课【Python基础语法】答案...
  2. gnuplot_i 文件的说明,翻译成的中文
  3. 使用PyTorch进行手写数字识别,在20 k参数中获得99.5%的精度。
  4. 缓存应用--Memcached分布式缓存简介(二)
  5. 【原】winform定制datagrid模板
  6. cacti监控 磁盘I/O
  7. 官宣:Linux 内核主要贡献者 Linaro「喜提」新任 CEO!
  8. GNU make manual 翻译(三十)
  9. SQL2005下载版本之区别
  10. Python实现简单的层次聚类算法以及可视化
  11. apkg格式怎么打开_jpg怎么转换成pdf?再不学就晚了!
  12. 2022,程序员的出路在哪里?
  13. Markdown博客系统的搭建与使用
  14. 数据挖掘实验:使用 Hadoop 实现 WordCount 应用
  15. linux dd 硬盘克隆,如何使用Linux dd命令克隆磁盘
  16. C语言——基本编写规范
  17. 穆迪收购风险与合规情报、数据和软件领域的领导者RDC
  18. 网络协议分析(第二版)期末复习资料一
  19. sed命令详解与示例
  20. 城市与地区级联选择框的使用

热门文章

  1. outlook+app+android,微软Outlook Web App抢占Android平台
  2. java动态生成excel_java动态生成excel打包下载
  3. 矩阵每一行重复_python:19.顺时针打印矩阵
  4. css如何调整红心样式_CSS3跳动的红心
  5. 用PHP做一道单选选择题的页面,【大神看过来】根据一个用PHP做的单选投票,改成多选,且可显示...
  6. android 编译时解析xml布局,android – 在xml布局中引用build.gradle versionName属性
  7. day-05 python函数
  8. [CTF]思维导向图
  9. ResNet论文笔记
  10. 树莓派学习之路-GPIO Zero