近日,知名开源社区Github上有个名为DSFD(Dual Shot Face Detector)的算法引起了业内关注,它正是来自于腾讯优图。目前,该算法已经被计算机视觉顶级会议CVPR 2019接收,并且在2018年10月刷新了两个权威的人脸检测数据集WIDER FACE和FDDB上的新纪录。

Github开源地址:

https://github.com/TencentYoutuResearch/FaceDetection-DSFD

论文公开地址:https://arxiv.org/abs/1810.10220

“三点创新”打造人脸检测领域最值得参考的代码

人脸检测算法是在图像上,检测出人脸的位置(通常以矩形框形式输出),是人脸配准、人脸属性识别、人脸核身、人脸检索等技术的基础。优图此次提出的DSFD人脸检测算法,主要有3点创新:

(1)设计了一种新的“特征增强”模块(FEM:Feature Enhance Module)

FEM在采用Top-Down层间信息融合的同时,在同一“感受野”内做了更多的enhancement。因此在network width and depth上学习到了更有效的context和semantic信息。

(2)提出了“分层锚点渐进”式的代价函数监督(PAL:Progressive Anchor Loss)

模型采用2个层级(hierarchy),基于第一层(low-level)和第二层(high-level)的差异性,适配了不同尺寸的anchor。在训练过程中,PAL对整个模型形成了更有效的监督。

(3)设计了一种“改进的锚点匹配策略”(Improved Anchor Matching Strategy)

One-stage detector由于在输出层分配有密集的anchor,anchor与face匹配的好坏直接影响训练效果,优图的研究员们在data augmentation过程中充分考虑了不同大小的face和各个anchor的关系,提出了一种新的数据扩增方法。

(算法整体流程图)

效果提升,来自优图不断的研究

随着近几年人工智能技术的发展,国内外不少机构、企业都在进行人脸检测的相关研究。腾讯优图的研究员们发现,虽然之前的人脸检测算法大都采用深度学习模型,并在特征学习的过程中也有采用特征金字塔网络(Feature Pyramid Network),但在面对遮挡、暗光、大姿态、小脸等复杂场景时,仍容易出现误检或漏检的情况。因此在FPN基础上,腾讯优图团队采用了3种不同级联方式的空洞卷积(Dilated Convolution),设计了特征增强模块FEM,充分学习到了不同感受野下的人脸特征。

(复杂场景下的人脸检测效果展示)

然而,在新算法探索的过程中,并不是一帆风顺的。这个项目从去年7月中旬启动,进行到第三周,检测效果已经在top5了,但优图的研究员们清楚,到这里还远远不够。在接下来的两个多月里,想要提升效果却越来越难。就好像爬山,前面爬得很快,越到后面,对耐力和决心的要求就越高,腾讯优图高级研究员Casey回忆道:“那段时间,我和其他几位同事实验了很多方案,很多时候是多个方案同时跑,甚至有些方案跑了4-5天后,发现失败了,又得做新的尝试。”失败后,几个研究员就近在工位旁边的玻璃房里,一起分析原因,开始摸索下一套试跑方案。在3个多月的反复“试跑-推翻-试跑”中,最后终于跑出一套大家都满意的算法。不负所望,该算法论文也已被CVPR2019接收。

走出实验室,为业务创造价值;

代码开源,与同行共同探讨

算法从实验室走出来,不是立马就能直接套用到业务里。事实上,论文里的模型通常比较大,导致实时性不好。在使用时,需结合实际应用情况压缩、裁剪,整体模型会做一定的调整。目前,腾讯优图的人脸检测技术已在安防、金融、社交、交通、零售等多个应用场景落地,并在手机QQ、微众银行、天天P图等多个公司内外部产品上进行应用验证。以安防领域为例,腾讯优图天眼智能安防平台以警务、安防需求为导向,是优图团队面向稽查布控、刑侦办案、社会安防等多场景推出智能化海量人脸检索解决方案。

(腾讯优图天眼智能安防平台)

2017年,腾讯对外开源节奏开始加快,主要覆盖AI、云计算、腾讯游戏、腾讯安全、小程序等相关领域。而腾讯优图的计算机视觉技术的开源更是其中重要的一环。2017年7月,腾讯优图首个AI开源项目NCNN已经正式开源,这是一个为移动端极致优化的高性能神经网络前向的计算框架,是业内首个为移动端优化的开源神经网络推断库。2018年,NCNN宣布正式加入ONNX,截止目前,NCNN的Github star数已接近6000。随着计算机视觉技术的不断开源, AI开发者能更快实现从研究到模型的落地部署,也能更方便地在不同框架间切换,为每项任务选取最优的开发工具。相信随着越来越多的AI机构、企业和个人的算法开源,将驱动整个AI研究更快发展和落地。

欢迎关注磐创博客资源汇总站:http://docs.panchuang.net/

欢迎关注PyTorch官方中文教程站:http://pytorch.panchuang.net/

重磅!刷新两项世界纪录的腾讯优图人脸检测算法DSFD开源了!相关推荐

  1. 曾刷新两项世界纪录,腾讯优图人脸检测算法 DSFD 正式开源...

    雷锋网(公众号:雷锋网) AI 科技评论按:近年来,卷积神经网络在人脸检测中取得了很大的成功,然而这些方法在处理人脸中多变的尺度,姿态,遮挡,表情,光照等问题时依然比较困难.为此,腾讯优图推出名为 D ...

  2. 曾刷新两项世界纪录,腾讯优图人脸检测算法 DSFD 正式开源

    雷锋网(公众号:雷锋网) AI 科技评论按:近年来,卷积神经网络在人脸检测中取得了很大的成功,然而这些方法在处理人脸中多变的尺度,姿态,遮挡,表情,光照等问题时依然比较困难.为此,腾讯优图推出名为 D ...

  3. 打破两项世界纪录,腾讯优图开源视频动作检测算法DBG

    近日,腾讯优图实验室提出一种新的视频动作检测算法DBG并开源,这是继今年4月人脸检测算法DSFD开源后,优图的又一次开源动作. 目前,DBG算法在全球两大权威视频动作数据集ActivityNet-1. ...

  4. 腾讯开源视频动作检测算法DBG,打破两项世界纪录!

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转自腾讯优图. 近日,腾讯优图实验室提出一种新的视频动作检测算法DBG并开源,这是继今年4月人脸检测算法DSFD开源后,优图的又一次开源动作. 目前 ...

  5. AI一分钟 | 阿里NLP技术连破两项世界纪录,玉泉一号AI试验卫星明年发射

    一分钟AI: 阿里人工智能技术重大突破:连破中.英文语言处理两项世界纪录 内蒙古携手银河航天:明年发射玉泉一号AI试验卫星 百度计划2018年投资逾10家AI创业公司 重庆启动人工智能重大专项 总投入 ...

  6. 刷新三项世界纪录的跨镜追踪(ReID)技术是怎样实现的?进来了解一下

    跨镜追踪(Person Re-Identification,简称 ReID)技术是现在计算机视觉研究的热门方向,主要解决跨摄像头跨场景下行人的识别与检索.该技术能够根据行人的穿着.体态.发型等信息认知 ...

  7. 燃!阿里AI技术取得重大突破:连破中、英语言处理两项世界纪录

    日前,阿里巴巴披露了自然语言处理技术取得的两项新成绩:在全球顶级的知识库构建测评KBP2017中,斩获英文实体发现测评全球冠军:在中文语法错误自动诊断大赛(Chinese Grammatical Er ...

  8. html5第一人,中国高空走钢丝第一人,阿迪力·吾休尔(创5项世界纪录)

    高空走钢丝我们都知道是一项非常难的"杂技运动",要有超强的平衡感和胆量才敢迈出这一步.那你有听说过阿迪力·吾休尔(中国新疆)这个人吗?他号称是中国高空走钢丝第一人,曾经创下过5项高 ...

  9. 腾讯优图再创世界纪录 列MegaFace海量人脸识别测试榜首

    腾讯科技讯 在人脸识别领域,国内的研究团队已经走在了世界的前列.近日,腾讯优图实验室就在国际权威海量人脸识别数据库MegaFace中,以83.290%的最新成绩在100万级别人脸识别测试(Challe ...

最新文章

  1. C++ static
  2. 大型互联网大型分布式架构演进之路
  3. 没有与这些操作数【】匹配的运算符_[02]java数据类型和运算符等知识
  4. 2021年5月信息系统项目管理师案例分析真题+视频讲解(1)
  5. 利用python爬虫(案例5)--X刺代理的小IP们
  6. ad域管理与维护_U-Mail邮件系统LDAP/AD同步极大提升办公效率
  7. mysql索引_MySQL索引介绍和实战
  8. git日常使用的常用命令总结
  9. 『摄影欣赏』好萌了!12幅可爱的婴儿照片【组图】
  10. 媒体查询以及flexbox,响应式图片
  11. 高中女销售学Linux云计算4个月搞定年薪12万
  12. 大功率UWB模块 XZM3000 移植手册 《从DWM1000到XZM3000移植手册》
  13. thinkphp的商城 好在哪里
  14. 2018年尚硅谷徐靖博老师的分布式电商项目视频
  15. realsense相机色彩图与深度图对齐
  16. 涨停前常见的K线形态
  17. CSS 分析倒三角|侧三角|正三角的实现
  18. 一个DIV的芝士汉堡制作
  19. 如何成为名副其实的测试架构师?
  20. 论坛数据库设计初步设计

热门文章

  1. 冬天拍婚纱照注意事项 拍出养眼婚纱照
  2. 向 Elastic Beanstalk 环境中添加数据库
  3. 从零开始的渗透测试(四)
  4. 智能电梯自动化系统行业调研报告 - 市场现状分析与发展前景预测
  5. geant4构造粒子_Geant4 入射粒子设置
  6. Ensp中USG6000v登录解决办法
  7. visio中图形旋转任意角度的方法
  8. JavaSE-基本程序设计结构(下)
  9. sql快速入门-xuesql.cn
  10. std::string::npos的使用