2020-03-20 11:49:14

十三 发自 凹非寺
量子位 报道 | 公众号 QbitAI

疫情之下,口罩识别有多难,问问你的iPhone用户朋友就知道了。

在“刷脸时代”,戴口罩的人脸识别已然成为一个大问题。

传统的人脸识别算法,已经无法hold住这种大面积遮挡情况,主要难点有三:

  • 一张口罩“封印”半张脸,直接丢失大量脸部特征
  • 短期内无法收集大量戴口罩人脸图像,算法训练难度大
  • 人脸识别系统包含检测、跟踪、识别等多个模块,对它们都会造成影响。

好消息是,AI工程师们逢山开路遇水搭桥,现在——戴口罩人脸识别——这座桥,已经搭好了,而且已经开放了。

来自百度视觉算法团队,技术方面自然也有保障。

不过,知其然最好还要知其所以然。如此模型,百度视觉算法团队是如何完成的呢?

接下来我们一一解密。

戴口罩人脸识别之难:如何快准狠

“三座大山”怎么翻?

首先是第一个难题,丢失了大量脸部特征,如何进行检测。

在人脸识别的过程中,会提取面部大量的特征点,而这些特征点的分布并不都是均匀的。

而且每个区域特征点所包含的信息量(用于身份认证)不同,例如,眼部区域就相比其他位置包含了更多的身份信息。

百度视觉就敏锐地观察到了这一点,找到了翻过这座大山的突破口。

他们通过采用基于空间位置的注意力机制特征学习,让算法更加关注对眼部区域的特征学习。

基于空间位置的注意力机制特征学习

这样一来,就能将因为佩戴口罩、帽子等遮挡,所带来的信息丢失降到最低,也就能充分获取戴口罩人脸的身份信息。

特征可视化结果

算法有了,但数据不够用来训练,又该怎么办呢?

一个传统的办法,就是在现有的人脸图像上“贴”上口罩。

但这样处理后的实验效果并不明显,原因是在真实场景中,人脸姿态会有变化,并且不同场景采集的图像存在一定的差异性。

针对这个问题,百度视觉采用了基于人脸关键点的3D图像融合技术

这样处理后,不仅解决了人脸姿态变化带来的口罩形变和遮挡问题,还生成了更加自然、真实的照片。

合成口罩图片

通过收集市面上各种颜色、大小和样式的口罩图片,与之前积累的未佩戴口罩人脸图片进行融合,快速合成了各种场景、海量真实的戴口罩训练照片。

最后一座大山,人脸识别系统各模块(环节)之间的问题。

百度视觉对此做了一系列的优化。例如:

  • 检测算法方面,采用了百度最新的PyramidBox-lite检测算法,并加入超过10万张口罩人脸数据训练,在准确率不变的情况下,召回率提升了30%,佩戴口罩的人脸检测准确率超99%以上。
  • 口罩分类算法方面,基于人脸关键点网络,抽取了具有丰富面部语义信息的人脸特征表示,并基于该特征进行口罩遮挡判断,还通过PaddleSlim进行模型压缩,大小缩小了3倍多。

问题解决了,性能效果又如何?

优化了识别效果之后,在佩戴口罩情况下人脸识别,准确率出奇的高,速度出奇的快!

但单从理论上解决难题是不够的,应用到急需的场景中才是关键。

其实,这项已经投入到了现实场景,在百度园区,员工上班戴着口罩就可以刷脸“入场”,解决了检测“戴口罩的是谁”的问题。

更早的,针对密集人群戴口罩的检测问题,百度与北京地铁展开了合作,连夜集结专项项目组,3天完成初版部署,7天快速迭代上线,解决了检测密集人群“是否戴口罩”的问题。

嗯,看来是可以愉快的戴口罩上班了!

实力的背后是技术

或许很多人会感到惊讶,百度怎么能够在如此短时间内,解决了难题,还做到了落地?

其实,这是必然的结果。

百度视觉早已在领域中深耕多年,技术实力不容小觑。

为了达到业内SOTA水平,百度视觉技术部在人脸检测问题上产出了一系列的研究,从多个角度进行优化。

上图便是人脸检测器设计的几个优化思路,包括特征融合、上下文信息、锚点设计、额外监督、数据扩充、网络结构等。黄色标注部分为百度视觉发表的论文。

所提出的BOX系列模型,在业界处于领先地位,例如:

  • DenseBox,第一个anchor free且可以进行端到端训练的物体检测器。
  • PyramidBox,引入基于anchor的上下文辅助方法,用于半监督学习人脸上下文特征。
  • DAFBox,基于注意力指引的语义增强特征融合框架来学习各个尺度的具有丰富语义特征金字塔。
  • BFBox,第一篇基于神经网络架构搜索的人脸检测方法,支持同时搜索适合人脸检测的特征提取器和特征金字塔。

还有像HAMBox,可在线挖掘高质量锚点的高性能框架,2019年在ICCV WIDER Face and Pedestrian Challenge上 ,以mAP值57.13%的成绩夺得人脸检测的冠军,远超上一年冠军55.82%的成绩。

红色框是PyramidBox的检测效果,可以看出PyramidBox对于姿态、模糊、遮挡、尺度等条件具有极强的鲁棒性。

研究成果方面,近期即将召开的计算机视觉顶级学术会议CVPR 2020在近日公布了收录的论文,录取率创下新低,相比去年下降3%,仅有22%,百度仍有高达22篇论文入选,其中人脸方向重要的论文包括:

  • HAMBox:Delving into Online High-quality Anchors Mining for Detecting Outer Faces
  • BFBox:Searching Face-appropriate Backbone and Feature Pyramid Network for Face Detector
  • FaceScape:a Large-scale High Quality 3D Face Dataset and Detailed Riggable 3D Face Prediction
  • Hierarchical Pyramid Diverse Attention Network for Face Recognition

此次疫情之下,人脸识别背后的核心技术问题,包括复杂场景多人脸检测、多人脸跟踪定位、实时模型预测、戴口罩人脸识别。

而这些问题,从上述的研究成果来看,百度视觉都或多或少的有所涉及。

如此来看,也就不难理解,为什么百度能够如此高效解决高难度问题。

百度在此次疫情中的贡献,也真正的彰显了那句“能力越大,责任越大”,也体现了出了在计算机视觉领域中领军者的地位。

技术的背后,还有一个百度飞桨

无论是研究还是应用,背后都需要一个强有力的平台支撑。

而此次百度在人脸识别上的成功,离不开技术硬实力,更离不开技术背后的百度飞桨(PaddlePaddle)。

飞桨是百度自研,目前国内唯一开源开放且功能完备的产业级深度学习平台,是各类型AI模型应用开发的基础。

例如在解决戴口罩人脸识别问题时,就采用了飞桨的大规模分类库PLSC,快速对数百万ID的训练数据进行训练,还采用了飞桨模型压缩库PaddleSlim进行模型搜索与压缩,产出高性能的人脸识别模型,使用飞桨PaddleLite快速进行云端和移动端部署。

在此前北京地铁AI口罩检测方案中,百度飞桨利用自身储备的业界领先工具集,快速完成了多维度视频内容解析、视频语义理解、分类标签,及口罩识别等全套模型及部署,充分展现出飞桨源于产业实践、并致力于与产业深入融合的特点。

而百度也将基于口罩相关的能力做到了落地:

  • 与科升(广东)智能科技有限公司达成合作,对城中村门禁系统进行改造,租户利用前期入住时登记好的人脸开锁进门,同时该人脸数据库与公安大数据后台对接(直接对接公安数据库),对可疑人员及网上追逃人员进行预警。
  • 十牛科技将百度大脑发布的口罩检测与戴口罩人脸识别技术,更新至校园安全管理系统中,为学生复学做好万全准备。
  • 与无锡华捷电子信息技术有限公司达成合作,针对疫情全新开发的产品,无需摘下口罩,就可以精准识别人脸,实现乘车人秒速自动测温,有效降低了公共交通出行中接触感染风险。
  • 与广州智体科技有限公司达成合作,应用驾驶行为分析API极速研发并上线了出租车、公交车司乘人员“戴口罩智能识别预警模块”,实时上传异常数据到疫情监管、交通管理部门、公交/出租车公司后台,实现了多站点远程异地有效管控。

还包括深圳市赛蓝科技有限公司、深圳智荟物联技术有限公司、南京海帆数据科技有限公司等100余家试用企业,涉及零售线下门店无感刷脸购物、智慧社区刷脸门禁、企业员工刷脸考勤等场景。

此外,目前百度戴口罩识别相关基础能力已经通过飞桨Paddle Hub对外开源,避免让更多程序员重复造轮子,可以直接站在百度的肩膀上。

One More Thing

通过百度计算机视觉强悍的能力,已然解决了人群“是否戴口罩”、“戴口罩的人是谁”的问题。

安全、愉快地戴口罩上班已经不是难题。

那么更进一步的,戴口罩手机解锁、刷脸支付,还需要多久能解决呢?

传送门

飞桨(PaddlePaddle)官网:
https://www.paddlepaddle.org.cn/

PaddleSlim平台:
https://github.com/PaddlePaddle/PaddleSlim

Paddle PLSC大规模分类库:
https://github.com/PaddlePaddle/PLSC

PaddleLite平台:
https://github.com/PaddlePaddle/Paddle-Lite

PaddleHub平台:
https://github.com/PaddlePaddle/PaddleHub

— 完 —

疫情加速百度人脸识别变革:戴口罩也能准确识别,迅速上线相关推荐

  1. 楚留香ai人脸识别_戴口罩居然也能人脸识别?这些AI黑科技真的藏不住了.........

    当人工智能遇见影像技术,将会释放出多少意想不到的巨大能量? 「喔图·知图实验室」瞄准当下的影像痛点,持续发力升级AI黑科技,带来两大必杀技--人脸识别再度升级.AI智能旋转校正. 戴口罩也能识别--人 ...

  2. Pytorch实现戴口罩人脸检测和戴口罩识别(含训练代码 戴口罩人脸数据集)

    Pytorch实现戴口罩人脸检测和戴口罩识别(含训练代码 戴口罩人脸数据集) 目录 Pytorch实现戴口罩人脸检测和戴口罩识别(含训练代码 戴口罩人脸数据集) 1.戴口罩识别的方法 (1)基于多类别 ...

  3. 基于Python深度学习的人脸识别考勤(戴口罩、多人)

    该"基于深度识别的人脸识别线下课堂考勤"系统有"人脸识别考勤","考勤信息统计"等主要功能组成,其中戴口罩识别及多人识别均可成功实现.涉及& ...

  4. 京东AI:戴口罩人脸识别pytorch开源库

    项目介绍 该项目是JDAI开源的基于PyTorch的人脸识别工具箱,提供了一个包括目前主流backbone和head的的training module,一个标准化的人脸识别evaluation mod ...

  5. Android集成百度人脸识别(一)基础版SDK

    首先Android Studio版本:3.2.0 1.注册百度账号并企业认证 2.创建应用生成API Key和Secret Key 3.下载对应的SDK(下载SDK的时候需要新建授权) 因为下载的时候 ...

  6. 戴眼镜检测和识别2:Pytorch实现戴眼镜检测和识别(含戴眼镜数据集和训练代码)

    Pytorch实现戴眼镜检测和识别(含戴眼镜数据集和训练代码) 目录 Pytorch实现戴眼镜检测和识别(含戴眼镜数据集和训练代码) 1.戴眼镜检测和识别方法 2.戴眼镜数据集 (1)戴眼镜数据集说明 ...

  7. android百度人脸采集免费,Android 调用百度人脸采集

    1.访问集成文档 http://ai.baidu.com/docs#/FaceSDK-Collect-WithLiveness-Android/top 申请license,下载自动授权的sdk 2. ...

  8. 疫情加速人脸识别落地:多地试点AI门禁,居民刷脸核验健康码

    3月18日,国务院联防联控机制新闻发布会在北京举行.商务部消费促进司负责人王斌在会上提到,疫情之下,人工智能产业出现逆势发展. 从消毒机器人到CT影像诊断系统,疫情让一系列人工智能应用加速落地.南都记 ...

  9. 由火车站戴口罩人脸识别入站感想

    由火车站戴口罩人脸识别入站感想 个人经历 过完春节,去上班,疫情还很严重,火车站机器安检,需要摘下口罩刷身份证才可以安检成功,在摘下口罩的那一刻,慌得一批. 最近经历 最近又坐火车,还是机器安检,这时 ...

最新文章

  1. 青蛙捉昆虫的html游戏,幼儿园小班体育游戏教案《小青蛙捉害虫》
  2. 单片机课程设计电梯(c语言),单片机课程设计之电梯控制系统.docx
  3. K8S operator方式部署redis-cluster
  4. QT的QQmlContext类的使用
  5. linux下mysql安装
  6. 读入自然数m、n,判断m/n是有限小数还是循环小数
  7. 二级菜单打开一个时其他关闭_blender2.8教程 顶部菜单栏
  8. 机器学习之概念漂移-concept drift
  9. cmd无法运行python_为什么CMD无法运行python程序
  10. H - Going in Cycle!! (UVA - 11090)
  11. 微信运营:必须收藏的101条万能微信标题公式
  12. gsonformat安装
  13. 使用GRUB2制作U盘PE启动盘
  14. for循环与range方法
  15. 焦点损失函数 Focal Loss 与 GHM
  16. 数据仓库工作总结(觉得有点意思)
  17. PS 基础操作学习讲解帖列表
  18. Axure RP9基本用法总结
  19. 智能呼叫中心有哪几种类型?
  20. 2010年1月blog汇总:个人管理、OEA权限、企业架构

热门文章

  1. Gaussian Discriminative Analysis 高斯判别分析 GDA
  2. 太阳能“光热”盛宴冷思:前景可期但挑战犹存
  3. php 去除html反斜杠,PHP去掉反斜杠函数:stripslashes()
  4. C++ 函数声明后面的const用法
  5. python中input函数最简单详细的了解
  6. 【日本·北海道】云端上的浪…
  7. 自学网络安全方向要如何开始?
  8. 用goaccess对tomcat访问日志进行统计分析
  9. pyecharts 显示坐标轴线_实战PyQt5: 153-QChart图表之对数坐标轴
  10. LS-DYNA中加速度计的定义