&Title

ECCV2018 、 baidu

  • PyramidBox :A Context-assisted Single Shot Face Detector
  • 【论文翻译】:PyramidBox: A Context-assisted Single Shot Face Detector

&Problem statement:

基于 anchor 的检测框架致力于在不受控制的环境里检测有难度的面部。

  • SSH 和 S3FD开发了尺度不变网络在单个网络的不同层中检测不同尺度的面部。
  • Face R-FCN 对分数映射上的特征响应重新加权,并且通过位置敏感的平均池化消除了每个面部区域中的不均匀分布的影响。
  • FAN 提出了一个 anchor 级的关注机制,通过高亮面部区域的特征来检测被遮挡的面部。

这些工作给出了设计 anchor 和相关网络来检测不同尺度人脸的有效方式,但是没有重点关注环境信息。然而环境信息在检测难度大的人脸时非常重要。实际上在现实世界中,人脸从不单独出现,而是一般和肩膀或者身体一起,提供了丰富的可利用的环境关联,尤其是面部纹理由于低分辨率,模糊或者遮挡不能被辨别时。

&Methods:

论文提出了一个新的环境辅助的网络框架,充分利用了环境信号,步骤如下:
第一,网络不仅能学习面部特征,还能学习环境特征例如头部和身体。实现这个目标需要额外的标签,需要设计和这些部分匹配的 anchor。本文用半监督的方案来生成环境部分的近似的标签,构造一系列叫做 PyramidAnchors 的 anchors。PyramidAnchors 可以很容易地添加到一般的基于 anchor 的结构中。
第二,高层次的环境特征应该和低层级的充分结合。检测难度高和低的面部的外观非常不同,意味着不是所有高层级的语义特征都对检测小目标有利。作者研究特征金字塔网络 (FPN) 的性能,并把它改成了低层级的特征金字塔网络 (LFPN),以结合相互有益的特征。
第三,预测分支网络应该充分利用结合了的特征。作者采用环境敏感预测模块 (CPM) 用一个广而深的网络来吸收目标人脸周围的环境信息。同时,为预测模块引入了一个 max-in-out 层进一步提高分类网络的能力。
最后,作者提出了一种训练策略,叫做 data-anchor-sampling,来调整训练集的分布。为了学习更有代表性的特征,困难样本的多样性非常重要,可以通过交叉样本的数据增强实现。

PyramidAnchors

对于每一个目标人脸,PyramidAnchors 生成一系列 anchors,这些 anchors 对应着与人脸相关的更大的区域,包含了更多环境信息,比如头部、肩膀和身体。我们通过匹配区域大小和 anchor 大小来选择设置 anchors 的层,这将会监督更高层级的层为低层级尺寸的人脸学习更有表现力的特征。加上头部、肩膀和身体的额外标签,我们可以准确地匹配 anchors 和 ground truth 来生成损失。但是由于增加额外的标签不公平,我们通过半监督的方式实现,假定不同人脸有着相同比率和偏移的区域的环境特征也相似。换句话说,我们可以用一些统一的box来近似头部、肩膀和身体的实际区域,只要这些box的特征在不同人脸上相似。
例如,尺寸为 128 的最大的紫色人脸在 P3, P4, P5 有 pyramid-anchors,其中 P3是由 conv_fc7 生成的通过人脸本身标注的,P4 P是由 conv6_2 生成的根据目标人脸的头部 (尺寸为256) 标注的,P5是由 conv7_2 生成的通过目标人脸的身体 (尺寸为512) 标注的。类似的,为了检测尺寸为 16 的最小的蓝绿色人脸,你可以从 pyramid-anchors 得到监督的特征,其中 P0 上的 pyramid-anchors 是通过原始人脸标注的,P1上的是通过对应的尺寸为 32 的头部标注的,P2 的是通过对应的尺寸为 64 的身体标注的。

低层级特征金字塔(LFPN):

DAS(data-anchor-sampling,数据锚采样):

随机在样本中选择一个尺寸为Sface的人脸,然后在覆盖该人脸的anchors中找一个人脸尺度最接近的anchor,根据放缩比例,缩小原始图片,然后再裁剪大小为640*640的子图片(含有之前的人脸),由此得到新图片。
data-anchor-sampling 改变了训练数据的分布:1) 较小的人脸的比例高于较大的人脸。2)通过较大的人脸生成较小的人脸,提高了样本在小尺度上的多样性。

contest-sensitive:(待补充)

受 Inception-ResNet 启发,设计预测模块来既=获得网络变宽的收益又获得网络变深的收益。在这个模块中,我们用 DSSD 中的残差预测模块替换了 SSH 中的环境模块的卷积层。这让我们的 CPM 既具备 DSSD 模块方法的所有优势,又从 SSH 环境模块中保留了丰富的环境信息。

&conclusion

提出了一个新的环境辅助的单步人脸检测器 PyramidBox,来解决检测不受约束的人脸的问题。我们设计了一个新的环境 anchor,叫做 PyramidAnchor,来监督人脸检测器从面部周围的环境学习特征。此外,我们把特征金字塔网络修改成了低层级的特征金字塔网络,将高层级特征和高分辨率特征结合起来,有利于检测较小的人脸。我们还提出了一个更宽更深的预测模块以充分利用结合了的特征。除此之外,我们采用了 Data-anchor-sampling 来增强训练数据,提高训练数据在较小的人脸上的多样性。实验证明 PyramidBox 在常用的人脸检测基准上达到了顶尖的水平,尤其对于难于检测的人脸。

&Contribution:

  • 提出了一种基于anchor的环境辅助方法,即PyramidAnchors,从而引入 有监督的信息来为较小的、模糊的和部分遮挡的人脸学习环境特征。
  • 设计了低层级特征金字塔网络(LFPN)来更好地融合环境和面部特征。同时,该方法可以在单步中较好的处理不同尺度的人脸。
  • 提出了一种环境敏感的预测模型(contest-sensitive),该模型由混合网络结构和max-in-out层组成,从融合的特征中学习准确的定位和分类
  • 提出了一种关注尺度的data-anchor-sampling策略,改变训练样本的分布,重新关注较小的人脸。
  • 在通用的人脸检测基准FDDB和WIDER FACE上,达到了当前的最佳水平

&推荐

  • 对PyramidBox的理解

【论文笔记】:PyramidBox :A Context-assisted Single Shot Face Detector相关推荐

  1. PyramidBox:A Context-assisted Single Shot Face Detector(论文阅读笔记)

    论文:PyramidBox: A Context-assisted Single Shot Face Detector 原文链接:https://arxiv.org/abs/1803.07737?co ...

  2. 阅读笔记:Single Shot Multibox Detector(SSD)

    --为什么会阅读这篇论文?原因很简单:SSD比Faster R-CNN准.比YOLO快. --论文出处: UNC Chapel Hill(北卡罗来纳大学教堂山分校) 的 Wei Liu 新作 --论文 ...

  3. 【论文翻译】:PyramidBox: A Context-assisted Single Shot Face Detector

    引言 PyramidBox: A Context-assisted Single Shot Face Detector 摘要 人脸检测研究了很多年,剩下的挑战是之一是在不受控制的环境下检测小的,模糊的 ...

  4. ssd网络结构_封藏的SSD(Single Shot MultiBox Detector)笔记

    关注oldpan博客,侃侃而谈人工智能深度酝酿优质原创文! 阅读本文需要xx分钟 ? 前言 本文用于记录学习SSD目标检测的过程,并且总结一些精华知识点. 为什么要学习SSD,是因为SSD和YOLO一 ...

  5. SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)

    本文转载自: http://www.cnblogs.com/lillylin/p/6207292.html SSD论文阅读(Wei Liu--[ECCV2016]SSD Single Shot Mul ...

  6. SSD(Single shot multibox detector)目标检测模型架构和设计细节分析

    先给出论文链接:SSD: Single Shot MultiBox Detector 本文将对SSD中一些难以理解的细节做仔细分析,包括了default box和ground truth的结合,def ...

  7. 深度学习之 SSD(Single Shot MultiBox Detector)

    目标检测近年来已经取得了很重要的进展,主流的算法主要分为两个类型: (1)two-stage方法,如R-CNN系算法,其主要思路是先通过启发式方法(selective search)或者CNN网络(R ...

  8. SSD( Single Shot MultiBox Detector)关键源码解析

    SSD(SSD: Single Shot MultiBox Detector)是采用单个深度神经网络模型实现目标检测和识别的方法.如图0-1所示,该方法是综合了Faster R-CNN的anchor ...

  9. python ssd目标检测_解读目标检测之SSD:Single Shot MultiBox Detector

    注:md文件,Typora书写,md兼容程度github=CSDN>知乎,若有不兼容处麻烦移步其他平台,github文档供下载. 发表在CSDN:https://blog.csdn.net/ha ...

最新文章

  1. 技术总监,被判刑12年!因公司未兑现股权,愤怒植入代码,牟利333万
  2. 2018.11月Android优质开源项目
  3. 转】阿里哈尔滨2014笔试题及【原创】答案
  4. 央视在世界杯高清直播中占了C位 它是怎么做到的?
  5. 网络仿真中数据生成相关
  6. 训练日志 2018.9.1
  7. Linux io运行情况,Linux IO调度层分析
  8. centos安装python3.8与pip
  9. Perceptual Losses for Real-Time Style Transfer and Super-Resolution
  10. 程序员梗_那些程序员才懂的梗,看到第10张笑喷了,网友:太真实了
  11. 微信小程序卡券java_微信小程序领取卡券(java)
  12. android for armeabi,【我的Android进阶之旅】解决错误ABIs [armeabi] are not supported for platform....
  13. bat脚本重启IIS中的网站
  14. ios android 逆向 对比,iOS逆向开发--APP重签名
  15. CSDI2018广州关于《Nginx》的分享(附文字速录与PPT)
  16. java实现多图片打包下载(附前后端代码)
  17. Python操作表格
  18. 神经机器翻译的前世今生--转自散文网
  19. MessageSource简介
  20. 安利一个超牛的资源网站,国庆看片就用它了

热门文章

  1. 判断当前是移动端还是PC端 判断是微信浏览器还是非微信浏览器
  2. hex文件详解及常用合并方法介绍
  3. 如何成为一位Unity3D游戏开发者:对游戏开发抱有热情
  4. Deep Supervision:深度监督(2014)+DHM
  5. 普通最小二乘法( Ordinary Least Square,OLS)
  6. Uniapp苹果登录
  7. egg项目服务器部署,egg部署到服务器
  8. 【Python卸载】与Windows上【Anaconda安装】
  9. 管理学中的 Expectancy Theory - 期望理论
  10. 解决VMware内存占用过高问题