动机
目前的人脸识别方法主要针对正脸,对于不同视角无正脸有遮挡的效果不好,人类可以由细微的区别如发型,衣服,眼镜,姿态及其他信息判断。

在非限制条件下识别人身份信息,建立了一个People in Potho Album(PIPA)数据库,包含约60 000个样本约2000个个体。数据库中只有一半的人具有正脸,提出来姿态不变的人像检测方法(PIPER),该方法使用了CNN对poselet训练消除姿态影响,结合一个人脸识别方法(Deepface)和一个全身识别器提升精度。

方法
PIPER,使用poselet作为part模型,对每个poselet训练一个分类器,poselet是检测常见姿态模式的分类器,正脸检测是poselet的一种形式,下图显示了文章top4 poselet。

每个poselet都不是一个强识别器,通过组合识别结果累积每个part的细微信息,可以得到一个姿态无关的人像身份认证系统。

PIPER
包含三个组成部分:
1.一个全局分类器,CNN对全身训练
2.107个poselet分类器,CNN训练
3.SVM训练 DeepFace的256d特征

身份识别是上述分类器的预测概率线性组合:
s(X,y)=∑iwiPi(y|X)s(X,y)=\sum_iw_iP_i(y|X)
Pi(y|X)P_i(y|X)是给定i个part特征X的label是y的归一化概率,最终的身份预测是
y∗(X)=argmaxys(X,y)y^*(X)=argmax_y s(X,y)

训练过程的详细描述:
1.在数据库上运行poselet,将poselet预测的结果与ground truth匹配。
2.使用1的poselet块,每个poselet训练一个CNN,识别身份。另外,CNN训练一个全身的分类器。网络结果是Krizhevsky的,微调身份识别任务。
3.验证数据分为两半,忽略fc8层,SVM使用fc7层特征在第一半验证数据训练,之后第二半数据计算Pi(y|X)P_i(y|X)
4.使用验证数据所有part的身份预测估计wiw_i
5.测试数据分成两半,SVM和fc7在前一半训练,预测后一半Pi(y|X)P_i(y|X)
6.使用测试数据的Pi(y|X)P_i(y|X)及wiw_i计算s(X,y)s(X,y)

计算part激活
运行poselet,返回人像的bbox,有得分和poselet激活的位置。使用双向图匹配算法匹配groundtruth及poselet的结果。返回具有最大得分和最大overlap的匹配。输出poselet激活和groundtruth实例。

训练part分类器Pi(y|X)P_i(y|X)
1.全局分类器P0(y|X)P_0(y|X)
全身区域fc7层,使用SVM训练预测身份y。
2.part-级SVM分类器Pi(y|X)P_i(y|X)
给定part i的fc7层特征X和label y,训练多类SVM,输出得分的softmax表示为P^i(y|X)\hat P_i(y|X)
P^i\hat P_i稀疏特性表现在以下两方面:
1.每个poselet仅在表现出对应poslet特定姿态的样本上激活。
2.不是所有的个体都包含所有的poselet,每个poselet-层SVM只在所有个体的子集FiF_i上训练

稀疏填充
使用全局模型P0P_0的概率分布解决稀疏问题:

公式图形化表示如下所示:

计算part权值wiw_i
使用验证集计算w,将验证集分为两部分,在一个子集上训练part-based SVM,在第二个子集所有实例上计算Pi(y|X)P_i(y|X),Pji(y|X)P_i^j(y|X)表示第j个实例part i的label为y的概率。每个实例j和label y构成一个样本进行二值分类,如果有K个parts,特征向量为K维:[Pj0(y|X),Pj1(y|X),...,Pjk(y|X)][P_0^j(y|X),P_1^j(y|X),...,P_k^j(y|X)],如果j的label是y则二值分类结果为1。

论文提要“Beyond Frontal Faces: Improving Person Recognition Using Multiple Cues”相关推荐

  1. 【论文笔记】Beyond frontal faces: improving person recognition using multiple cues

    来自UC Berkeley & Facebook AI Research在CVPR2015上发表的文章. 这篇文章的亮点在于所建的"人体"识别数据库是一个真正意义上的unc ...

  2. [转]无需看到你的脸就能认出你——实现Beyond Frontal Faces: Improving Person Recognition Using Multiple Cues...

    转自:http://www.cnblogs.com/sciencefans/p/4764395.html 转载于:https://www.cnblogs.com/wing-xiong/p/505650 ...

  3. 深度学习论文: MicroNet: Improving Image Recognition with Extremely Low FLOPs及其PyTorch实现

    深度学习论文: MicroNet: Improving Image Recognition with Extremely Low FLOPs及其PyTorch实现 MicroNet: Improvin ...

  4. Improving speech recognition by revising gated recurrent units

    Improving speech recognition by revising gated recurrent units   通过修改门控循环单元改善语音识别. 一般的 GRU 架构 本论文提出的 ...

  5. 论文笔记 《Selective Search for Object Recognition》

    论文笔记 <Selective Search for Object Recognition> 项目网址:http://koen.me/research/selectivesearch/ 一 ...

  6. 【论文笔记】SlowFast Networks for Video Recognition

    目录 1,摘要 2,介绍 3. SlowFast 网络 3.1 Slow路径 3.2 Fast 路径 3.3 横向连接 3.4 网络实现 参考文献 参考 1,摘要 本论文提出了用于视频识别的SlowF ...

  7. 论文翻译[Deep Residual Learning for Image Recognition]

    论文来源:Deep Residual Learning for Image Recognition [翻译人]:BDML@CQUT实验室 Deep Residual Learning for Imag ...

  8. 【论文笔记】Rethinking and Improving Relative Position Encoding for Vision Transformer

    论文 论文题目:Rethinking and Improving Relative Position Encoding for Vision Transformer 接收:ICCV 2021 论文地址 ...

  9. 【论文翻译】OpenFace: A general-purpose face recognition library with mobile applications

    [翻译时间]2018.09.14 [完成时间]2018.09.15 [论文翻译]OpenFace: A general-purpose face recognition library with mo ...

最新文章

  1. NLP汉语自然语言处理原理与实践
  2. 鸟哥linux群,【鸟哥的linux私房菜-学习笔记】linux的帐号与群组
  3. Python-OpenCV基本操作cv2
  4. 边缘计算和网络切片,为何成为5G的“技术网红”
  5. 高等数学超入门学习笔记
  6. Photoshop CS3 ICO 图标保存插件
  7. PyTorch搜索Tensor指定维度的前K大个(K小个)元素--------(torch.topk)命令参数详解及举例
  8. 将三角形绕点b顺时针旋转90度_模型 | 图形旋转与翻折题型汇编
  9. On intelligence by Jeff Hawkins
  10. 基于DLNA实现投屏的思路梳理
  11. Word中插入MATLAB矢量图
  12. 去商场淘打折商品时,计算打折以后的价钱是件颇费脑子的事情。例如原价 ¥988,标明打 7 折,则折扣价应该是 ¥988 x 70% = ¥691.60。本题就请你写个程序替客户计算折扣价。
  13. 2022年11月网络工程师考试知识点分布
  14. ubuntu16.04+七彩虹GTX1060的NVIDIA驱动+Cuda8.0+cudnn5.1+tensorflow+keras搭建深度学习环境【学习笔记】【原创】
  15. Craps 赌博游戏 含押注
  16. 笔记本电脑远程另一台电脑(无网络)
  17. 电脑重装系统UEFI启动如何设置
  18. iOS常见问题笔记总结这是本人开发中遇见的一些常见问题处理方法的总结笔记,包括http访问配置、Alcatraz插件安装、最新cocoapod安装、真机运行出错等许多与参考笔记总结,希望对大家有所帮助
  19. 辗转相除法的时间复杂度
  20. 脱壳--02.exe

热门文章

  1. JAVA学习日记每天进步一点点之集合类
  2. 视频格式不符合怎么办?怎样进行视频格式转换?
  3. Django REST framework+Vue 打造生鲜超市(二)
  4. Opencv调整运行窗口图片的大小
  5. 博士毕业选择回老家县城大专任教,事业编、副教授待遇、外加几十万安家费......
  6. Systemtap学习笔记
  7. 利用R语言制作GGEBiplot-双标图教程
  8. pycharm使用记录
  9. JS:简单的页面广告制作(右下角广告可自动消失)
  10. 专业python培训报价多少