来自:CVPR 2014   作者:Yi Sun ,Xiaogang Wang,Xiaoao Tang

题目:Deep Learning Face Representation from Predicting 10,000 Classes

主要内容:通过深度学习来进行图像高级特征表示(DeepID),进而进行人脸的分类。

优点:在人脸验证上面做,可以很好的扩展到其他的应用,并且夸数据库有效性;在数据库中的类别越多时,其泛化能力越强,特征比较少,不像其他特征好几K甚至上M,好的泛化能力+不过拟合于小的子训练集。

主要过程:采用卷积神经网络(CNN)方法,并且采用CNN最后一层的激活值输出作为features,不同的人脸区域放入CNN中提取特征,形成了互补、过完全的特征表示。(form complementary and over-complete representations)。

通过深度卷积网络来学习高级的过完全特征(有监督),CNN的最后一层激活值作为输出,

具体细节:

采用3个尺度,10个人脸region,60个patch,训练60个CNN网络,每个提取两个160维的特征(两个是因为: extracts two 160-dimensional DeepID vectors from a particular patch and its horizontally flipped counterpart.),所以最后一张人脸图像的特征的维度是:160*2*60=19200维。

CNN的结构如下:

说明:共5层网络,越往上的神经元的个数就越少,到最后就剩下160个神经元的输出,上面的Face patches 是进过对齐过后的的人脸块,也就是说已左(右)眼为中心的人脸区域块,嘴角为中心的人脸区域块等等,这样就有多个不同的输入块输入到CNN中,文章采用了把倒数第二层的输出+倒数第一层的输出作为特征(这应该是采用12年的Le Cun 那篇文章的track)。最后再把不同的块所输出的特征连接起来,就形成了一个最终一张人脸的特征。然后再用各种分类器对其特征进行分类。

采用Max-Pooling,softmax;

输入图像:39*31*k 个人矩形脸图像块+31*31*k  (这里k在彩色图像时为3,灰度时k为1)个人脸正方形块(因为后面要考虑到是全局图像还是局部图像,且需要考虑到尺度问题),使用ReLU非线性处理;

注意到【Weights in higher convolutional layers of our ConvNets are locally shared to learn different mid- or high-level features in different regions [18]. r in Equation 1  indicates a local region where weights are shared. In the third convolutional layer, weights are locally shared in every 2 2 regions, while weights in the fourth convolutional layer are totally unshared.】

不同的输入图像:

其中局部图像是关键点(每个图像一个关键点)居中,不同的区域大小和不同的尺度图像输入到CNN中,其CNN的结构可能会不相同,但是最后的特征的都是160维度,最后将所有的特征级联起来。

最后一层的特征是第三层和第四层全相连(比较特殊的地方),因为这样可以加入尺度特征,因为第三层和第四层学习到的特征的尺度是不一样的。

特点:提取的特征很Compact,只有160*k,k不大。自然就具有判别力了。

在训练CNN中,训练数据的类别越多,其性能越好,但是会在训练模型中出现问题,也就是太慢。

CNN的输出是特征,而不是输出类别,

分类

采用Joint Bayesian 来进行人脸的verification;也采用了神经网络来比较,但是联合贝叶斯的效果比较好;

实验

因为在LFW中大部分人的图像个数是有限的,很多人只有一张图片;所以采用了新的数据库来训练模型:CelebFaces :八万多幅,五千多人,每个人差不多16张图片,

===============

方法比较:

当前的人脸识别方法:过完全的低级别特征+浅层模型。

ConvNet 能够有效地提取高级视觉特征。

已有的DL方法:

1. Huang【CVPR2012】的生成模型+非监督;

2. Cai 【2012】的深度非线性度量学习;

3 Sun【CVPR2013】的监督学习+二类分类(人脸校验 verfication),是作者去年写的。而这一篇文章是多类分类问题(identification),而且这篇文章中,有10000类的人脸类别。

================

结果:在有对齐人脸的情况下,能够在LFW数据库上识别率达到97.5%。(其训练数据不是LFW,有其他的训练数据来训练模型)。



版权声明:本文为博主原创文章,未经博主允许不得转载。

【论文笔记】Deep Learning Face Representation from Predicting 10,000 Classes相关推荐

  1. 深度学习论文笔记-Deep Learning Face Representation from Predicting 10,000 Classes

    来自:CVPR 2014   作者:Yi Sun ,Xiaogang Wang,Xiaoao Tang 题目:Deep Learning Face Representation from Predic ...

  2. 【读点论文】Deep Learning Face Representation from Predicting 10,000 Classes。deepID

    Deep Learning Face Representation from Predicting 10,000 Classes 此文发表于2014年CVPR上,以人脸识别的子领域人脸验证(Face ...

  3. 人脸识别 论文阅读 (3)- DeeplD1:Deep Learning Face Representation from Predicting 10,000 Classes]

    理解参考:张雨石博客 DeepID1 (Linkface 孙祎) 文章目录 DeepID1 @[TOC](文章目录) 前言 一.pandas是什么? 二.使用步骤 1.引入库 2.读入数据 总结 为什 ...

  4. DeeoID:Deep learning face representation from predicting 10,000 classes

    参考文献:<DeeoID:Deep learning face representation from predicting 10,000 classes> 1 Effective way ...

  5. (DeepID)Deep Learning Face Representation from Predicting 10,000 Classes

    https://www.researchgate.net/publication/283749931_Deep_Learning_Face_Representation_from_Predicting ...

  6. 【读点论文】Deep Learning Face Representation by Joint Identification-Verification,深度学习应用在优化问题上,deepid2

    Deep Learning Face Representation by Joint Identification-Verification 人脸识别的关键挑战是开发有效的特征表示,以减少个体内的差异 ...

  7. AI医药论文笔记--Deep learning improves prediction of drug–drug and drug–food interactions

    深度学习用于提高对药物-药物相互作用和药物-食物相互作用的预测 论文题目 Deep learning improves prediction of drug–drug and drug–food in ...

  8. 【论文笔记】Learning Synergies between Pushing and Grasping with Self-supervised Deep Reinforcement Learn

    文章目录 [论文笔记] Learning Synergies between Pushing and Grasping with Self-supervised Deep Reinforcement ...

  9. Deep Learning Face Representation by Joint Identification-Verification

     Deep Learning Face Representation by Joint Identification-Verification 转载请注明:http://blog.csdn.net ...

  10. [论文翻译] Deep Learning

    [论文翻译] Deep Learning 论文题目:Deep Learning 论文来源:Deep learning Nature 2015 翻译人:BDML@CQUT实验室 Deep learnin ...

最新文章

  1. 在windows下如何快速搭建web.py开发框架
  2. Android Studio 第六十五期 - Android业务组件库
  3. [深入学习C#]匿名函数、委托和Lambda表达式
  4. c语言迷宫问题输出坐标,C语言数据结构之迷宫求解问题
  5. 一加Ace外观设计理念揭晓:主推硬朗直线条力量感/速度感十足
  6. 关于 stl的内存分配的深浅拷贝
  7. 计算机网络—局域网的基本概念和体系结构
  8. Xcode 真机 iPhone is not available 及 is busy 解决
  9. 智能门锁服务器,【胖猴小玩闹】智能门锁与网关:海康萤石智能门锁的网关分析(三)...
  10. C# 将图片转成字符画
  11. 数据分析之航空公司客户价值分析
  12. 给初学者:用VB写外挂 ———— 实战一:动手写一个红色警戒金钱锁定工具
  13. dvsdk_4_00_00_22_dm3730 Makefile内容
  14. linux服务器实训心得体会,linux实训心得体会
  15. 【单片机】时钟及温度的显示
  16. unity人物刚体移动_教程篇 | Unity人物移动动画
  17. 来玩二分查找[NO.1]
  18. 程序写到无力吐槽 来点冷笑话
  19. java雪人程序_JAVA雪人小程序
  20. 数据库修改update更新指定字段或者所有字段

热门文章

  1. 【OpenCV】立体匹配算法SSD、NCC、ASW的基础实现
  2. LINK : fatal error LNK1104: 无法打开文件“ucrtd.lib”
  3. 【LDAP】LDAP常用命令解析
  4. 5月第四周.COM域名增7.3万居首 域名.XXX净减22个
  5. 英语翻译:英汉翻译时的对应问题
  6. 十大因素——造就优秀的董事长
  7. Ajax异步请求阻塞情况的解决办法(asp.net MVC Session锁的问题)
  8. 汽车智力游戏-汽车游戏大全
  9. CSS 相对定位与绝对定位
  10. 机器学习中的数学系列