转载请注明出处 https://blog.csdn.net/Fire_Light_/article/details/79588429

论文链接:Learning Face Representation from Scratch

这篇文章的亮点在于提出一种半自动的方法来收集网络上的人脸图像,最终组成了国内人脸识别届颇具盛名的人脸训练集 CASIA-WebFace,同时还提出了一种11层的CNN最终达到了lfw上的state-of-art。

##数据集的构建

构建数据集时,从网络上爬图像下来很容易,但是给图片逐一做标记却很难。因此作者借用了IMDb网站,通过半自动的方式完成了爬图像和标记。

(IMDb是一个电影、电视和名人内容的展示网站)

在IMDb,每个名人都有一个主页,类似

然后先把人的名字爬下来,再爬照片,每个人都有一个mainphoto与photo gallery。

下一个难题在于photo gallery中的一些照片中会出现很多的人。
也就是说要区分出现很多人的照片具体谁是谁,即检测到的人脸的聚类问题

用现有的人脸识别方法来提取特征然后聚类人脸是一种常用的方法,一般的聚类方法需要计算所有样本之间的相似矩阵,这个矩阵会很大,无法加载入内存,因此作者使用了一种更快的聚类方法:

1.通过人脸识别方法提取人脸特征;

2.使用每个名人的mainphoto作为它的种子(因为mainphoto一般都是正脸,而且不会出现其他人);

3.使用那些只有1个人脸的图片去增加每个名人的种子的数量;

4.在photo gallery剩下的图片中,通过与种子的相似度来找到属于每个名人的其余照片。

5.裁剪人脸,将同一个名人的脸单独存入一个路径内,之后再进行人工纠错,进一步提高数据集纯度。

最终得到了10,575人\494,414照片的数据集 CASIA-WebFace。

作者给出了一些常见的人脸数据集的统计数据以比较,可以看出 CASIA-WebFace是当时人脸数据集中数据量最大的公开数据集,为人脸识别技术的发展做出了很大贡献。

想要下载CASIA-WebFace可以去官网申请,但是好像挺难的,也可以通过我给的链接下载
官网地址:http://www.cbsr.ia.ac.cn/english/CASIA-WebFace-Database.html
下载地址:https://download.csdn.net/download/fire_light_/10291726

人脸识别网络

使用了Inception、VGG的网络构筑技巧,即更深的卷积层、低维度的特征表达、多种损失函数、与小的卷积核。

网络结构如下:

一些技巧的解读:

1.使用多个3x3的卷积核代替大卷积核
2.只使用一个全连接层,减少参数量
3.使用两种监督信号
可以看出作者在网络构筑上没有提出新的思想,而是借鉴了Inception以及DeepId网络的优秀结构。

测试结果:

其中与ABCDE对应的特征提取与验证算法如下:


DR表示在CASIA上训练的上述的卷积神经网络。

Webface--(CASIA-WebFace)相关推荐

  1. 人脸识别——脸部属性辅助(得分层)

    <A Face Recognition Signature Combining Patch-based Features with Soft Facial Attributes> 2018 ...

  2. 全景分割(Panoptic Segmentation)(CVPR 2019)

    全景分割(Panoptic Segmentation)(CVPR 2019) 摘要 1. 导言 2. 相关工作 3. 全景分割格式 4. 全景分割度量 4.1 片段匹配 4.2 PQ计算 4.3 与现 ...

  3. .net 数字转汉字_TensorFlow 2.0 中文手写字识别(汉字OCR)

    TensorFlow 2.0 中文手写字识别(汉字OCR) 在开始之前,必须要说明的是,本教程完全基于TensorFlow2.0 接口编写,请误与其他古老的教程混为一谈,本教程除了手把手教大家完成这个 ...

  4. 在Windows上调试TensorFlow 2.0 中文手写字识别(汉字OCR)

    在Windows上调试TensorFlow 2.0 中文手写字识别(汉字OCR) 一.环境的搭建 Windows+1080Ti+Cuda10.1 Tsorflow2.0.0 Numpy1.16.4 注 ...

  5. 初试linux编译(ubuntu+vim)+玩转智能蛇

    一.初试linux编译(ubuntu+vim) 步骤: ①下载vmware15+ubuntu桌面版映像 ②安装ubuntu ③下载vim+gcc 在ubuntu终端输入: sudo apt-get i ...

  6. 2021-2027年中国医联体(医疗联合体)建设深度调研及投资前景预测报告

    [报告类型]产业研究 [报告价格]4500起 [出版时间]即时更新(交付时间约3个工作日) [发布机构]智研瞻产业研究院 [报告格式]PDF版 本报告介绍了中国医联体(医疗联合体)行业市场行业相关概述 ...

  7. 2022-2028年中国EBA树脂(乙烯丙烯酸丁酯)产业竞争现状及发展前景规划报告

    [报告类型]产业研究 [报告价格]¥4500起 [出版时间]即时更新(交付时间约3个工作日) [发布机构]智研瞻产业研究院 [报告格式]PDF版 本报告介绍了中国EBA树脂(乙烯丙烯酸丁酯)行业市场行 ...

  8. 解决谷歌浏览器在非https下限制获取多媒体对象(音视频)的解决方式

    1.浏览器输入:chrome://flags/ 2.输入你要允许的域名地址或ip端口地址(如下图)

  9. 白化(预处理步骤)【转】

    白化(预处理步骤)[转] 介绍 我们已经了解了如何使用PCA降低数据维度.在一些算法中还需要一个与之相关的预处理步骤,这个预处理过程称为白化.举例来说,假设训练数据是图像,由于图像中相邻像素之间具有很 ...

  10. 全面理解Python中的类型提示(Type Hints)

    众所周知,Python 是动态类型语言,运行时不需要指定变量类型.这一点是不会改变的,但是2015年9月创始人 Guido van Rossum 在 Python 3.5 引入了一个类型系统,允许开发 ...

最新文章

  1. 设计模式-行为-Iterator(迭代器)模式
  2. [转] HDU 题目分类
  3. 有一个1,2,3....49 的数组,通过控制台显示为7行7列的,并且里面的数据时随机的代码...
  4. Angular 如何根据一个 class 的定义和数据,动态创建一个该类的实例
  5. 彻底搞懂 python 中文乱码问题_彻底搞懂 Python 编码 - sylan215的软件测试技术学习 - 51Testing软件测试网 51Testing软件测试网-软件测试人的精神家园...
  6. CSDN Chrome插件来啦,听说可以提升开发者效率,我们先来研究一波
  7. java2019 数据结构算法面试题_2019年JVM最新面试题,必须收藏它
  8. C++实现的队列queue
  9. android双缓冲绘图技术分析
  10. MySQL基础2——表的约束
  11. C++的隐式转换和explicit关键字
  12. 几款主流好用的markdown编辑器介绍
  13. MPUSH消息推送服务器搭建,MPUSH消息推送服務器搭建
  14. 王凯1987计算机系,王凯-专家人物-中国水网
  15. 世界上最早的手动计算机,世界上第一台电子计算机诞生于多少年,名字叫做什么...
  16. 计算机应用基础中专起大专,17秋中国医科大学《计算机应用基础(中专起点大专)》在线作业标准100分答案...
  17. Longhorn,企业级云原生容器分布式存储 - 高可用
  18. Jetson TX2 刷机教程(JetPack4.2版本)
  19. 软件包 jdk1.8-2000:1.8.0_281-fcs.aarch64 是针对 different 构架的
  20. tc_net_secu 使用手册

热门文章

  1. 计算机专业术语及其解释,计算机专业术语解释
  2. 计算机汇编语言教程pdf,计算机汇编语言入门.pdf
  3. 5分钟搭建好ElasticSearch开发环境
  4. 老机焕发青春 之硬盘篇
  5. 阿里云网站备案注销新规则
  6. 计算机二级java判卷标准_计算机二级考试的有什么衡量的评分标准?
  7. cmd 定时关机 命令
  8. 全民k歌下载|全民k歌app下载
  9. ADSP重点习题第二章-第三章(原版书第四章)
  10. X-editable快速编辑table表单,input,select等