LFW (5749 ids/13233 images/6K pairs)

5749个ID,13233张不同姿态、表情的图片,提供的人脸图片均来源于生活中的自然场景
LFW数据集主要测试人脸识别的准确率,该数据库从中随机选择了6000对人脸组成了人脸辨识图片对,其中3000对属于同一个人2张人脸照片,3000对属于不同的人每人1张人脸照片。测试过程LFW给出一对照片,询问测试中的系统两张照片是不是同一个人,系统给出“是”或“否”的答案。

通过6000对人脸测试结果的系统答案与真实答案的比值可以得到人脸识别准确率。
LFW数据集(Labeled Faces in the Wild)是目前用得最多的人脸图像数据库。该数据库共13,233幅图像,其中有5749个人,其中1680人有两幅及以上的图像,4069人只有一幅图像。图像为250*250大小的JPEG格式。绝大多数为彩色图,少数为灰度图。该数据库采集的是自然条件下人脸图片,目的是提高自然条件下人脸识别的精度。其测试集是给定的,并且是固定的。
该数据集有6种评价标准,如下所示:

  1. Unsupervised;

  2. Image-restricted with no outside data;

  3. Unrestricted with no outside data;

  4. Image-restricted with label-free outside data;

  5. Unrestricted with label-free outside data;

  6. Unrestricted with labeled outside data。

目前,人工在该数据集上的准确率在0.95左右。在该数据集的第六种评价标准下(无限制,可以使用外部标注的数据),许多方法已经赶上(超过)人工识别精度,比如face++,
DeepID系列,FaceNet, YouTu Lab Tencent等。

链接:https://pan.baidu.com/s/1luaGzC8h4cT6l-JIhTU9sQ 密码:3f2r

FDDB

FDDB是全世界最具权威的人脸检测评测平台之一,包含2845张图片,共有5171个人脸作为测试集。测试集范围包括:不同姿势、不同分辨率、旋转和遮挡等图片,同时包括灰度图和彩色图,标准的人脸标注区域为椭圆形。图片来源为美联社和路透社新闻报道图片,并删除了重复图片。

MegaFace (672K ids/4.7M images)

672K人的4.7M张图片
MegaFace数据集是最大的可公开使用的面部识别数据集,具有一百万个面部及其各自的边界框。
MegaFace数据集包含一百万张图片,代表690000个独特的人。所有数据都是华盛顿大学从Flickr(雅虎旗下图片分享网站)组织收集的。这是第一个在一百万规模级别的面部识别算法测试基准。
现有脸部识别系统仍难以准确识别超过百万的数据量。这个项目旨在研究当数据库规模提升数个量级时,现有的脸部识别系统能否维持可靠的准确率。
http://megaface.cs.washington.edu/dataset/download.html

链接:https://pan.baidu.com/s/10DlqPLoghYoVieoaNS2zkQ 密码:fmsu

Wider Face

Wider Face是香港中文大学的一个提供更广泛人脸数据的人脸检测基准数据集。它包含32203个图像和393703个人脸图像,在尺度,姿势,闭塞,表达,装扮,光照等方面表现出了大的变化。WIDER
FACE是基于61个事件类别组织的,对于每一个事件类别,选取其中的40%作为训练集,10%用于交叉验证(cross
validation),50%作为测试集。和PASCAL
VOC数据集一样,该数据集也采用相同的指标。和MALF和Caltech数据集一样,对于测试图像并没有提供相应的背景边界框。

MS_celeb_1M

100K人的共100M图片,来自搜索引擎。这个数据集非常大,没有清洗过,噪声很大,很难。

VGG2 (9K ids/3.31M images)

VGGFace2 是一个大规模人脸识别数据,包含331万图片,9131个ID,平均图片个数为362.6。
该数据集是从谷歌中下载的,包含不同姿态、年龄、光照和背景的人脸图片,其中约有59.7%的男性。
除了身份信息之外,数据集还包括人脸框,5个关键点、以及估计的年龄和姿态。

CASIA_WebFace(10K ids/0.5M images)

CASIA WebFace Dataset 是一个大规模人脸数据集,主要用于身份鉴定和人脸识别,从IMBb网站上搜集来的

2014年李子青实验室公开的人脸识别数据集,数据集收集自网络人脸图片,包含10575个人494414张图像

CelebA (10K ids/0.2M images)

CelebA是CelebFaces Attribute的缩写,意即名人人脸属性数据集
其包含10,177个名人身份的202,599张人脸图片,每张图片都做好了特征标记,包含人脸bbox标注框、5个人脸特征点坐标以及40个属性标记
CelebA由香港中文大学开放提供,广泛用于人脸相关的计算机视觉训练任务,可用于人脸属性标识训练、人脸检测训练以及landmark标记等
官方网址:http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html

UMDFace (8K ids/0.37M images)

该数据集包含367920张人脸,分别类属于8501个事件类别。
提供的人脸信息包括,人脸框,人脸姿势,(yaw,pitch,roll),21个关键点,性别信息等。
由于图片尺度,方向等的问题,使得该数据集不适合做人脸检测的训练,适合做人脸识别。

MS1M-IBUG (85K ids/3.8M images)

原数据集:MS-Celeb-1M
100K人的共100M图片,来自搜索引擎。这个数据集非常大,没有清洗过,噪声很大,很难。
iBUG清洗过的数据集,85K ids,3.8M图片

MS1M-ArcFace (85K ids/5.8M images)

原数据集:MS-Celeb-1M
ArcFace清洗过的数据集,85K ids,5.8M图片

Asian-Celeb (94K ids/2.8M images)

亚洲名人数据集 9.4万ID,280万张图片

DeepGlint (181K ids/6.75M images)

由两部分人脸数据组成
http://trillionpairs.deepglint.com/overview

1.原数据集:MS-Celeb-1M
由DeepGlint格林深瞳公司清洗的86,876个ids / 3,923,399个对齐图像。
2.原数据集:Asian-Celeb
由DeepGlint格林深瞳公司清洗的93,979个ids / 2,830,146个对齐图像。

合并后数据集:ids:86876+93979=181K, 图片数量:3923399+2830146=6.75M

IMDB-Face (59K ids/1.7M images)

IMDb-Face是用于人脸识别研究的新的大规模噪声控制数据集。
该数据集包含约170万张面孔,5万9千个身份
所有图像均从IMDb网站获得

Celeb500k (500K ids/50M images)

名人数据集包含50万人的5千万图片

人脸识别验证数据集

CFP-FP (500 ids/7K images/7K pairs)

这个数据集由500个identity的约共7000张图片组成,这个数据集的特别之处在于对于每个人,它有10张正面图像和4张侧面图像,对于想要做侧脸识别的同学还是很有帮助的

AgeDB-30 (570 ids/12,240 images/6K pairs)

AgeDB(Age Database )包含6000对 共440个ID,12240张不同姿态、表情、年龄、性别的图片。
同一个ID中,最大最小年龄差分别为3岁和101岁,所有ID的平均年龄为49岁。
根据不同的年龄差把所有数据划分为4个年龄段(年龄差5岁、10岁、20岁以及30岁)。其中每个年龄段的数据包括300对正样本、300对负样本。
此处验证集使用年龄差为30的数据,命名为agedb30。

CALFW (5749 ids/13233 images/6K pairs)

基于LFW数据集标注的跨年龄数据集,Cross-Age LFW (CALFW) database
http://www.whdeng.cn/CALFW/index.html?reload=true

CPLFW (5749 ids/13233 images/6K pairs)

基于LFW数据集标注的跨姿态数据集,Cross-Pose LFW (CPLFW) Database

http://www.whdeng.cn/CPLFW/index.html?reload=true

IJB (IJB-B, IJB-C)

IJB-A 全称为 IARPA Janus Benchmark-A face challenge, 由 NIST(National Institute of Standards and Technology)所提出,
该竞赛所提供的数据集包含 500 个对象的 5712 张静态人脸图像和 2085 个人脸视频帧。

IJB-B 由 IJB-A 迭代而来,
该竞赛所提供的数据集包含 1845 个对象的 11754 张人脸图像, 55026 个视频帧,7011 个视频,10044 张非人脸图像。

IJB-C 由 IJB-B 迭代而来,
该竞赛所提供的数据集包含 3531 个对象的 21294 张人脸图像, 117542 个视频帧,11779 个视频,10040 张非人脸图像。
链接:https://pan.baidu.com/s/1BZySyQgBUzRmQDhz0A8dag

参考:https://www.cnblogs.com/cxt-janson/p/13366563.html
其他资源评论区留言获取

人脸识别数据集概况及资源合集相关推荐

  1. 最新数据分析教程资源合集(案例、数据集、SQL教程、分析样板、面经、简历、PY教程... )...

    要想快速成为数据分析师的必备条件: 首先是数据处理能力:巨大的数据量不是EXCEL能处理的,因此需要有一定的编程技能(主要应用到python和SQL,python学习开发都比较简单,SQL用来数据库取 ...

  2. 网友:Java岗,自学一个月跳槽计算机视觉!附学习资源合集

    笔者在脉脉上看到一条帖子:原来Java岗,自学一个月成功跳槽视觉算法岗. 这已经不是笔者第一次看到转行成功的程序员案例了,而大家的跳槽动机基本上都离不开,发展趋势.岗位高薪.职业兴趣. 计算机视觉 行 ...

  3. 直播软件搭建Android音视频方向进阶路线及资源合集

    直播软件搭建Android音视频方向进阶路线及资源合集 直播软件搭建的音视频从采集到播放都经历了哪些流程呢:: 通过上面的图,我们简单的把音视频方向分为主要的两块: 媒体部分(蓝色+绿色) 传输部分( ...

  4. 阿里系唯一对外开放数据分享平台天池数据集2020收官精品合集大放送

    **简介:**阿里系唯一对外开放数据分享平台天池数据集2020收官精品合集大放送 作为国内"AI众智"首选平台,阿里云天池除了面向国内开发者组织大数据竞赛.免费开放AI学习内容.提 ...

  5. 人脸识别数据集精粹(下)

    人脸识别数据集精粹(下) 人脸检测数据集 所谓人脸检测任务,就是要定位出图像中人脸的大概位置.通常检测完之后根据得到的框再进行特征的提取,包括关键点等信息,然后做一系列后续的分析. (1) Calte ...

  6. 人脸识别数据集精粹(上)

    人脸识别数据集精粹(上) 人脸识别 人脸检测和关键点检测都是比较底层的任务,而人脸识别是更高层的任务,它就是要识别出检测出来的人脸是谁,完成身份比对等任务,也是人脸领域里被研究最多的任务. 1.1 人 ...

  7. 人工智能新手入门学习路线!附学习资源合集

    有段时间没跟大家分享编程资源福利了!今天为大家整理了人工智能新手入门学习路线,同时附700分钟的学习资源合集,相信这套福利可以帮你顺利入行AI!文末领取全部资料. 一.AI基础好课学习资料整理(约31 ...

  8. 【数据集NO.3】人脸识别数据集汇总

    文章目录 前言 一.IMDB-WIKI人脸数据集 二.WiderFace人脸检测数据集 三.GENKI 人脸图像数据集 四.哥伦比亚大学公众人物脸部数据库 五.CelebA人脸数据集 六.美国国防部人 ...

  9. @autowired注解_品Spring:对@Autowired和@Value注解的处理方法(文末附spring系列资源合集)...

    作者:编程新说李新杰 出自:微信公众号"编程新说" 原文:品Spring:对@Autowired和@Value注解的处理方法 在Spring中能够完成依赖注入的注解有JavaSE提 ...

  10. 南京大学发布WebCaricature漫画人脸识别数据集

    近日,南京大学推理与学习研究组(R&L Group)发布了一个新的漫画人脸识别数据集 WebCaricature.该数据集包含了 252 个名人的 6042 幅漫画图像以及 5974 幅人脸图 ...

最新文章

  1. 项目: 写一个开头的界面 【c++ / c】
  2. linux path在哪个文件夹,linux PATH环境变量全解析
  3. Maven and Ant for Hybris
  4. .net显示今天农历的代码
  5. .NET Core实战项目之CMS 第三章 入门篇-源码解析配置文件及依赖注入
  6. 你知道自己执行的是哪个jre吗?
  7. 优秀的程序员是如何诞生的?
  8. centOS6.6网络设置
  9. Silverlight 图片路径问题
  10. java验证码图片工具类_工具类:VerifyCode.java:图片验证码
  11. Java学习笔记——判断一个数是否是质数
  12. 【python】报错:OSError: [Errno 30] Read-only file system
  13. 计算机磁盘管理 移动硬盘创建盘符,电脑中插入移动硬盘后无法显示分区盘符如何解决...
  14. 计算机思维是运用计算机科学的什么,计算思维是运用计算机科学的基础概念进行问题求解、系统设计以及人类行为理解等涵盖计算机科学之广度的一系列计算机的思维活动。...
  15. android集成sdk 马甲包,Android 马甲包制作流程
  16. C1认证学习二十六(基础选择器)
  17. 机器学习——支持向量机——硬间隔与支持向量
  18. Python基础:函数的返回值return
  19. SSD性能测试工具-AS_SSD Benchmark
  20. sentinel 1A数据升降轨道

热门文章

  1. C语言按行列加密解密(英文文本)
  2. unity游戏开发毕设_基于unity游戏引擎的游戏设计毕设论文.doc
  3. HTML5 界面元素 Canvas 参考手册
  4. 步进电机驱动器脉冲频率确定 步进电机驱动器
  5. bat脚本重启tomcat
  6. linux下重启tomcat命令
  7. wifi 小米pro 驱动 黑苹果_【黑果小兵】小米Pro macOS High Sierra 10.13黑苹果安装教程...
  8. TM1640驱动程序
  9. linux系统ping地址端口,linux ping 带端口
  10. Symbian中的iScanCode和iCode