前言

在进行人脸识别的测评中,经常会看到涉及到Gallery和Probe两部分数据。初入门的小白可能不太明白这两部分数据是用来干什么的,为什么需要这么分。下面面我们就来讲解一下。

人脸识别评测两种方式

一般的人脸识别算法的性能有两种评测的方式,一种是人脸比对,另一个种是人脸识别。人脸比对就比较好理解了,就是给出两场图片组成一个图片对,让算法来判断这连个图片是不是一个人。另一种就是人脸识别,人脸识别需要一组图像集和一张待认证的图像,我们的目的就是从图像集中找出和待认证的图像身份相同的图像。

Gallery和Probe

从字面的意思来理解,Gallery就是画廊的意思,形象的说,其实就是我们实现准备的一组图片,然后摆在那,构成一个画廊,当有需要认证的图片来的时候,我们就从画廊中挑选出和这个待认证的图像身份相同的图片。这个待认证的图像就是Probe。Probe就是探头、探测器的意思,很形象,就是我们拿着探测器去画廊里试探那张图片和这样探测图像的身份是一致的。很多的Probe就构成了Probe set。Gallery又叫distractors(干扰项),也很形象就是用来干扰我们探测的图像。一般Probe的身份是已知的,探测之后我们找出Gallery中和Probe最相似的图像,然后判断这张图像的身份和Probe是否相同,如果相同则成功识别,如果不相同识别失败。对Probe set中所有的Probe统计失败和成功的次数,计算出TPR和FPR,就可以计算出人脸算法CMC曲线。我这里讲的是最简单的情况,关于人脸识别算法的性能指标请参考我的博客人脸识别算法评价指标——TAR,FAR,FRR,ERR.

MegaFace中的Probe和Gallery

这里讲解我在使用MegaFace challenge1中遇到的问题,也许有小伙伴和我有一样的疑惑。首先是Probe set,这个没有问题,使用FaceScrub作为Probe Set,里面的图片的身份是已知的。接下来是Gallery,这就有问题了,Gallery中的每个图片的身份标签是没有给的,当我们使用Probe去探测时,探测完成后我们找到了一张和Probe最相近的图像,但是由于没有身份标签,我们怎么判断找到的这张图像和Probe的身份是否相同呢?
不知道大家有没有相似的疑惑,为了解决疑惑我就去读了官方给的评测代码,结果关键的代码给的是编译后的二进制文件。于是开始在网上搜索,最后找到了一片博客Megaface Challenge1 评测步骤解决了我的问题。内容转载如下。其实还有一种解决这个问题的方式就是读MegaFace发表的论文,里面有讲具体是怎么评测的。

Megaface Challenge1 评测方案:

  1. 参照论文 The MegaFace Benchmark: 1 Million Faces for Recognition at Scale,主要进行Identification测试。这里包括两部分数据,一部分probe set,一部分distractors,还有个官方给定的评测程序devkit。其中distractors,是megaface官方提供的自己的数据集,有超过百万人脸。另外一个probe set,采用FaceScrub数据集(包括530个人),为了评测方便,从中选取80个人(男女各半,且每个人照片要超过50张),每个人随机选取一定照片,组成probe set。具体选取的人和照片,参照devkit/templatelists/facescrub_features_list.json,对应的distractors也有对应的megaface_features_list.json_1000000_1。

  2. Identification评测逻辑,就是假设probe set 有N个人,每个人有M张图片,每次选取一张图片作为probe photo,然后把剩余的M-1张,在单独每一张和distractors一起组成gallery,然后进行比对,计算rank1,rank10到rank=k的准确率,最终得到CMC曲线,其中相当于和Gallery比对了N∗M∗(M−1)次。

  3. 对于提供的probe set和distractors,其中有很多错误(probe set中有些图片并不是本人,然后distractors中有些图片是probe set中的人),参照Insight face给出的nosies.txt,进行清除,然后生成特征进行比对。对于官方给的Identification.bin评测程序,注意的就是要把json文件的名称和特征名称匹配就行了。参照Insight face,用LResNet50E-IR,模型进行测试得到rank1=97.2%

  4. 观察megaface给出的probe set数据集,发现大部分图片,从表情,光照,表情,姿态上都比较正常(大部分微笑表情,没有特别夸张表情),其中Adrienne_Barbeau图片大部分刘海遮住额头,还有一个男星所有图片带着浅色眼睛。综上,probe set中所有图片都是正常质量较高的图片。

人脸识别中的Gallery和Probe以及MegaFace的测试方式相关推荐

  1. yii2 模型中set_Day184:人脸识别中open-set与close-set

    人脸识别 可以简单的分为如下两类: face verification:人脸验证时将人脸分类到某个ID,比如给定两张人脸,判断是否是同一个人(ID) face identification:给定一张人 ...

  2. 人脸识别中的开集和闭集测试

    人脸识别中的开集和闭集测试 这个领域里可以简单分成两大类: • 人脸验证 • 人脸检索 做人脸识别的时候,需要根据业务需要来选择合适的测试指标,测试指标也远远不止文中提到的几个,这里就列举几个比较常用 ...

  3. 人脸识别中的open-set(开集)与close-set(闭集)

    人脸识别可以分为face verification和face identification,前者是给定两张人脸,判断是否是同一个人;后者是给定一张人脸,判断他是人脸库中的哪个人. 然后看看sphere ...

  4. 人脸识别中的rank-n

    人脸识别中的rank-n 代表的意思 原创这个昵称唯一 最后发布于2017-09-02 11:05:13 阅读数 2247  收藏 展开 Rank-1 看一些论文总是在结果中看到rank-1,等等,但 ...

  5. 【CVPR 2018】腾讯AI lab提出深度人脸识别中的大间隔余弦损失

    论文导读] 深度卷积神经网络(DCNN)在人脸识别中已经取得了巨大的进展,通常的人脸识别的核心任务都包括人脸验证与人脸识别,涉及到特征判别.很多模型都是使用Softmax损失函数去监督模型的训练,但是 ...

  6. CV之FRec之ME/LF:人脸识别中常用的模型评估指标/损失函数(Triplet Loss、Center Loss)简介、使用方法之详细攻略

    CV之FRec之ME/LF:人脸识别中常用的模型评估指标/损失函数(Triplet Loss.Center Loss)简介.使用方法之详细攻略 目录 T1.Triplet Loss 1.英文原文解释 ...

  7. 计算机视觉子方向,计算机视觉方向简介 | 人脸识别中的活体检测算法综述

    原标题:计算机视觉方向简介 | 人脸识别中的活体检测算法综述 本文转载自"SIGAI人工智能学习与实践平台"(ID:SIGAICN) 导言 1. 什么是活体检测? 判断捕捉到的人脸 ...

  8. 人脸识别中Softmax-based Loss的演化史

    点击我爱计算机视觉标星,更快获取CVML新技术 近期,人脸识别研究领域的主要进展之一集中在了 Softmax Loss 的改进之上:在本文中,旷视研究院(上海)(MEGVII Research Sha ...

  9. 人脸识别中的阈值应该如何设置?

    人脸识别中的阈值应该如何设置? 标签: 人脸识别 分类: 人脸识别 人脸识别中的阈值应该如何设置? 随着人脸识别技术使用范围越来越广,大部分使用者可能对人脸识别中的某一方面不是很懂,咨询的问题也五花八 ...

最新文章

  1. Java-Web HTTP协议
  2. 奇怪的方式c语言,C语言中奇怪的C语言特性
  3. 读取Exchange的用户未读邮件数3种办法
  4. java serializable 源码_Java源码分析之-Serializable接口
  5. 阻止页面双击选中文本
  6. 极光推送指定用户推送_App用户都睡着了?是时候用推送和活动唤醒一波了!
  7. 百面机器学习—1.特征工程
  8. Kubernetes详解(九)——资源配置清单创建Pod实战
  9. windows DNS服务器的配置
  10. 淘宝全屏代码天猫首页全屏代码不显示全屏怎么做设置自适应通栏990布局 全屏代码1920
  11. 基于OpenCv的人脸识别(Python完整代码)
  12. visual studio设置背景颜色为眼睛保护色
  13. 微信开发者工具的tabBar和数据双向绑定
  14. 禁用和卸载树莓派 4B 上 avahi-daemon
  15. 笔记本电脑分区后怎么恢复?3个方法
  16. ZBrush新手推荐使用这17个小技巧和常用快捷键、笔刷
  17. 利用火绒黑名单功能屏蔽风险ip地址
  18. ToggleButton的用法
  19. R语言二项分布(The Binomial Distribution)
  20. altium designer芯片引脚间距规则过小

热门文章

  1. 【流媒体|从入门到出家】:流媒体协议—FLV
  2. 餐饮品牌推广方案PPT-朴尔PPT
  3. 【世通兰陵王系列】IP段是什么意思?杭州高防IP段:103.219.30
  4. 图像灰度化的三种常见方法源码
  5. Python爬虫实例:从百度贴吧下载多页话题内容
  6. 【Log】(二)Java 中的日志框架 JCL、SLF
  7. 城市公交线路查询系统mysql_网上公交线路查询系统网站(sqlserver2000)
  8. codeforces546D
  9. android中星级评分控件RatingBar的使用
  10. 古朴自然侘寂风装修 心中温柔之地