CVPR2016

MegaFace data, code, and challenge can be found at:
http://megaface.cs.washington.edu

人脸识别问题貌似已经被解决了,因为在 LFW上面,大家的识别率都是 99%+啦。但是当数据库的规模达到一百万时,识别率就不是很好了。

文献首先描述了当前数据库存在的问题,就是识别率饱和,数据库规模太小。接着描述了建立 一百万个体人脸的MegaFace数据库的步骤,最后使用了几个代表性算法在该数据库上进行测试,发现了一些现象,说明大规模人脸识别问题没有被解决,有待进一步研究。

http://www.leiphone.com/news/201606/XUiStc0VO3HOYXa1.html

大的脸图集包含了1百万张图片,代表了超过690,000个不同的人。这是第一次在一百万规模下测试面部识别算法。在最近几年中,已经有几个团队声称,他们的脸部识别算法系统的精准率已经近乎完美。

但本次测试只会在一个仅有13,000张图片的数据集上进行-比参加美国职业足球赛的平均人数还少。随着这些人群增长到一个美国主要城市的规模,他们的表现将如何?

华盛顿大学的研究者回应了这个人脸挑战问题。世界的第一个竞争,旨于在百万人的数据规模下评估和提高人脸识别算法的性能。当面临着更多的干扰时,所有的算法都面临精准率的考核,但有些算法的表现比别其他的好得多。

“我们需要在星球的尺度上测试脸部识别,确保他能实际应用–在更大范围进行测试,以便你发现识别算法的缺陷和优点。”计算机科学助理教授和UW项目的首席研究员 Ira Kemelmacher-Shlizerman说道。

“我们不能在一个很小的集合中测试,然后说他是完美的。”

UW团队首先开发了一个有一百万相册图片的数据集,图片来自于全世界并且可公开提供创意共享许可证,代表着690572个独特的个人。随后他们考验人脸识别团队,让他们下载数据库然后观察当必须区分有一百万种可能性的匹配时他们算法的运行效率。

Google的脸部网络在其中一项测试中展现出了非常高的性能,当面对更小的图片集时,达到了近乎完美的精准度,在百万人测试中精准度达到了75%。一个来自于俄罗斯N-TechLab的团队在另一个测试中脱颖而出,降到73%。

相比之下,其他算法的精准率也很不错–大概95%–在一个小规模内下降了更大的百分比,当面临着更艰巨的任务时精度低至33%。初步的结果,在计算机视觉与模式识别会议(CVPR 2016)6月30日的论文中被非常详细的展现出,以及项目网站上更新正在进行的结果,超过300个研究小组正在努力攻克大规模的脸图。

大规模的脸图挑战在查证方面测试了算法,或者说他们在正确的识别两个照片是否是同一个人方面能表现的多好。这就是一个iPhone的安全功能如何运作,例如,能够识别你的脸并且决定是否解锁你的手机,而不是要你输入密码。

“如果你在阿姆斯特丹的火车站丢失了你的手机会发生什么?,或者有人想偷他呢?”共同领导UW图像算法和成像实验室的Kemelmacher-Shlizerman说道。“我想非常的肯定我的手机可以在一百万甚至七百万人中正常的识别出我,而不是在仅仅10,000或者更少”

他们同样也在识别方面测试了算法,或者说他们能够多精准的匹配一个单一个体的照片,从一百万“分心”中找到同样是这个人的不同照片。这正是在进行的,例如,当执法部门有一个犯罪嫌疑人的照片,并通过在地铁站台或机场拍摄的照片,看看是否该人试图逃跑。

“你可以看出这个问题的难点-从不同的年龄阶段中识别出同一个人是无法解决的问题。因此从他们二重身识别出个人和匹配不同姿势的个人就像侧视图到正视图一样。 ”Kemelmacher-Shlizerman说道。在评估规模时,文章同样分析了在人脸识别时年龄和姿势的不变性。

总体来说,“学习”在大规模图片数据集中如何正确片匹配的算法胜了那些只获得较小的训练数据集的算法。除了中国研究团队演算出的SIAT MMlab算法,在更小数量的图片集上学习,逆流而,上通过比其他的算法做的更好。

大集合面部图集挑战仍然在进行并且不断的收到结果。

团队的下一步包括收集一半一百万的个体–每一个都有一定数量的照片–为了一个将被用于脸部识别算法的数据集。这将有助平衡运行场地于并且测试给出相同数量的大规模训练数据,那个的算法优于其他人,当大多数研究者无法获得和Google或者Facebook一样大的图片集时。该训练集将被发布到夏季结束。

“最先进的深神经网络算法有数以百万计的参数要学习并且要求有大量的例子来调整他们”Aaron Nech说道,华盛顿大学计算机科学与工程硕士的学生在为训练数据集而努力。

“和人不一样,这些模型最初是一个空白的石板。具有数据的多样性 ,例如在超过500,000个不同个体发现的杂的身份线索,通过提供各种各样现在未出现的样本,能够提高算法的性能”

The MegaFace Benchmark-1 Million Faces for Recognition at Scale相关推荐

  1. AN IMAGE IS WORTH 16X16 WORDS :TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE(VIT)

    最近看transformer用于CV比较热门,特意去进行了解,这里用分类的一篇文章进行讲解. NLP中的transformer和代码讲解参考我另一篇文章. 论文链接:AN IMAGE IS WORTH ...

  2. AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE——ViT全文翻译

    一文读懂ViT:ViT 快速理解 Vision in Transformer 文章目录 全文翻译- Vision in Transformer- 相关说明 基本信息介绍 ABSTRACT 1 INTR ...

  3. 【读点论文】AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE(ViT)像处理自然语言那样处理图片

    AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE abstract 虽然Transformer体系结 ...

  4. An Image is worth 16*16 words: Transformers for image recognition at scale.

    An Image is worth 16*16 words: Transformers for image recognition at scale. Abstract 虽然Transformer架构 ...

  5. Ip102: a large-scale bench-mark dataset for insect pest recognition.

    论文下载地址:IP102论文 论文code和dataset:code和dataset 目前在GitHub上面已经找不到了.如果需要code和dataset的直接与论文作者联系比较好. IP102是一个 ...

  6. 李沐精读论文:ViT 《An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale》

    视频:ViT论文逐段精读[论文精读]_哔哩哔哩_bilibili 代码:论文源码 使用pytorch搭建Vision Transformer(vit)模型 vision_transforme · WZ ...

  7. 用Transformer完全代替CNN:AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

    原文地址:https://zhuanlan.zhihu.com/p/266311690 论文地址:https://arxiv.org/pdf/2010.11929.pdf 代码地址:https://g ...

  8. 【Transformer】ViT:An image is worth 16x16: transformers for image recognition at scale

    文章目录 一.背景和动机 二.方法 三.效果 四.Vision Transformer 学习到图像的哪些特征了 五.代码 代码链接:https://github.com/lucidrains/vit- ...

  9. 重读经典:《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》

    ViT论文逐段精读[论文精读] 这次李沐博士邀请了亚马逊计算机视觉专家朱毅博士来精读 Vision Transformer(ViT),强烈推荐大家去看本次的论文精读视频.朱毅博士讲解的很详细,几乎是逐 ...

最新文章

  1. python简单超级马里奥游戏下载_python 实现超级玛丽游戏
  2. C语言学习之输入两个正整数m和n,求其最大公约数和最小公倍数。
  3. Perlin Noise algorithms(备忘)
  4. Java 网络通信必备之socket通信基本原理介绍
  5. 基于Matlab的循环码实验报告,基于MATLAB的循环码实验报告
  6. W10的服务器正在运行,win10开机提示服务器正在运行中的解决教程
  7. 这不应该是19岁女孩的结局,这不应该是围观者该有的表达!
  8. 正式发布!鸿蒙,来了!
  9. Navicat连接Mysql 8.0.16报错:Client does not support authentication protocol requested by server?
  10. USB On-The-Go引脚
  11. jquery操作select选项
  12. Linux/Android的cpu/memory/磁盘占用情况
  13. 分页存储过程--From:桌面备份 - sql2005新功能.docx
  14. web安全day4--DHCP部署与安全
  15. 石家庄地铁查询系统开发进度
  16. Android 热修复原理解析
  17. 贵州杰赛s65机顶盒子CPU S905M-B 刷机教程及纯尽版固件
  18. 图书管理系统 jsp + servlet + mysql (2023)
  19. 分布式秒杀 - 实战
  20. 服务器添加二级域名网站教程,服务器添加二级域名

热门文章

  1. 手写笔迹鉴别系统(1)
  2. There was an error while executing `VBoxManage`, a CLI used by Vagrant for controlling VirtualBox.错误
  3. python高效识别验证码 极简 dddd
  4. 链X云英雄城市峰会|区块链技术落地数字化社区提升区域养老幸福指数
  5. Linux之日志系统
  6. 进程同步与互斥:Windows环境
  7. .htaccess是什么?.htaccess几个简单应用
  8. openwrt RK3568_EVB移植
  9. Oracle PLSQL
  10. VI设计中员工制服设计的构思方向