出处“来自微信公众号:我爱计算机视觉”

新思路!商汤开源利用无标注数据大幅提高精度的人脸识别算法

这篇论文解决的问题与现实中的人脸识别应用场景密切相关,其假设已经有了少量已经标注的数据,而未标注的人脸图像数据是来自于不受控的环境中采集的,且这些人与数据库中已经有标注的人没有重叠,希望将这些数据赋予标签加入到训练集中。

算法思想

算法的核心动机是从未标注数据中找到那些来自同一个人的伪正样本人脸图像对,将其加入训练集,扩大训练集的规模。

一个很简单的想法,是提取特征然后聚类,将聚类后的标签作为伪样本标签,但是普通的聚类难以提供高质量可信赖的标签,一个直观的例子,比如不同人侧脸的图像相似程度比同一个人正脸和侧脸图像相似程度要高。

如何构建可靠的来自同一个人的伪正样本对呢?请看下图:

作者发明了一种称为Consensus-Driven Propagation(共识驱动传播)的模型,该模型中有三种重要角色:base-model(基模型),committee model(委员模型),mediator model(调解员模型)。

base-model和committee model是从有标注数据中训练出来的深度学习模型分类器,该文使用不同的网络架构训练多个模型,使用它们对未标注的人脸图像提取特征,然后使用这些特征构建未标注样本的K-NN图,这些K-NN图初步反映了同一个人不同人脸图像之间的视图关系。

作者尝试了很多深度模型:

然后使用mediator model根据K-NN图的连接关系和各种多样性特征,分类K-NN图中具有连接关系的两个人脸图像样本是否来自同一个人。文中作者使用了多层感知机(MLP)作为mediator model。

很显然,mediator model在训练的时候是在有标注的数据上构建正负样本对的,这正是Consensus-Driven Propagation(共识驱动传播)的由来,未标注的人脸图像来自同一个人的多幅图像之间的关系与已标注的同一个人的多幅图像之间的关系是相似的,表现为它们的K-NN图节点之间的关系相似。

提取出的样本关系图:

构造的伪正样本图像示例:

红色框代表被mediator model拒绝的异常样本。

构建完伪标签,将其加入训练集,但是训练的时候其使用不同于有标注数据的Loss,在base-model上重新训练。

实验结果

作者在MageFace和IJB-A人脸数据集上做了实验,将数据集均分成11份,训练的时候仅使用十一分之一的标注数据,逐步增加未标注数据,比较最终正确率,并与使用了所有标注数据的结果比较。

下图展示了实验中使用的模型网络架构和分别在这两个数据集上取得的精度,还有集成后的精度。

下图展示了,随着未标注数据的加入,模型精度不断提高。

在MageFace数据集上,不使用未标注数据(即仅使用十一分之一的训练数据)精度为61.78%,使用了10份未标注数据的结果是78.18%,而使用全监督的方法(使用所有真实标注)精度为78.52%,证明所提出的方法生成的伪标签加入训练集大大提高了模型准确度(16.4%),取得了与全监督方法相匹敌的性能。

比较有意思的是,使用该文的方法在IJB-A上打败了全监督的方法(理论上是不应该的),作者解释这是因为IJB-A数据库本身引入了较多的标签噪声。

总结

这篇文章提出的方法非常有价值,低成本扩大数据规模,其不仅适用于人脸识别,在所有识别的任务中几乎都可以尝试,从IJB-A的实验结果看,其甚至可以成为一种数据清洗的方法。

当当

论文:

https://arxiv.org/abs/1809.01407

代码:

https://github.com/XiaohangZhan/cdp/

新思路!商汤开源利用无标注数据大幅提高精度的人脸识别算法相关推荐

  1. 高效利用无标注数据:自监督学习简述

    一只小狐狸带你解锁 炼丹术&NLP 秘籍 作者:huyber 来源:https://zhuanlan.zhihu.com/p/108906502 BERT的大热让自监督学习成为了大家讨论的热点 ...

  2. 用开源的人工标注数据来增强RoFormer-Sim

    ©PaperWeekly 原创 · 作者 | 苏剑林 单位 | 追一科技 研究方向 | NLP.神经网络 大家知道,从 SimBERT [1] 到 SimBERTv2(RoFormer-Sim),我们 ...

  3. ICCV 2019 | 爱奇艺提出半监督损失函数,利用无标签数据优化人脸识别模型

    点击我爱计算机视觉标星,更快获取CVML新技术 论文发表于ICCV 2019 作者 | 爱奇艺技术产品团队 编辑 | 唐里 论文标题:Unknown Identity Rejection Loss: ...

  4. 无标注数据是鸡肋还是宝藏?阿里工程师这样用它

    阿里妹导读:针对业务场景中标注数据不足.大量的无标注数据又难以有效利用的问题,我们提出了一种面向行为序列数据的深度学习风控算法 Auto Risk,提出通过代理任务从无标注数据中学习通用的特征表示.这 ...

  5. 无标注数据是鸡肋还是宝藏?阿里工程师这样用它​

    阿里妹导读:针对业务场景中标注数据不足.大量的无标注数据又难以有效利用的问题,我们提出了一种面向行为序列数据的深度学习风控算法 Auto Risk,提出通过代理任务从无标注数据中学习通用的特征表示.这 ...

  6. python目标跟踪_商汤开源最大目标跟踪库PySOT,代码已正式上线!

    前几天 CVer推送一篇:重磅!商汤开源最大目标跟踪库PySOT:含SiamRPN++和SiamMask等算法,介绍了来自商汤科技的STVIR(SenseTime Video Intelligence ...

  7. 港中文开源基于PyTorch的多任务人脸识别框架

    点击我爱计算机视觉标星,更快获取CVML新技术 今天跟大家分享一款新晋开源的出自香港中文大学MMLab实验室的人脸识别库,其最大特点是支持人脸多任务训练,方便使用PyTorch进行人脸识别的训练.评估 ...

  8. android seetaface6_中科视拓宣布开源SeetaFace6人脸识别算法(附相关课程)

    3月31日,中科视拓宣布开放SeetaFace6人脸识别算法. 2016年9月和2019年8月,中科视拓分别开源了SeetaFace1.0人脸识别引擎.SeetaFace2.0商用级人脸识别算法.Se ...

  9. RetinaFace最强开源人脸识别算法

    最近这几天,美国国家标准与技术研究院(NIST)公布了全球最权威的人脸识别算法测试(FRVT)的最新结果, 国内知名视觉算法公司格灵深瞳取得了优异成绩:在最具挑战的"非约束性自然环境人脸照片 ...

最新文章

  1. webstorm常用设置
  2. Hive:解决Hive创建文件数过多的问题
  3. 事务中SET XACT_ABORT各种用法
  4. mysql中depart_mysql 学习笔记
  5. 人生最重要的十个健康伴侣
  6. CCF201312-2 ISBN号码
  7. 如何发送Excel中图表到邮件
  8. 前端同时访问后端同一接口两次,但只有后面那次请求有返回数据
  9. UDP协议实现聊天小程序
  10. 有哪些好用的实时网络流量监控软件
  11. 6取余11c语言,中国剩余定理“大衍求一术”手算方法及四个习题
  12. 航空运输安全及鉴定,保障货物成功抵达
  13. 第9章第18节:制作商业计划书的商业模式幻灯片 [PowerPoint精美幻灯片实战教程]
  14. 【Dos】常见的Dos攻击
  15. 坐标系之间的简单变换
  16. QT开发一款MD5校验工具
  17. 利用kettle HTTP Client 获取百度API区域位置内相关信息,并解析json
  18. Ubuntu 18.04 Mellanox ConnectX 网络适配器驱动安装
  19. html5文档类型和字符集,1、新的 HTML5 文档类型和字符集是?
  20. 央视春晚歌手王琪,和戏歌双绝吴广全在长春芝华仕会盟

热门文章

  1. XenStore: 使用,结构和原理
  2. 如何判断Android手机当前是否联网
  3. linux 编程之库的使用(学习笔记)
  4. confluence7安全补丁_centos7安装confluence遇到的问题
  5. linux php ldap扩展,php_ldap域集成模块安装-159
  6. 隐形需求 软件测试,从开发角度聊聊如何洞悉隐性需求
  7. 思科isis路由的优先级_何谓“路由” ,带你了解路由的本质,轻松配置路由简单排除故障...
  8. php登录半透明,WordPress透明OAuth 1.0使用PHP登录
  9. 农用地包括哪些地类_征用土地公告应当包括哪些内容?|楹庭拆迁律师
  10. Spring Cloud 2020.0.4 发布!