论文题目:

LUVLi Face Alignment: Estimating Landmarks’ Location, Uncertainty, and Visibility Likel. 2020CVPR

下载链接:

【csdn】【arXiv】

论文解读:

Abstract

  1. 提出了以往人脸关键点算法所存在的问题:通常人脸关键点检测任务,不会关注每个点的有效性,只能按照预定义的点的数量回归出全部关键点,并且不关注关键点本身是否被遮挡。
  2. 主要贡献
    (1)提出LUVLi作为损失函数来优化深度网络,从而达到对关键点未知性的估算;
    (2)发布一个新的68点数据集,数据集包含19000张人脸图像,并且每张图像的每个关键点都被标明是否被遮挡

1. Introduction

以下内容来自 john_bh

现代人脸对齐方法(面部界标定位)在大多数情况下效果都很好,但是所有这些方法都在一定程度上失败了。不幸的是,几乎所有最新技术(SOTA)都仅输出预测的地标位置,而没有评估下游任务是否(或多少)应该信任这些地标位置。这是令人担忧的,因为面部对齐是许多安全关键型应用程序中的关键预处理步骤,其中包括高级驾驶员辅助系统(ADAS),驾驶员监视和生命体征的远程测量[57]。由于深层神经网络因产生过度自信的预测而臭名昭著[33],对其他神经网络技术也提出了类似的担忧[46],并且在对抗性机器学习时代,对抗性图像可能会严重威胁其发展,它们变得更加尖锐。一个系统[14]。但是,以前的人脸对齐工作(通常是地标定位)在很大程度上忽略了不确定性估计的领域。

我们发现,选择用于计算均值和协方差的方法至关重要。最好使用热图而不是直接回归来获得地标位置。为了使用热图以可区分的方式估计地标位置,我们不选择每个地标热图的最大值(argmax)的位置,而是建议使用每个热图的正元素的空间均值。与地标位置不同,不确定性分布参数最好通过直接回归而不是从热图获得。为了估计预测位置的不确定性,我们添加了一个Cholesky估计器网络(CEN)分支来估计多元高斯或拉普拉斯概率分布的协方差矩阵。为了估算每个地标的可见性,我们添加了可见性估算器网络(VEN)。我们使用联合损失函数(称为位置,不确定性和可见性可能性(LUVLi)损失)将这些估计值合并在一起。设计此模型的主要目的是估计地标定位的不确定性。在此过程中,我们的方法不仅可以产生准确的不确定性估计,而且还可以在多个面部对齐数据集上产生SOTA界标定位结果。

不确定性大致可分为两类[41]:认知不确定性与对生成观测数据的模型缺乏了解有关,而不确定性与观测中固有的噪声(例如传感器或标签噪声)有关。由人类标记者在图像上标记的地面真相地标位置在图像的多个标记之间会因不同的人类标记者(甚至由同一人类标记者)而异。此外,这种变化本身会在不同的图像和地标之间发生变化(例如,对于被遮挡的地标和光线不足的图像,其变化会更大)。我们方法的目标是估计这种不确定性。

每个图像每个地标只有一个地面标记的位置这一事实使估算这种不确定性分布变得困难,但并非不可能。为此,我们使用参数模型进行不确定性分布。我们训练了一个神经网络来估计每个输入人脸图像的每个界标的模型参数,从而在该界标的地面真实位置模型下最大化似然性(汇总所有训练脸部的所有地标)。

主要工作内容如下:
(1)这是引入用于面对齐的参数不确定性估计概念的第一项工作。
(2)我们提出了一个端到端可训练模型,用于联合估计地标位置,不确定性和可见性可能性(LUVLi),建模为混合随机变量。
(3)我们使用多元高斯和多元拉普拉斯概率分布比较我们的模型。
(4)我们的算法在多个面部对齐数据集上产生准确的不确定性估计和最新的地标定位结果。
(5)我们将发布一个新的数据集,其中将以手动方式标记各种姿势中超过19000张面部图像上68个地标的位置,其中每个地标也被标记为三种可见性类别之一。

2. Related Work

3. Proposed Method

4. New Dataset: MERL-RAV


5. Experiments

5.1 300-W Face Alignment



5.2 AFLW-19 Face Alignment


5.3 WFLW Face Alignment



5.4 MERL-RAV Face Alignment

5.5 Ablation Studies

【paper-LUVLi】LUVLi Face Alignment: Estimating Landmarks’ Location, Uncertainty, and Visibility Likel相关推荐

  1. LUVLi Face Alignment: Estimating Landmarks’ Location, Uncertainty, and Visibility Likelihood

    这是一篇CVPR2020的文章,性能目前仍居前列,故分享一下 论文链接. MERL-RAV Dataset. 介绍   目前存在的人脸关键点检测算法在多数情况下表现足够好,但是也存在一些问题.当前主流 ...

  2. 【Paper Reading】

    Levers are simple too, but they can move the world1. 文章目录 1 Categories Classification Compression Da ...

  3. 【paper reading】Uncalibrated Photometric Stereo under Natural Illumination

    [paper reading]Uncalibrated Photometric Stereo under Natural Illumination 1.简介 2.等效方向光模型 3. 法向估计 3.1 ...

  4. 【CVPR 2019】Strong-Weak Distribution Alignment for Adaptive Object Detection

    1 介绍 此文章是[CVPR 2019]的文章,主要讲述了Strong-Weak的DA方法: 2 原文链接 <Strong-Weak Distribution Alignment for Ada ...

  5. 【paper 1】2022 一种用于脑内出血血肿体积检测的鲁棒性深度学习分割方法-英文

    A Robust Deep Learning Segmentation Method for Hematoma Volumetric Detection in Intracerebral Hemorr ...

  6. 10.【CSS定位】:position、z-index、dispaly(none)、visibility、overflow hot new 模块 + 淘宝焦点图布局 +土豆网鼠标经过显示遮罩

    文章目录 [CSS定位] 一.定位 1.1 为什么需要定位? 1.2 定位组成 1.3 静态定位 static(了解) 1.4 相对定位 relative(重要) 1.5 绝对定位 absolute( ...

  7. 【paper 2】Learning from Simulated and Unsupervised Images through Adversarial Training

    GAN对抗学习 单词 refiner 修正器 tractable 容易处理的 annotations 注释 plethora 过多 penalize 惩罚 holistically 整体论地 dive ...

  8. 【Paper Reading】二值化网络——BNN

    Binarized Neural Networks: Training Neural Networks withWeights and Activations Constrained to +1 or ...

  9. 【paper吐槽】【SelfSupervised Learning】Self-Supervised Image Restoration with Blurry and Noisy Pairs

    论文链接:Arxiv 期刊/会议:NeurIPS 2022 是否有code: Code 关键词 自监督学习, 图像恢复,paper吐槽 为什么要吐槽这篇文章? 我不装了,我摊牌了,我承认我读完这篇pa ...

最新文章

  1. 盘点几个值得你借鉴的Java学习方法
  2. catia曲面扫掠命令详解_Catia曲面基础与工程实践 3.2 扫掠曲面
  3. 使用python对比两个目录下的文件名差异
  4. Maven远程仓库:pom依赖以及jar包下载
  5. VTK:简单操作之ProjectPointPlane
  6. cdi-api_使用CDI简化JAX-RS缓存
  7. ASP.NET页面之间传值Session(2)
  8. 2017.9.19 L语言 失败总结
  9. 计算机小故障排除方法,常见电脑故障排除方法总汇【详解】
  10. RK3399pro Linux Rock-X AI组件库支持
  11. 用 Go 语言给 Lua/OpenResty 写扩展
  12. 转载《数据的olap模式》
  13. 服务器 2.5 英寸硬盘托架安装
  14. win7系统iis服务器删除,Win7系统如何卸载iis 删除win7中iis的方法
  15. 使用U盘重装MacBook Air时用到的工具和镜像
  16. 019-zabbix数据库表详解
  17. hihocode——#1498 : Diligent Robots
  18. 数组扁平化 对象扁平化
  19. 全球500强企业里用的两字母域名!
  20. E. MEX and Increments

热门文章

  1. 波特率9600是什么意思
  2. 移动硬盘在计算机中不显示数据能恢复,移动硬盘摔了出现无法读取数据还能恢复吗?...
  3. 2020web前端学习路线(附全套前端视频教程+教学大纲)
  4. 口萌妹子技术导航网站源码
  5. snort 检测nmap_Snort入侵检测系统安装与配置
  6. 梦幻古龙服务器 文档,梦幻古龙GM常用资料.doc
  7. 不用百度云管家下载大文件
  8. 盲盒拓客商家联盟红包裂变抽奖源码
  9. 做IT的考什么证书含金量高?对带项目和招标有作用的?
  10. java 超市购物清单