MSFSR: A Multi-Stage Face Super-Resolution with Accurate Facial Representation via Enhanced Facial Boundaries 2020 CVPR

MSFSR:一种通过增强人脸边界精确表示人脸的多级人脸超分辨率算法

1、摘要

大部分人脸超分辨(Face Super-Resolution (FSR))方法通过使用特殊的脸部先验作为引导,在给定的低分辨率(LR)超级分辨率为高分辨率(HR)。为了改善FSR的效果,在过去十年里出现了各种各样的脸部表征。但是,仍然存在有一个困难是在LR图像估计高质量的面部表征。为了解决这个问题,我们提出了一种新的面部表征方法:提高面部边界--语义上连接面部界标点,增强的面部边界保留了丰富的语义信息,并且对于不同的空间分辨率范围具有鲁棒性。 在提高面部边界的前提下,我们设计了新颖的多阶段FSR(MS-FSR)方法,目的是为了应用多阶段策略去恢复高质量人脸图像。增强的面部边界和从粗到细的监控有助于面部边界估计过程产生高质量的面部表示。FSR任务的一次性投影被分解为多个更简单的子流程。通过这些方法,MSFSR可以估计出更健壮的面部表示,并获得更好的性能。

2、介绍:

实验背景:

人脸图像不同于其他真实世界的图像,其高度结构化的形状和丰富的上下文信息具有明显的分布。

实际问题:

人脸图像有时处于低分辨率(LR)模式,因为它们是在使用劣质摄像头传感器的低质量场景下拍摄的,而且距离需要识别的人脸很远,这使得高级人脸应用,例如人脸识别、人脸操作和人脸对齐,都很困难。

解决方法:

要解决此问题,请使用人脸超分辨率(FSR)。人脸幻觉是仅重建人脸图像的超分辨率(SR)技术。 FSR技术旨在从LR面部图像重建视觉吸引人的高分辨率(HR)图像。 FSR作为一种针对特定领域的SR技术,由于考虑到面部图像的特定几何结构,因此可以有效地减少重建的HR面部图像中的模糊和失配纹理(图1中的第一行)

FSR技术较以往的优点:

为一种经典的特定于域的SR技术,FSR可以有效地减少重建HR人脸图像中模糊和不匹配的纹理(图1中的第一行),因为它考虑了人脸图像的特定几何结构

但是FSR仍然存在技术问题:

自FSR提出以来,不断通过各种卷积神经网络(CNN)[7、8、9]和生成对抗网络(GANs)[10、11]产生逼真的面部图像,这些方法[2,12]中的少数方法采用了各种面部属性向量作为面部特征。然而,这些方法仅专注于特定的面部属性,这导致产生错误的面孔。 **FSR的大多数方法都基于多种结构的面部表示,例如面部解析图[4],面部界标点[3]和密集的对应字段[7]。

①问:最近的FSR方法估计了沙漏结构变体的面部特征,由于其模型容量原因,沙漏结构无法估计复杂的表现。发现合适的人脸信息最主要挑战在于发现丰富的语义信息、复杂度低的人脸特征。面部标志点是FSR方法中最常用的面部特征之一。地标点所承载的语义信息与地标标注的密度密切相关。不幸的是,估计密集地标点需要在FSR任务中不可用的HR人脸图像。采用人脸解析映射,在像素级标注上保留来自其固有属性的附加语义信息。然而,面部解析图的获取成本非常高,并且它们往往会分离面部组件,而忽略面部组件(例如鼻梁)的内部几何结构。

**如图1(e),(f)所示,这些基于先验的方法能够生成具有更好视觉质量的面部图像。不幸的是,图1(e)是由利用面部界标点的网络生成的,它在重要的面部组件(如眼睛)上发生了变形。具有面部解析图的FSR网络[4]重建了具有每个面部成分精确定位的面部图像,而这些图像丢失了鼻梁上的内部结构细节,如图1(f)所示。为了解决这些问题,应该探索新颖的面部结构表示以改善FSR性能。

解决:增强的面部边界  不仅包含了面部地标点的几乎所有信息,而且还包含了连接线中更多的语义信息,可以完全表示面部的基本几何结构

②问:在引入的原始面部边界线设置中,人眼轮廓分为上边界和下边界。这种分离有利于HR中眼睛周围地标点的准确定位。但在LR图像中,人眼的轮廓被减少到几个像素,这使得很难估计准确的面部结构

解决:我们选择在人眼上形成闭环,通过我们新颖的增强面部边界(例如面部轮廓、眉毛、鼻梁、眼睛和嘴巴轮廓),我们可以有效地建模面部的几何结构。此外,如图3所示,随着人脸图像的空间分辨率降低,人脸地标点可能会沿边界移动。相反,增强的面部边界在处理不同分辨率尺度时仍然保持稳定。由于人脸结构的鲁棒性,我们在FSR网络中选择增强的人脸边界作为人脸结构特征

本文主要提出方法:

(1) 提出方法:

Wuet等人[13]首先在野外面部对齐任务中采用了13条面部边界线。考虑到人脸对齐任务中人脸边界线的优越性,我们设法扩展人脸轮廓表示中人脸边界线的鲁棒性以促进FSR任务。这是因为与固有的连续性相比,面部边界线比纯粹的界标点携带更多的语义引导。在我们的设计中,我们简化了原始的13个面部边界的定义,并删除了模棱两可的定义以适合FSR任务中的LR图像。

图1(g),(h)证实了所提出的11个增强的面部边界的有效性。基于这些考虑,我们设计了一个新颖的FSR框架,即包含三个针对FSR优化的基本模块的多级网络(MSFSR)。三个基本模块是基本预处理模块​​(BPM),边界估计模块(BEM)和边界融合模块(BFM)。另外,提出了从粗到细的监督和跨阶段的快捷连接,以进一步提高MSFSR的性能。

(2)本文主要贡献:

在FSR任务中,是在LR图像估计高质量的面部表征时提出了一种新的面部表征方法----提高面部边界根据语义将面部标志点连接起来形成的,提高脸部边界、连接边界的连续性附加了更丰富的语义信息、并对姿态和变化较大的人脸保持鲁棒性。

  ②提出新的FSR框架,即多级网络(MSFSR),其中包含三个针对FSR优化的基本模块。分别是基本预处理模块(BPM)、边界估计模块(BEM)和边界融合模块(BFM

③为了进一步提高MSFSR的性能,还提出了从粗到细的监控和跨级快捷连接。我们引入MSFSR网络来提高重建图像的质量,将增强的面部边界与三个基本模块集成到一个多级网络设计中,并提出了一种从粗到细的监控方法,以数字方式约束不同阶段的面部边界的精细度。

(3)实现效果:该网络不仅能估计出准确的面部表情,而且能有效地提高重建图像的保真度。该方法在定量和定性结果方面都取得了最先进的效果。

3、网络结构

MSFSR模型的流水线如图所示。该网络包括三个独立的模块:基本预处理模块(BPM)、边界估计模块(BEM)和边界融合模块(BFM)。

图1 建立的MSFSR模型。“BPM”负责放大LR输入的空间分辨率。“BEM”从先前的输出中提取增强的面部边界,而“BFM”将来自“BPM”的输出与BEM增强的面部边界组合在一起,以生成超分辨率图像。绿线表示不同阶段之间的快捷连接。橙色箭头表示加强了对面部边界的监督

此外,我们引入剩余通道注意块如图2

图2 RCAB的设计。要素地图通道上的权重由卷积图层计算。它们会自动调整权重

①基本预处理模块(BPM)。BPM的结构如图3所示,其作用是提高LR输入的空间分辨率。在BPM设计中,我们使用RCAB优化ESPCN。最后的像素混洗层可以轻松地对设计进行一些更改,以应对不同的因素。此外,BPM使我们的网络能够在端到端的培训和测试中取得成功。
②边界估计模块(BEM)。我们使用堆叠的沙漏结构H直接从第一模块IBPM的输出中预测预定义的K面部边界。预测的K面部边界以热图βi的堆栈形式呈现。
③边界融合模块(BFM)。最后,BFM采用其两分支设计引入了βi和IBPM,并根据这些线索使人脸图像产生超分结果。

图3 (Basic Pre-process Module)BPM通过后期升级设计摆脱了预定义的升级操作,从而提高了网络的效率

(Boundary Estimation Module)BEM估计器在统一框架中直接从面部图像增强了面部边界

(Boundary Fusion Module) BFM则将通道关注的重点放在融合面部边界和特征图上

在本文中还设计了从粗到细的监督,以限制在不同分辨率范围内增强的面部边界的精细度。

图4 由于多阶段FSR网络设计,面部图像的空间分辨率逐步提高。在早期阶段,沙漏的下采样过程将图像尺寸减小到极低的分辨率,从而导致难以估计出精确增强的面部边界。该图演示了从粗到细监管的示例。

4、实验结果

不同的SR方法在8倍放大倍数上的视觉结果。 (a)Ground Truth(b)双三次(c)EDSR(d)URDGN(e)PFSR(f)FSRNet(g)Ours(h)OursGAN。

使用CelebA-HQ,Helen和WFLW数据集以8倍SR对最先进的面部SR方法进行定性和定量比较。

MSFSR: 一种通过增强人脸边界精确表示人脸的多级人脸超分辨率算法(读书笔记)相关推荐

  1. 业内首个!基于移动端增强视频通话画质的超分辨率算法

    在实时互动场景中,视频画质是影响用户互动体验的关键因素,从流畅.标清到高清.超高清等,分辨率更高的图像往往比低分辨率的图像包含更多的细节和信息,给用户的视频互动带来更好的体验,这也促进了用户在实时互动 ...

  2. PULSE:一种基于隐式空间的图像超分辨率算法

    分享一篇 CVPR 2020 录用论文:PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of Generati ...

  3. 一种用于三维物体建模的精确、鲁棒的距离图像配准算法

    论文标题:An Accurate and Robust Range Image Registration Algorithm for 3D Object Modeling 作者:Yulan Guo, ...

  4. 人脸超分辨率阅读论文汇总

    人脸超分辨率论文阅读汇总 1.FSRNet: End-to-End Learning Face Super-Resolution with Facial Priors 2.Deep Face Supe ...

  5. 【公开课预告】:超分辨率技术在视频画质增强领域的研究与应用

     点击上方"LiveVideoStack"关注我们 随着终端大屏化趋势加快,高品质内容供给匮乏将成为互联网在线视频平台遇到的最大问题.因此,以人工智能超分辨率算法提供高分辨率.高画 ...

  6. 图片被遮住一部分能复原吗_一种恢复图像遮挡边界的分层分割方法与流程

    本发明涉及图像处理技术,尤其是涉及一种恢复图像遮挡边界的分层分割方法. 背景技术: 把一幅图像中的边界遮挡部分给分割出来是图像处理领域中的一个热点问题,对目标识别和场景分析的研究具有重要意义. 遮挡推 ...

  7. 翻译 | ORB-SLAM: a Versatile and Accurate Monocular SLAM System(ORB-SLAM:一种通用的(全能的)精确的单目SLAM系统)

    博主github:https://github.com/MichaelBeechan 博主CSDN:https://blog.csdn.net/u011344545 ORB-SLAM:一种通用的(全能 ...

  8. 几种数据增强:Mixup,Cutout,CutMix 和yolov4中的 Mosaic

    作者:RayChiu_Labloy 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 目录 1.几种数据增强的比较 2.What does model learn with ...

  9. AutoAugment中16种数据增强方法可视化直观展示

    在AutoAugment: Learning Augmentation Strategies from Data这篇论文中,作者提到使用强化学习的方式训练Controller RNN来学习良好的数据增 ...

最新文章

  1. linux resouce,platform_device和platform_driver驱动的关系
  2. pytorch 笔记:gather 函数
  3. php pdo连接oracle乱码,php pdo oracle中文乱码的快速解决方法
  4. 考虑用Task.WhenAll
  5. 报错型sql注入原理分析
  6. leetcode457. 环形数组循环
  7. java aop设计_Spring4.x基础配置(三):Spring AOP
  8. Atitit.研发管理---TOGAF架构跟 (ADM开发方法)总结
  9. SQL Server查询语句
  10. 软件技术专业的简历编写记录
  11. python二级题库(百分之九十原题) 刷题软件推荐
  12. 语音处理:霍夫曼编码算法原理分析
  13. 学习微信小程序开发框架之了解JavaScript
  14. 不撞南墙不回头——浅谈深度优先搜索(DFS)
  15. 链路聚合(eth-trunk)
  16. 复习DOS及批处理命令
  17. 判断两个无环单向链表/有环单向链表是否相交,并返回相交节点
  18. 【毕业设计】基于SSM的酒店客房信息管理系统 - java web
  19. JOJOの奇妙前端冒险(第一部) | 寻找C站宝藏
  20. 活用泛型来统一操作近亲数据结构

热门文章

  1. Kubernetes 网络入门
  2. 第四章 文件的基本管理和XFS文件系统备份恢复 随堂笔记
  3. 【北上广招聘】中企高呈找人:内容营销经理、SEM运营经理、KA客户经理...
  4. 知到大学生心理健康第一章单元测试
  5. Flask结合werobot实现微信公众号自动回复
  6. 22.redis和py_redis
  7. 运营商大数据手机号抓取的功能有哪些
  8. 全角半角符号引发的Entity Framework奇遇记
  9. c:/progra~1是什么??
  10. oc照片库图片的选择处理