Ultra-resolve Face Images by Discriminative Generative Networks

XIn Yu and Faith Porikli

简单地说,这篇文章的思路就是把超分辨率网络SR封装成GAN中的生成器。而且实现了更大倍数的超分辨率。

之前人脸超分辨率方法的弱点

  1. 局限在2x,4x超分辨率
  2. 一旦输入图像分辨率极低,得到的超分辨率结果就很模糊。一些使用landmark的方法无法从极低分辨率图像中获取足够的信息。
  3. 很多方法超分辨率的结果存在伪影。
  4. 部分方法要求训练集和测试集的人脸图像是对齐的,切具有相同的姿态和表情。
  5. 生成超分辨率网络可以获取细节信息,但是与真实人脸差距较大。

论文的主要贡献

  1. 提出了URDGN,可以超分辨率8倍,而输入图像只有
  2. 首个将生成判别网络用语人脸超分辨率的网络,且效果优于其他方法。
  3. 通过使用正则化表明,本文提出的URDGN可以再任何尺寸下进行超分辨率,而突破GAN只能产生固定大小的图像的束缚。
  4. URDGN的训练集不再局限于对齐、同姿势、同表情、同光照,而只需要脸部朝前,且近似对齐(眼睛对齐即可)。

论文提出的主要方法URDGN

首先GAN中生成器的输入是随机噪声z,输出是想要得到的图像,然后判别器区分真实的图像x和,生成器努力想要“瞒”过判别器,判别器努力“识破”。这是GAN的思想,但是GAN生成的图像虽然具有尖锐的细节信息,但如果用在超分辨率上其结果与真实结果有偏差,于是URDGN为了利用GAN的长处,弥补它的不足,设计了一个反卷积网络作为生成器来做超分辨率,其输入是低分辨率图像,设计了一个卷积网络用来做判别器。

其目标函数为:

其中表示高分辨率图像的概率分布,表示低分辨率图像的概率分布,表示高分辨率图像和低分辨率图像的联合密度函数。是交叉熵损失和欧氏距离损失的平衡因子。

下图是URDGN的网络结构图。

网络训练细节

D的训练:

目标函数前两项与D有关,梯度:

是D的参数,D采用RMSprop的方法更新参数,更新公式:

G的训练:

目标函数后两项与G有关,梯度:

是D的参数,G同样采用RMSprop的方法更新参数,更新公式:

D和G的参数更新公式中:是学习率设置为0.001,更次执行完一个epoch,学习率就乘以0.99,是延迟率设置为0.01,设置为,用于防止分母为0,平衡因子设置为100,目的就是为了让G生成更接近真实高分辨率图像,就像论文中提到的一样,目的屙屎超分辨率图像而不是生成一个图像。

GAN和URDGN的区别

论文还简单介绍了GAN和URDGN的区别:

  1. GAN有全连接层,而URDGN中没有。因为全连接层可以看做是非线性映射,实验表明没有全连接层的GAN无法生成人脸图像,而在URDGN中,输入的LR图像是有结构的,全连接层这种非线性映射会毁坏这种结构特征,于是URDGN中没有使用全连接层。
  2. GAN的输入时随机噪声,而URDGN的输入时低分辨率人脸图像。
  3. GAN中没有正则化,无法生成与高分辨率图像

如上图:表示的就是去点全连接层的GAN的结果。

实验

数据集

论文采用的CelebA数据集,从CelebA中随机选择16000个对齐的图像,并将其裁剪成,用15000章图像训练,500验证,500测试。将下采样得到的图像作为低分辨率图像。

对比结果

[5]:Liu, C., Shum, H.Y., Freeman, W.T.: Face hallucination: theory and practice. Int. J. Comput. Vis. 75(1), 115–134 (2007)

[7]Yang, J., Wright, J., Huang, T.S., Ma, Y.: Image super-resolution via sparse representation. IEEE Trans. Image Process. 19(11), 2861–2873 (2010)

[10]Yang, C.Y., Liu, S., Yang, M.H.: Structured face hallucination. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition,pp. 1099–1106 (2013)

[16]Dong, C., Loy, C.C., He, K.: Image super-resolution using deep convolutional networks.IEEE Trans. Pattern Anal. Mach. Intell. 38(2), 295–307 (2016)

[8]Ma, X., Zhang, J., Qi, C.: Hallucinating face by position-patch. Pattern Recogn.43(6), 2224–2236 (2010)

下图有表情的人脸的实验对比结果。

下图是未对齐的人脸的实验对比结果

下图是不同姿势的实验对比结果:

下图是脸部朝前的实验对比结果:

论文方法的局限

如果图像出现遮挡,论文的方法无法超分辨率被遮挡的部分,但是遮挡不影响对未遮挡部分的超分辨率。如下图

论文的方法不受人脸平移的影响,但是对旋转非常敏感。论文计划添加一个放射函数估计器,根据估计器的参数调整GAN的参数,以解决这个问题。

URDGN:Ultra-resolve Face Images by Discriminative Generative Networks相关推荐

  1. 论文阅读-3D Fetal Skull Reconstruction from 2DUS via Deep Conditional Generative Networks

    基于深度条件生成网络的二维超声三维胎儿颅骨重建 -----3D Fetal Skull Reconstruction from 2DUS via Deep Conditional Generative ...

  2. Optimizing the Latent Space of Generative Networks

    1. 概述 提出了一种称之为Generative Latent Optimization(GLO)的方法,与GAN相比,免去了生成对抗训练的策略,取得了类似GAN的效果 2. GAN的介绍 GAN有三 ...

  3. Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network论文翻译——中英文对照

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 声明:作者翻译论文仅为学习,如有侵权请联系作者删除博文,谢谢! 翻译论文汇总:https://github.com ...

  4. Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network论文翻译——中文版

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 声明:作者翻译论文仅为学习,如有侵权请联系作者删除博文,谢谢! 翻译论文汇总:https://github.com ...

  5. GAN网络学习入门之:A Beginner's Guide to Generative Adversarial Networks (GANs)-翻译

    译自:https://wiki.pathmind.com/generative-adversarial-network-gan 你可能认为编码者不是艺术家,但是编程是一个极具创意的职业.它是基于逻辑的 ...

  6. (nips2014)Generative Adversarial Nets by Ian Goodfellow review

    ref 初识GAN https://ccc013.github.io/2018/12/10/GAN%E5%AD%A6%E4%B9%A0%E7%B3%BB%E5%88%97-%E5%88%9D%E8%A ...

  7. Generative Adversarial Networks overview(3)

    Libo1575899134@outlook.com Libo (原创文章,转发请注明作者) 本文章主要介绍Gan的应用篇,3,主要介绍图像应用,4, 主要介绍文本以及医药化学其他领域应用 原理篇请看 ...

  8. ECCV2022论文列表(中英对照)

    Paper ID Paper Title 论文标题 8 Learning Uncoupled-Modulation CVAE for 3D Action-Conditioned Human Motio ...

  9. ICML 2018 paper(oral)

    参考链接 icml 2018 oral Paperlist Optimal Tuning for Divide-and-conquer Kernel Ridge Regression with Mas ...

  10. The Building Blocks of Interpretability

    Interpretability techniques are normally studied in isolation. We explore the powerful interfaces th ...

最新文章

  1. View的Touch事件分发(二.源码分析)
  2. 黄聪:BackGroundWorker解决“线程间操作无效: 从不是创建控件的线程访问它” (C# VS2008)...
  3. oracle正则表达式截断,在oracle中使用正则表达式截取字符串
  4. 【洛谷】【动态规划/二维背包】P1855 榨取kkksc03
  5. es6-Set与Map
  6. 用g.raphael.js高速绘制饼图、柱状图、点状图、折线图(上)
  7. 分库分表的几种常见形式以及可能遇到的难题--转
  8. Express中错误处理中间件的使用
  9. 数据结构与算法 / 概念
  10. win7升级win10正式版_win7告退在即,如何升级到win10?
  11. VS插件的开发 - Visual Studio Addin
  12. 聊聊并发——生产者消费者模式
  13. 信息学奥赛一本通 1061:求整数的和与均值 | OpenJudge NOI 1.5 04
  14. 添加删除桌面用户ubuntu10.10
  15. 重庆计算机考试准考证打印入口,重庆西南大学计算机等级考试准考证打印入口...
  16. 若依将ehcache改为redis缓存详细整合步骤
  17. Linux樹目錄詳解
  18. C#的6种常用集合类大比拼(转)
  19. QQ配置文件解密(转)
  20. 1.供给与需求分析(交通流理论)

热门文章

  1. 拍拍二手重装上阵,京东剑指闲鱼胜算几何?
  2. 机器学习初学者入门实践:怎样轻松创造高精度分类网络
  3. netty高级篇(3)-HTTP协议开发
  4. LINUX 查看分区UUID的两种方法
  5. 在 Visual Studio 调试器中指定符号 (.pdb) 和源文件
  6. ibatis mybatis sql语句配置 符号不兼容 大于号 小于号
  7. java实现单链表的增加,删除,查找,打印
  8. nginx 正则 结尾 配置_nginx配置proxy_pass中url末尾带/与不带/的区别详解
  9. html合并单元格_HTML基础2
  10. php limit计算结果,php – 在应用LIMIT之前获取结果数量的最佳方式