Real-ESRGAN论文阅读

目录

  • Real-ESRGAN论文阅读
    • Abstract
    • Introduction
      • 图像退化过程模拟重建
        • 退化过程
        • Real-ESRGAN解决方案
      • Discrimination结构改变
        • Real-ESRGAN解决方案
    • Related Work
    • Methodology
      • Classical Degradation Model
      • High-order Degradation Model & Ringing and overshoot artifacts
      • Networks and Training 训练
        • 训练
    • Experiments

Abstract

尽管当前有很多在超分领域的工作,但是应用的效果并不好,比如ESRGAN。本文提出Real-ESRGAN,使用一个高阶的模拟退化以及带有SN正则的U-NET判别器,能够更好的模拟真实世界复杂的图像退化过程。通过大量的实验也表明,它的视觉效果比以前的方法在各种数据集上表现的都好。

Introduction

图像退化过程模拟重建

单图像超分(SR):其目的是从低分辨率(LR)重建一个高分辨率(HR)图像。SRCNN开创了深度学习在SR领域的发展,但是之后的所有工作都是通过一个双边降采样核获得LR数据后进行学习,现实生活图像的退化无法用简单的双边采样模拟重建的。(cv2.resize((),bicubic))
REAL-ESRGAN目标是通过生成更接近现实生活中的LR图像去重建HR图像,从而获得更好的泛化性能。

退化过程

真正的复杂退化通常来自于不同退化过程的复杂组合,如照相机成像系统、图像编辑和互联网传输。例如,当我们用手机拍照时,照片可能会有几个退化情况,如相机模糊、传感器噪声、锐化伪影和JPEG压缩。
比如:用户A用手机拍照,将照片上传到一个社交媒体应用程序,图片会进行压缩和噪音的添加;之后用户B进行图片下载,又会进行压缩和添加噪音;用户B将图片转发给用户C,在互联网传输的过程之中图像进一步退化。真实情况只会更加复杂。

Real-ESRGAN解决方案

这促使经典的“一阶”退化模型扩展到现实世界退化的“高阶”退化模型。Real-ESRGAN使用二阶退化模型,二阶即简单又有效,并且在退化过程中加入了sinc滤波器来模拟常见的振铃伪影。`

artifacts(振铃伪影):图像的灰度剧烈变化处产生的震荡,就好像钟被敲击后产生的空气震荡。振铃伪影通常出现在图像的锐利边缘附近以伪边缘形式出现。如图:
很明显看到,在梯度变化剧烈,比如第一幅图的黑色出现的地方,周围出现白色的一圈,这就是振铃伪影。

Discrimination结构改变

图像的退化过程变得复杂,就要求判别器能够拥有更强大的能力。

Real-ESRGAN解决方案

使用U-Net代替VGG,因为需要梯度反馈提供更加强大的局部细节信息来判断fake和real图像,而U-Net输入输出是一样的大小,结合U-Net的网络结构,能够提供更多的信息。
但是U-Net的结构和复杂的退化也增加了训练的不稳定性。所以Real-ESRGAN使用SN正则和EMA帮助稳定训练。

spectral normalization (SN) regularization:(简单做介绍)我们知道损失函数缺什么就加什么样的正则项。SN正则的目的就是让模型具备更好的泛化性能,让模型朝着目标点附近平坦的地方前进。
EMA(指数移动平均):【炼丹技巧】指数移动平均(EMA)的原理及PyTorch实现 - 知乎 (zhihu.com)可以看这篇文章的解释

Related Work

这部分主要讲了SR领域,显式建模、隐式建模的方法以及退化模型。

Methodology

退化模型

Classical Degradation Model

这一部分讲了退化模型的各个部件,以及实现。

  • Blur:使用广义高斯模糊和高原状分布概率分布为 1 n e x p ( − 1 2 ( C T ∑ − 1 C ) β \frac{1}{n}exp(-\frac{1}{2}(C^T\sum^{-1}C)^\beta n1​exp(−21​(CT∑−1C)β、 1 n 1 1 + ( C T ∑ − 1 C ) β \frac{1}{n}\frac{1}{1+(C^T\sum^{-1}C)^\beta} n1​1+(CT∑−1C)β1​,所以在代码里面会看见一个sharpen parameter(β)。其中,Σ为协方差矩阵;C是高斯分布采样出来的坐标;N是归一化常数。
  • noise:加噪音,可以加高斯噪音、泊松噪音(泊松噪声的强度与图像强度成正比,不同像素处的噪声是独立的。)
  • Resize (Downsampling):下采样,最近邻插值、area resize、双线性插值和双边插值,由于最近邻插值引入了错位问题,排除它,其他随机选择(增加了退化模型复杂度)。
  • JPEG compression:JPEG压缩,使用pytorch的DiffJPEG实现。

High-order Degradation Model & Ringing and overshoot artifacts

主要讲了高阶退化模型如何实现,以及sinc的实现(看退化模型图就够了)

Networks and Training 训练


Real-ESRGAN的generator
generator和ESRGAN基本一致,只在输入提供多个尺度。首先使用pixel-unshuffle来减小空间大小和扩大信道大小,之后进行输入,对应的最开始的网络input_channel也需要进行相应的改变(这部分train的时候没搞懂是怎么train的,论文实验部分也有说每个batch训练必须固定一个scale,所以使用一个training pair pool帮助多样性训练,还是不太懂,回头看源码)。
使用带有SN的U-Net的原因这里不再赘述。

训练

首先,训练了一个具有L1损失的面向PSNR的模型(ESRNet)。所得到的模型用Real-ESRNet进行命名。然后,使用训练过的面向PSNR的模型作为generator的初始化,并结合L1损失、感知损失和GAN损失来训练Real-ESRGAN。(和ESRGAN一致,感知损失使用VGG五层特征图的加权做损失)

Experiments

这部分讲了输入部分-退化模型的参数设置,比如高斯核什么的,还有上面说的感知损失使用了VGG五层的加权,以及training pair pool的设置。还有通过实验发现可以使用锐化过的图像作为gt,能够实现更好的锐度平衡和伪影抑制—Real-ESRGAN+。
实验部分还有很多细节,这里就不说了,可以结合代码看看,毕竟Real-ESRGAN的效果要比ESRGAN以及之前的所有工作都要好太多。

Real-ESRGAN相关推荐

  1. ESRGAN:基于GAN的增强超分辨率方法(附代码解析)

    作者丨左育莘 学校丨西安电子科技大学 研究方向丨计算机视觉 之前看的文章里有提到 GAN 在图像修复时更容易得到符合视觉上效果更好的图像,所以也是看了一些结合 GAN 的图像修复工作. ESRGAN: ...

  2. esrgan_港中文-商汤联合实验室:ECCV2018 PIRM-SR 超分辨率比赛冠军:ESRGAN(已开源)...

    Summary:中科院和京东AI研究院提出:改进SRN人脸检测算法,目前业界最强! Author:Amusi Date:2019-02-09 微信公众号:CVer 原文链接:香港中文大学-商汤联合实验 ...

  3. 图像超分辨率增强ESRGAN运行教程,有数据

    向AI转型的程序员都关注了这个号???????????? 人工智能大数据与深度学习  公众号:datayx ESRGAN是一个较新的的低分辨率转高分辨率的GAN模型,在SRGAN的基础上做了增强. 其 ...

  4. 谷歌colab“几键”运行图像超分辨率模型-ESRGAN,操作详解

    文章目录 1. 准备工作(前提) 2.Colab常用操作 3. git clone 从github 克隆代码 4. 下载数据集(DIV2K) 5. 解压数据 6. 查看代码,运行改名rename.py ...

  5. ESRGAN - Enhanced Super-Resolution Generative Adversarial Networks论文翻译——中英文对照

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 声明:作者翻译论文仅为学习,如有侵权请联系作者删除博文,谢谢! 翻译论文汇总:https://github.com ...

  6. 图像的超分辨率重建SRGAN与ESRGAN

    SRGAN 传统的图像超分辨率重建方法一般都是放大较小的倍数,当放大倍数在4倍以上时就会出现过度平滑的现象,使得图像出现一些非真实感.SRGAN借助于GAN的网络架构生成图像中的细节. 训练网络使用均 ...

  7. 图像超分辨重建领域文献调研(SRCNN SRGAN ESRGAN)

    本文介绍了三篇图像超分辨率重建在深度学习方面的文献 目录 一.SRCNN 二.SRGAN 三.ESRGAN 一.SRCNN 1. 解决问题 在CNN出现之前,传统超分方法是最临近插值.双线性或双三次插 ...

  8. ESRGAN - Enhanced Super-Resolution Generative Adversarial Networks论文翻译——中文版

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 声明:作者翻译论文仅为学习,如有侵权请联系作者删除博文,谢谢! 翻译论文汇总:https://github.com ...

  9. 用超分辨率扛把子算法 ESRGAN,训练图像增强模型

    内容一览:通过硬件或软件方法,提高原有图像的分辨率,让模糊图像秒变清晰,就是超分辨率.随着深度学习技术的发展,图像超分辨率技术在游戏.电影.医疗影像等领域的应用,也愈发广泛. 原创:HyperAI超神 ...

  10. ESRGAN:增强型超分辨率生成对抗网络

    ESRGAN:增强型超分辨率生成对抗网络 做实验需要,做的笔记翻译 文章目录 ESRGAN:增强型超分辨率生成对抗网络 摘要 一.前言 二.实验亮点 总结 摘要 超分辨率生成对抗网络(SRGAN)[1 ...

最新文章

  1. Python读取多个excel文件(删除字段、数据格式转换、dataframe多表合并)并写入ElasticSearch实战(自动创建索引、写入ElasticSearch、探索性数据分析)
  2. 统计计量 | 实证研究中常犯的18个统计学错误, 避坑防雷指南!
  3. Centos6.3下rsync+sersync安装配置笔记
  4. Xorequ(BZOJ3329+数位DP+斐波那契数列)
  5. 160个Crackme018
  6. [置顶] Android开发者官方网站文档 - 国内踏得网镜像
  7. 年终总结 | 2019年人工智能+计算机视觉+深度学习笔记思维导图汇总
  8. iPhone 14 Pro或配备8GB内存:苹果史上开天辟地的升级
  9. Domino下启用SMTP验证及创建允许匿名验证
  10. 用户故事与敏捷方法—估算用户故事
  11. 互联网专用计算机屏保,5款屏保,让你的电脑在闲置时也与众不同。
  12. linux下卸载grads,linux下安装grads
  13. 多核处理器互联网络拓扑结构
  14. 微软“断臂求生”,能实现绝地反击吗?
  15. iis6 增加PHP+MYSQL等时,记得 PHP目录要给EVERYONE权限
  16. 计算机生物学美国直博,Nature:所有博士中,生物学博士收入垫底!
  17. 进程和线程之面试须知
  18. nrf51822 --- 动态修改连接间隔
  19. ROS2-Gazebo仿真
  20. 火车头分页post php,轻松搞定PHPCMS V9火车头采集自动分页

热门文章

  1. mysql行转列简单例子_mysql行转列、列转行示例
  2. 自动化测试工程师应聘要求
  3. 1万元!TP-Link发布Wi-Fi 7挖矿路由器:比RTX 4090快得多
  4. pc端和移动端两套样式在vue中的切换
  5. 微信小程序 - 自定义头部导航栏组件(详解) + iphoneX以上遮挡小黑条适配问题
  6. facebook聊单?SaleSmatly来助力
  7. mysql主从及高可用3
  8. (转) Java多线程学习(吐血超详细总结)
  9. 2020移动apn接入点哪个快_为什么别人的4g网总比你快?手机这个设置没开启,难怪网络...
  10. 武器装备自动测试系统软件ETest