EnlightenGAN:Deep Light Enhancement Without Paired Supervision阅读札记

  论文发表于2021年的TIP。

Abstract

   本文提出了一个高效的无监督生成对抗网络EnlightenGAN,可以在没有弱光/正常光图像对的情况下进行训练。本文从输入本身提取的信息来规范unpaired训练,而不是使用ground truth数据来监督学习,并对低光图像增强问题采用一系列创新技术,包括全局-局部鉴别器结构、自正则化感知损失融合,以及注意力机制。
贡献:
  (1)EnlightenGAN是第一个成功地将unpaired训练引入低光图像增强的工作。这种训练消除了对paired训练数据的依赖,于是可以使用来自不同领域的更多种类的图像进行训练,此外还避免了paired训练数据带来的过拟合问题。
  (2)EnlightenGAN通过施加(i) 全局-局部鉴别器结构处理输入图像中空间变化的光照条件;(ii)自正则化的思想,由自特征保持损失和自正则化注意力机制共同实现。

Method

算法框架图


  本文方法采用注意力引导的U-Net作为生成器,并使用双鉴别器来引导全局和局部信息,还使用自特征保留损失来指导训练过程并保持纹理和结构。

1、 Global-Local Discriminators

  考虑到图像中亮度分布并不均匀,因此所需增强的程度也不相同,为了自适应地增强局部区域,本文提出了一种新颖的全局-局部鉴别器结构,两者都使用PatchGAN进行真假鉴别。即除了图像级全局鉴别器外,还添加了一个局部鉴别器,方法是从输出图像和真实正常光图像中随机裁剪局部块,并学习区分它们是真实的(来自真实图像)还是虚假的(来自输出的增强图像)。
  对于全局鉴别器,本文利用相对鉴别器结构[1],它估计真实数据比假数据更真实的概率,并指导生成器合成比真实图像更真实的假图像。相对鉴别器的标准函数是:

  CCC:鉴别器网络
  xr,xfx_r,x_fxr​,xf​:从真假分布中采样的真实样本和虚假样本
  σσσ:sigmoidsigmoidsigmoid函数二乘GAN (LSGAN)[2]损失
  本文稍微修改了相对鉴别器,用最小二乘GAN (LSGAN) [39]损失替换sigmoidsigmoidsigmoid函数,得到全局判别器DDD和生成器GGG的损失函数为:

  对于局部鉴别器,本文每次从输出图像和真实图像随机裁剪5个patch,采用原始LSGAN作为对抗损失,如下:

2、 Self Feature Preserving Loss

  对于全局鉴别器,针对unpaired的设置,本文通过采用预训练的VGG对图像之间的特征空间距离进行建模的感知损失,来限制输入低光与其增强的正常光输出之间的VGG特征距离。本文称之为自特征保留损失LSFPL_{SFP}LSFP​,定义为:

  ILI^LIL:输入的低光图像
  G(IL)G(I^L)G(IL):生成器的增强输出
  Φ(i,j)Φ_{(i,j)}Φ(i,j)​:从在ImageNet上预先训练的VGG-16模型中提取的特征图,iii表示其第iii个最大池化层,jjj表示第iii个最大池化层之后的第jjj个卷积层
  W(i,j),H(i,j)W_{(i,j)},H_{(i,j)}W(i,j)​,H(i,j)​:提取的特征图的维度
  ⭐默认情况下,本文选择i=5i=5i=5,j=1j=1j=1。
  对于局部鉴别器,对输入和输出图像的裁剪局部patch也通过类似定义的自我特征保留损失LSFPLocalL_{SFP}^{Local}LSFPLocal​进行正则化。
  此外,本文在VGG特征图之后添加实例归一化层,然后再输入LSFPL_{SFP}LSFP​和LSFPLocalL_{SFP}^{Local}LSFPLocal​以稳定训练。训练EnlightenGAN的整体损失函数因此写成:

3、U-Net Generator Guided With Self-Regularized Attention


  通过从不同深度层提取多级特征,U-Net保留了丰富的纹理信息,并使用多尺度上下文信息合成了高质量的图像,故本文采用U-Net作为生成器主干。
  本文进一步为U-Net生成器提出了一种易于使用的注意力机制。对于弱光图像,总是希望增强暗区域而不是亮区域,从而使得输出的图像不会过度曝光也不会曝光不足。注意力机制步骤如下:
  (1)取输入RGB图像的照明通道III,将其归一化为[0,1][0,1][0,1],然后使用1−I1-I1−I(元素差异)作为自正则化注意力图。
  (2)调整注意力图的大小以适应每个特征图,并将其与所有中间特征图以及输出图像相乘。
  自正则化注意力图生成过程如下:

  本文注意力引导U-Net生成器是用10个Convolution block layer实现的,(Convolution block layer = ConvBlock+ConvBlock,ConvBlock = Conv+LeakyReLu+BatchNorm)
  在上采样阶段,将标准的反卷积层替换为一个双线性上采样层和一个卷积层,以减轻棋盘伪影。

Experiment

1、Implementation Details

  EnlightenGAN首先从头开始训练100个epoch,学习率为1e(−4)1e^{(-4)}1e(−4),然后再进行100个epoch,学习率线性衰减为0。使用Adam优化器,batch size设置为32。由于单路径GAN的轻量级设计不使用循环一致性,训练时间比基于循环的方法短得多。整个训练过程在3块Nvidia 1080Ti GPU 上耗时3小时。

2、Ablation Study

3、Comparison With State-of-the-Arts

1)Visual Quality Comparison

2) No-Referenced Image Quality Assessment

  本文采用自然图像质量评估器(NIQE)图像的增强效果(较低的NIQE值表示更好的视觉质量),表I报告了以前工作使用的五个公开可用图像集(MEF、NPE、LIME、VV和DICM)的NIQE结果:

3)Human Subjective Evaluation

  本文从测试集中随机选择23张图像,对每张图像通过LIME、RetinexNet、NPE、SRIE和EnlightenGAN进行增强,再选9名受试者对增强图像打分,打分结果如下:

4)Adaptation on Real-World Images

  本文从BBD-100k集合中选取950张夜间照片(平均像素强度值小于45)作为弱光训练图像,再加上50张弱光图像进行延时测试。然后比较了在不同正常光图像集上训练的两个EnlightenGAN版本,包括1) EnlightenGAN:未对BBD-100k进行任何适应的预训练模型;2) EnlightenGAN-N:EnlightenGAN的域适应版本,它使用来自BBD-100k数据集的BBD-100k低光图像进行训练,正常光图像与EnlightenGAN相同。下图为各种方法的结果比较:

  由于unpaired训练,EnlightenGAN可以很容易地适应EnlightenGAN-N,而不需要新域中的任何监督/配对数据,这极大地促进了其在现实世界中的泛化。

5)Pre-Processing for Improving Classification

  本文选择ExDark数据集的2563张测试集图像,将预训练的EnlightenGAN作为预处理步骤,然后通过另一个ImageNet预训练的ResNet-50分类器。在低光测试集中,使用EnlightenGAN作为预处理将分类准确率从 22.02%(top-1)和39.46%(top-5)提高到23.94%(top-1)和40.92%(top-5)增强后。这提供了一个侧面证据,即EnlightenGAN除了产生视觉上令人愉悦的结果外,还保留了语义细节。

References

[1] A. Jolicoeur-Martineau, “The relativistic discriminator: A key element missing from standard GAN,” 2018, arXiv:1807.00734. [Online]. Available: http://arxiv.org/abs/1807.00734.
[2]X. Mao, Q. Li, H.Xie, R.Y. K. Lau,Z.Wang, and S.P.Smolley, “Least squares generative adversarial networks,” in Proc. IEEE Int. Conf. Comput. Vis. (ICCV), Oct. 2017, pp. 2813–2821.

EnlightenGAN:Deep Light Enhancement Without Paired Supervision阅读札记相关推荐

  1. EnlightenGAN: Deep Light Enhancement without Paired Supervision论文阅读笔记

    EnlightenGAN: Deep Light Enhancement without Paired Supervision论文解读 Motivation and introduction 最近在x ...

  2. EnlightenGAN: Deep Light Enhancement without Paired Supervision

    摘要 本文提出了出了一种高效的.无监督的生成对抗网络,称为EnlightenGAN,它可以在不需要低/正态光图像对的情况下进行训练,并被证明在各种真实世界的测试图像上具有很好的通用性.模型使用全局局部 ...

  3. Low-light images enhancement系列:EnlightenGAN:Deep Light Enhancement without Paired Supervision

    众所周知,在暗光增强任务中,要获取到适合的成对的暗光/正常曝光训练图像是非常困难的,甚至是不存在唯一的定义良好的正常曝光ground truth图片.如果用正常曝光的图像去合成带噪点的暗光图像作为训练 ...

  4. 论文详解EnlightenGAN: Deep Light Enhancement Without Paired Supervision

    目录 ouc-DLS 1.Introduction 2. GAN 3.相对判别器 4.网络结构 5.损失函数 实验结果 Conclusion [1]U-Net生成器 下采样的特征 上采样的特征 长连接 ...

  5. 【论文精读】EnlightenGAN: Deep Light Enhancement without Paired Supervision

    目录 贡献 网络架构 全局-局部鉴别器 自特征保持损失 自注意引导的UNet生成器 贡献 1.EnlighttenGAN是第一个成功地将不成对训练引入微光图像增强的工作.这样的训练策略消除了对成对训练 ...

  6. Deep Light Enhancement without Paired Supervision (非配对数据监督学习用于低曝光图像增强)

    Deep Light Enhancement without Paired Supervision 注:本篇总结仅供学习交流 1.Abstracrt 基于深度学习的方法在图像还原和增强方面取得了显著成 ...

  7. A Survey of Deep Learning-based Object Detection论文翻译 + 阅读笔记

    A Survey of Deep Learning-based Object Detection论文翻译 + 阅读笔记 //2022.1.7 日下午16:00开始阅读 双阶段检测器示意图 单阶段检测器 ...

  8. Learning a Deep Single Image Contrast Enhancer from Multi-Exposure Images阅读札记

    Learning a Deep Single Image Contrast Enhancer from Multi-Exposure Images阅读札记   论文发表于2018年的TIP. 1 Ab ...

  9. L2UWE: A Framework for the Efficient Enhancement of Low-Light Underwater Images阅读札记

    L2UWE: A Framework for the Efficient Enhancement of Low-Light Underwater Images Using Local Contrast ...

最新文章

  1. showModalDialog 传值及刷新
  2. 聊聊scalecube-cluster的GossipProtocol
  3. mysql aes java解密_加密/解密的Java函數,如Mysql的AES_ENCRYPT和AES_DECRYPT
  4. js处理富文本编辑器转义、去除转义、去除HTML标签
  5. java - 菱形输出
  6. python中文聊天机器人_[源码和文档分享]基于python的中文聊天机器人
  7. Mac电脑上如何备份Instagram帐户?一款软件轻松帮你搞定
  8. j2ee三大框架个人理解
  9. 论文笔记_S2D.20_2017-ICCV-从单张RGB图像到精确尺度深度图评估的一种双支网络
  10. 易之风门诊收费系统 v1.0 官方
  11. 计算机系统基础(1)
  12. Word编辑中的域代码详解
  13. Cesium 生成和加载离线地形
  14. 不积跬步无以至千里008
  15. 用Git在阿里云下克隆时出现“Please make sure you have the correct access rights and the repository exists”错误
  16. 实习第五天 工作总结
  17. uniapp消息推送(个推-PHP服务端推送)
  18. 漏洞复现:通过CVE-2022-30190上线CS
  19. 数据库仓工具箱及阿里大数据之路--阅读总结
  20. BOM物料清单及生产计划的分解

热门文章

  1. 7-1 大笨钟的心情 (15 分)
  2. 不要假装很努力,努力没有结果的时候,老板不会留你
  3. js监听只读文本框_急急急~~~~~~js radio 文本框只读/只写
  4. 在python中的占位符中、请你选出不属于占位符的选项_知到智慧树My College English Diary作业题库答案...
  5. 分层结构的生活例子_分层架构中的服务层-服务层实战
  6. @Override is not allowed when implementing interface method 解决办法
  7. A572Gr65美标高强度低合金钢板A572Gr65舞阳钢厂A572Gr65定轧A572Gr65对应材质
  8. linuxmint安装mysql_linuxmint安装MySQL
  9. HarmonyOS开发21:CommonDialog抽取工具类
  10. Spring:IOC容器Bean的生命周期的int和destro方法详解(4)