摘要:

通过基于物理的解缠结和对抗训练实现感知图像去雾

以前的方法使用各种手工设计的先验或通过对合成模糊图像对的有监督训练来解决这个问题。然而,在实践中,预定义的先验很容易被违反,并且配对的图像数据无法用于监督训练。 在这项工作中,我们提出了一个端到端的去雾网络,它只使用非配对监督来生成真实感的无雾图像。 我们的方法通过引入基于物理模型的解纠缠和复原机制来缓解配对训练的约束。 采用多尺度对抗性训练生成感知无雾图像。 在合成数据集上的实验结果表明,在PSNR、SSIM和CIEDE2000方面,我们与现有方法相比具有更好的性能。 通过对我们收集的HazyCity数据集的纯天然无霾和朦胧图像的训练,我们的模型可以产生更有感知吸引力的除霾结果

去雾方法:

一个有效且实用的去雾模型应该能够在不使用配对监督的情况下学习从有雾图像到无雾图像的映射。此外,去雾图像应该在感知上与人类感知的无雾图像一致。在本文中,提出了分离去雾网络,这是一种满足上述标准的新型弱监督模型。如图1所示,我们的模型引入了一种基于物理模型的解纠缠和重建机制:首先将模糊图像输入通过三个生成器网络解开为场景辐射度、介质传输和大气光三个隐藏因素;然后将这些因素结合起来,使用大气散射模型重建原始输入。隐藏因素也受到对抗性损失和正则化的限制。整个框架与 CycleGAN和AIGN (Tung et al. 2017) 具有相似的想法,通过利用来自后向/渲染过程的反馈信号来缓解配对训练的限制。与他们的方法相比,我们的解缠结机制使我们能够对不同的隐藏因素引入单独的约束并学习物理上有效的模型。

我们提出的解纠缠去雾网络为现实场景中的图像去雾提供了一种新的视点,我们称之为感知去雾。 以往的方法将雾霾去除视为一个图像恢复过程,并试图完全恢复原始场景的辐射,不同于此,我们的目标是生成视觉上令人愉快的无雾图像。 事实上,在大多数实际场景中,还原真实的场景亮度不仅具有挑战性,而且没有必要。 首先,室外场景的图像可以包含异质大气、复杂场景和乱集资照度(见图4中的示例),这使得对真实介质传输的估计不可靠。 其次,彻底去除阴霾会造成不自然的图像,因为阴霾的存在是人类感知深度的线索(He,Sun和Tang 2011)。 因此,我们的目标是产生感知上令人满意的去雾效果,符合人类感知的无雾图像的分配。

主要贡献:

  • 我们提出了一种新的基于解纠缠网络的图像解纠缠方法,该方法通过对抗过程训练并执行基于物理模型的解纠缠。
  • 我们为图像去雾研究收集了一个具有挑战性的数据集,其中包含 800 多张自然朦胧图像和 1000 张户外场景的无雾霾图像。
  • 我们通过在合成和真实图像数据集上的大量实验来评估感知图像的去雾

提出的方法:

我们的方法不依赖任何外部算法或配对数据进行额外监督,分离的成分仅受对抗性损失和先验知识的约束。

我们将感知图像去雾问题转化为一个未配对的图像到图像的转换问题,其中源域(hazy)中的图像映射到目标域(hazy-free),没有任何配对信息。这个问题具有挑战性,因为如果没有成对的监督,模型可以学习到目标域的任意映射,并且不能保证将单个输入映射到其期望的输出。之前的工作通过引入一个额外的反向生成器来生成原始输入来解决这个问题。虽然这些方法可以应用于我们的任务,但我们发现它们无法解决霾带来的模糊性,即它们无法区分光衰减的效果和原始场景的辐射。为了更好地模拟模糊图像的形成,我们提出通过引入基于物理模型的解纠缠和重建来解决未配对的图像对图像问题。

图1(b)显示了我们方法的总体框架。考虑到两组未配对图像(模糊和无模糊)作为(弱)监督,我们的目标是学习一个模型,该模型可以在物理模型的约束下将模糊输入分解为隐藏因素。隐藏因素进一步受到对抗性训练程序和基于先验的正则化的约束。我们的方法有利于非配对训练,原因如下:1)它可以对不同的分离因素进行单独的约束/先验。2) 可以联合优化不同的生成器,以实现最佳解纠缠。3) 重建过程在物理上是有效的,并对生成过程提供了更严格的约束。

受大气散射模型的启发,将输入的模糊图像分解为三个隐藏因子:场景辐射、透射图和全球大气光。然后使用公式组合这三个分量,以重建原始模糊图像。形式上,让我们将表示为分别对应于hazy图像和haze-free图像的两组训练样本。我们的模型首先使用三个生成器执行解纠缠:。然后将这三个分量合成以重构原始输入:,其中表示元素乘法。

我们的目标函数包含三项:重建损失、对抗损失和正则化损失。我们使用传统的L1损耗作为重建损耗,以鼓励像素级的一致性和更少的模糊(与L2损耗相比):

为了生成令人愉悦和无雾的图像,我们为中间输出 引入了多尺度对抗训练程序。具体来说,当训练多尺度鉴别器 D 以检测图像是“真实的”还是“假的”时,生成器 被训练为“欺骗”鉴别器。与生成对抗网络 (GAN) 中的设置相同,这里的“真实”数据是指从目标域采样的图像(无雾图像),“假”数据是指从源域(模糊图像)。经典的 GAN 损失可以描述为:

我们使用补丁级鉴别器来区分真假图像。与他们选择妥协的感受野大小(RFS)来平衡结果的清晰度和伪影之间的权衡的方法不同,我们建议使用结合了局部鉴别器(小 RFS)和全局鉴别器的多尺度鉴别器。鉴别器(大 RFS)。虽然局部鉴别器专注于对有利于纹理/样式识别的高频结构进行建模,但全局鉴别器可以结合更多的全局信息并减轻平铺伪影。我们的多尺度鉴别器结合了两个世界中最好的,如图 2 所示。

因此,我们的多尺度对抗性损失为:

解开的无雾图像的生成由先前的对抗性损失进行了正则化。对于解开的传输图,我们引入先验作为正则化。在各种已知的先验中,我们研究了简单而有效的选择:介质传输图的平滑度。在数学上,我们使用 t 的传统总变化作为正则化损失:

我们最终的目标函数是:

我们通过以下方式优化目标:

 恢复无雾图像

使用训练好的模型,我们可以将一张模糊图像解开为三个对应的分量,并获得两个恢复的场景辐射。

第一个是直接从生成器 的输出中获取,我们记为。第二个,表示为 ,可以使用估计的透射图 和大气光 根据等式(1)的重新表述获得:

继 (Cai et al. 2016) 之后,我们在恢复期间对估计的传输图 ^t 应用引导图像滤波 (He, Sun, and Tang 2013),以引入进一步的平滑整形边缘。

我们解开的生成器可以提供去雾过程的不同观点。具体来说,生成器 GJ 倾向于生成具有更多纹理细节和感知上更清晰的雾霾图像,因为它被训练为学习到无雾图像的映射。然而,由于上采样和不稳定的对抗训练,GJ 的输出可能包含不希望的伪影,并且容易受到模糊区域中噪声的影响。另一方面,由于使用了引导图像过滤,从生成器 Gt 的输出导出的 ^Jt 更加平滑和视觉上令人愉悦。但这可能导致低估图像的雾度水平。

使用这两个从不同方面恢复的场景辐射,我们通过混合两个恢复的图像来生成我们的输出无雾图像

混合对雾度较小的区域保留了更多的细节,并保证了雾度较重的区域内的平滑度。在消融研究中分析了不同的恢复选择。除非另有说明,否则我们在所有实验中报告恢复的 的结果。

实验结果

NYU-Depth 数据集上的平均 PSNR、SSIM 和 CIEDE2000 结果

平均PSNR,SSIM和CIEDE2000在跨区Middlebury数据集上的结果。

Towards Perceptual Image Dehazing by Physics-Based Disentanglement and Adversarial Training(2019)相关推荐

  1. Complex Spectral Mapping With Attention Based Convolution Recurrent Neural Network(省略)---论文翻译

    基于注意力的卷积递归神经网络的复杂频谱映射,用于语音增强 Liming Zhou1, Yongyu Gao1,Ziluo Wang1,Jiwei Li1,Wenbin Zhang11CloudWalk ...

  2. Trunk Based Development介绍——TBD Workflow(一)

    前言 在介绍TBD Worflow的部署之前,我们先来看一下什么是TBD,以下文章参考 Trunk Based Development: Introduction 简介 TBD准确的说不是一种&quo ...

  3. 【论文阅读】Bi-Directional Cascade Network for Perceptual Edge Detection(2019)

    论文地址 代码地址 He, J., Zhang, S., Yang, M., Shan, Y., & Huang, T. (2019). Bi-directional cascade netw ...

  4. hive SQL Standard Based Hive Authorization 权限自定义(二)

    为什么80%的码农都做不了架构师?>>>    思考 看了hive配置权限管理的方式之后发现,其实之前修改的Operation2Privilege是为权限管理类SQLStdHiveA ...

  5. A Novel Lip Descriptor for Audio-Visual Keyword Spotting Based on Adaptive Decision Fusion(2016)

    摘要 当应用于噪声剧烈变化的现实环境时,关键词识别仍然是一个挑战.在最近的研究中,由于视觉语音不受噪声的影响,视听一体化方法已显示出优越性. 然而,在视觉语音识别中,个体的话语习惯会导致混淆和错误识别 ...

  6. Physics CG:菲涅尔(fresnel)反射

    这一篇是物理学CG的开篇,其实我多开了一个分类也是心理无奈的,自身水平有限,而很多物理图形学知识积累太少,有些甚至根本没学过.然而高级图形学知识中,或者说高级图形着色效果中,很大一部分是基于" ...

  7. 论文阅读:Fast Single Image Dehazing Using Saturation Based Transmission Map Estimation

    代码在文末给出,因为只有一个py文件.该代码是作者给出的. 目录 1. 提出的方法 1.1 大气散射模型 1.2 传输率图公式 1.3 传输率图估计 1.4 估计场景辐射得饱和度 1.5 处理颜色偏色 ...

  8. pandas使用select_dtypes函数移除dataframe中指定数据类型的数据列(exclude columns based on the data type in dataframe)

    pandas使用select_dtypes函数移除dataframe中指定数据类型的数据列(exclude columns based on the data type in dataframe) 目 ...

  9. 数字图像处理实验(1):PROJECT 02-01, Image Printing Program Based on Halftoning

    实验要求: Image Printing Program Based on Halftoning Objective: To know in principle what is "halft ...

最新文章

  1. OpenAI 以 10 亿美元出售「灵魂」,网友热评不再「Open」
  2. Java多线程系列--“基础篇”10之 线程优先级和守护线程
  3. JQ和Js获取span标签的内容
  4. 文件操作函数java_java中文件的操作
  5. Python - 字符串
  6. 写给新入行程序员的10条建议
  7. 通过aws部署推荐系统_通过AWS Elastic Beanstalk轻松进行Spring Boot部署
  8. Flink万字干货:4大发展方向,美团、快手应用实践(PDF下载)
  9. 诗与远方:无题(二十九)
  10. stylish和Tampermonkey样式及脚本
  11. Java RSA加密(一)--BCD输出
  12. 最好的网页浏览器_如何实现整个网页的完整截图
  13. 线性判别用于提取词向量_历年试题公开 | 2017级线性代数(I)期末试题
  14. 第四次作业3 四则运算试题生成
  15. 光滑曲线_光滑流形初步(2)——切向量与微分
  16. 8K V-by-One LVDS信号发生器
  17. 三体 III 中的思想实验:死神永生(上)
  18. 2023年天津仁爱学院专升本化学工程与工艺对口专业限制目录
  19. 计算机土木工程专业,土木工程专业需要什么样的电脑配置?
  20. 快速缓解过敏的简单技巧

热门文章

  1. 淘淘商城第53讲——商品搜索之dao层开发
  2. 新手必看,HTML和CSS快速简单入门
  3. react使用字体图标iconfont
  4. 软健盘 enter键的替换
  5. Raft 协议原理详解,10 分钟带你掌握
  6. 【新书速递】重磅!混沌工程权威指南
  7. [ACTF2020 新生赛]Upload 1
  8. EsgynDB之TRIM函数
  9. Java中的引用概念
  10. 如何在日常生活修行六度与四摄行?