Underexposed Photo Enhancement using Deep Illumination Estimation阅读札记
Underexposed Photo Enhancement using Deep Illumination Estimation
阅读札记
论文发表于2019年的CVPR。
Abstract
∙∙∙ 本文提出一种新的端到端欠曝光图像增强的神经网络,该网络首先估计一个图像到照明的映射,对不同的照明条件进行建模,然后获取照明图来照亮曝光不足的照片。
∙∙∙ 设计了一个损失函数,该函数采用了光照的各种约束和先验,从而可以有效地恢复自然曝光、适当对比度、清晰细节和生动色彩的欠曝光照片。
∙∙∙ 准备了一个新的数据集,3000张曝光不足的图像,每一张都有一个经过专家润色的参考。
Method
图像增强模型
图像增强任务可以看作是寻找映射函数FFF,使得
III:输入的欠曝光图像
I~\tilde{I}I~:输出的增强后图像
在基于Retinex的图像增强方法中,FFF的逆通常被建模为一个照明映射SSS,该函数以像素方式与反射图像I~\tilde{I}I~相乘,生成观察到的图像III:
∗*∗:逐像素的乘法
本文将反射分量I~\tilde{I}I~视为良好曝光的图像,因此将I~\tilde{I}I~作为增强结果,而III作为观察到的欠曝光图像。若SSS已知,可通过F(I)=S(−1)∗IF(I)= S^{(-1)}*IF(I)=S(−1)∗I获得增强结果I~\tilde{I}I~。本文方法中SSS建模为多通道(R, G, B)数据,而不是单通道数据,以提高其建模颜色增强的能力,特别是处理不同颜色通道之间的非线性。
网络结构
首先,通过下采样并将输入编码成特征图,提取局部和全局特征,并通过卷积层将它们连接起来预测低分辨率光照。然后对结果进行上采样,生成全分辨率的多通道照明SSS (hot color map),并将其用于恢复全分辨率增强图像。本文方法训练端到端网络,从具有三个损失分量Lri,Lsi,Lci{L_r^i,L_s^i,L_c^i}Lri,Lsi,Lci的图像对Ii,I~i{I_i,\tilde{I}_i}Ii,I~i学习SSS。
损失函数
从一组NNN个图像对{(Ii,I~i)}i=1N\{(I_i,\tilde{I}_i)\}_{i=1}^N{(Ii,I~i)}i=1N学习光照映射。我们设计了一个损失函数LLL,它由三个分量组成,并在网络训练期间使其最小化。表示为
Lri,Lsi,LciL_r^i,L_s^i,L_c^iLri,Lsi,Lci:损失分量
ωr,ωs,ωcω_r,ω_s,ω_cωr,ωs,ωc:损失分量权重。
(本文取ωr=1,ωs=2,ωc=1ω_r=1,ω_s=2,ω_c=1ωr=1,ωs=2,ωc=1)
重构损失
IiI_iIi和I~i\tilde{I}_iI~i中的所有像素通道归一化为[0,1][0,1][0,1]
()c∈{r,g,b}()_{c∈\{r,g,b\}}()c∈{r,g,b}:像素颜色通道
(Ii)c≤(S)c≤1(I_i)_c≤(S)_c≤1(Ii)c≤(S)c≤1:多通道照明范围约束。(由于F(Ii)=S(−1)∗IiF(I_i )= S^{(-1)}*I_iF(Ii)=S(−1)∗Ii,将IiI_iIi设置为SSS的下界可以确保增强结果F(Ii)F(I_i )F(Ii)中的所有颜色通道上界为1,从而避免了色域之外的颜色,而将1设置为SSS的上界则可以避免错误地使曝光不足的区域变暗。)
平滑损失
根据平滑先验,自然图像中的光照一般是局部平滑的。在本文的网络中采用这个先验有两个优点,首先,它有助于减少过拟合,提高网络的泛化能力。第二,增强了图像的对比度。当相邻像素ppp和qqq具有相似的光照值时,它们在增强图像中的对比度可以估计为∣I~p−I~q∣≈Sp−1∗∣Ip−Iq∣|\tilde{I}_p-\tilde{I}_q |≈S_p^{-1}*|I_p-I_q |∣I~p−I~q∣≈Sp−1∗∣Ip−Iq∣,因为S≤1S≤1S≤1,所以也应该放大。因此照度SSS上的平滑损失定义为
∂x,∂y∂_x,∂_y∂x,∂y:图像空间在水平和垂直方向上的偏导数
ω(x,c)p,ω(y,c)pω_{(x,c)}^p,ω_{(y,c)}^pω(x,c)p,ω(y,c)p:空间变化的(每通道)平滑权值,表示为
LiL_iLi:输入图像IiI_iIi的对数图像
θθθ:控制图像梯度灵敏度的参数(本文取θ=1.2θ = 1.2θ=1.2)
ϵϵϵ:一个小常数,通常设置为0.0001,防止被零除。
直观地说,平滑损失使得具有小梯度的像素上的照明是平滑的,而具有大梯度的像素上的照明是不连续的。值得注意的是,对于曝光不足的图像,图像内容和细节往往较弱。不一致的照明更有可能产生大的梯度。
颜色损失
颜色损失促进增强图像F(Ii)F(I_i )F(Ii)中的颜色与相应的专家渲染图像I~i\tilde{I}_iI~i中的颜色匹配
()p()_p()p:像素
∠(,)∠(,)∠(,):计算两种颜色夹角的算子,将RGB颜色作为三维矢量。
颜色损失为F(Ii)F(I_i )F(Ii)和I~i\tilde{I}_iI~i中的每个像素对颜色向量之间的角度求和。
★本文在其他颜色空间中使用这个简单公式而不是L2L_2L2距离的原因如下:首先,重构损失已经隐式测量了L2L_2L2色差。其次,由于L2L_2L2度量仅用数字度量色差,它不能保证颜色向量具有相同的方向。
消融实验结果
对比第2和第3幅图像,发现通过最小化重构损失,结果细节更清晰,对比度更好。
对比第3和第4幅图像,通过进一步考虑平滑损失,与仅考虑重构损失的结果相比,恢复了良好的图像对比度和更清晰的细节。
对比第4和第5幅图像,可以看出有颜色损失和没有颜色损失的结果相比,色彩更加生动。
训练数据集
本文准备了一个包含3000张图片的新数据集来训练网络,该数据集涵盖了广泛的照明条件、场景、主题和风格,如图所示。本文将数据集中的图像随机分成两个子集:2750张用于训练,其余用于测试。
实现细节
本文在TensorFlow上构建网络,并在NVidia Titan X Pascal GPU上以16个小批处理大小训练它40个epoch。整个网络使用Adam优化器进行优化,固定学习率为10−410^{-4}10−4。在数据增加方面,随机裁剪512×512的patch,然后对所有patch进行随机镜像、调整大小和旋转。下采样输入具有固定的256×256分辨率。编码器网络是一个预先训练的VGG16。局部特征提取器包含两个卷积层,全局特征提取器包含两个卷积层和三个全连通层。使用基于双边网格的模块对输出进行上采样。
Experiment
定性结果
定量结果
Conclusion
局限性
如图所示,本文方法无法恢复到马体的细节,因为在原始图像中该区域几乎是黑色的,没有任何纹理痕迹;而对于下方的人脸图像,本文方法在增强结果中没有清除噪声。
未来工作
未来工作是在本文提出的网络中加入去噪模块,并将本文方法扩展到处理视频。另一个方向是利用场景语义分析和图像合成技术解决近黑色区域。
★ 代码和数据集可以在https://github.com/wangruixing/DeepUPE 上找到。
Underexposed Photo Enhancement using Deep Illumination Estimation阅读札记相关推荐
- L2UWE: A Framework for the Efficient Enhancement of Low-Light Underwater Images阅读札记
L2UWE: A Framework for the Efficient Enhancement of Low-Light Underwater Images Using Local Contrast ...
- Dual Illumination Estimation for Robust Exposure Correction阅读札记
Dual Illumination Estimation for Robust Exposure Correction 阅读札记 论文发表于2019年的CGF. Abstract 本文方法主要 ...
- Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement
Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement 论文链接:https://arxiv.org/abs/2001 ...
- 二维码提升对比度文献调研(2)--Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement
简介 论文 (期刊和发表时间) Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement (CVPR 会议 2020) ...
- 【论文阅读】Phase-aware speech enhancement with deep complex U-net
Phase-aware speech enhancement with deep complex U-net AI课作业要求,所以是用英文写的 Source Summary Idea This pap ...
- EnlightenGAN:Deep Light Enhancement Without Paired Supervision阅读札记
EnlightenGAN:Deep Light Enhancement Without Paired Supervision阅读札记 论文发表于2021年的TIP. Abstract 本文提 ...
- Low-Light Image and Video Enhancement Using Deep Learning: A Survey(论文阅读)
(2021_TPAMI)Low-Light Image and Video Enhancement Using Deep Learning: A Survey 本文是南开大学程明明与南洋理工大学C ...
- 基于双光照估计的曝光校正: Dual Illumination Estimation for Robust Exposure Correction
Dual Illumination Estimation for Robust Exposure Correction [pdf] 目录 Abstract 1. Introduction 3. Our ...
- Learning a Deep Single Image Contrast Enhancer from Multi-Exposure Images阅读札记
Learning a Deep Single Image Contrast Enhancer from Multi-Exposure Images阅读札记 论文发表于2018年的TIP. 1 Ab ...
- 【论文翻译】Distort-and-Recover: Color Enhancement using Deep Reinforcement Learning
ABSTRACT: 本文提出--人类修图是按照步骤逐渐进行的序列,于是用MDP建模,训练agent得到一个最优的动作序列.此外,我们提出了一种"失真-复原"训练方案,只需要高质量图 ...
最新文章
- 2022-2028年中国新能源公交车行业深度调研及投资前景预测报告
- Microsoft Build 2015
- 图像处理经典图片Lena背后的故事
- 2个月精通Python爬虫——3大爬虫框架+6场实战+分布式爬虫,包教包会
- 威尔士柯基犬,计算机视觉,以及深度学习的力量
- LabelImg操作及快捷键
- arXiv 2019 《DCA: Diversified Co-Attention towards Informative Live Video Commenting》论文笔记
- 我所了解的Chrome
- Anker—工作学习笔记
- 漫步微积分三十——定积分的性质
- Swagger原理解析
- 视图层、业务逻辑层、数据访问层及实体层的关系(入门)
- 通用程序算法和数据结构_了解通用数据结构
- Failed to execute goal org.apache.maven.plugins:ma
- 电子测量-实战:电压放大器的设计与测试
- 【C++错误处理】no matching function for call to transform
- CPU执行程序的原理(简化过程)
- EPICS教程1 -- 在Linux/UNIX/DARWIN(MAC)上安装
- Buffer(缓冲器)
- android 输入法更换_详解安卓手机输入法和键盘切换方式的教程
热门文章
- ant.vue富文本编辑器_基于Vue.js 2.0和shimo Docs样式的富文本编辑器
- 一行代码就能随意修改网页内容
- Flutter 3.0 发布啦~快来看看有什么新功能-2022 Google I/O
- POJ 3626 Mud Puddles (BFS)
- 台式计算机 按键盘字母键 没反应6,电脑键盘失灵后的解决办法
- html隐藏不占位置,css中隐藏不占空间怎么设置?
- 洲际酒店集团加速布局西部世界,全力打造高品质中国山地旅游
- hdu4415 Assassin’s Creed (贪心)
- 数字系统设计, 8个经典计数器电路方案合辑
- ERP软件高效排产计划:如何解决企业排产难题