Underexposed Photo Enhancement using Deep Illumination Estimation

基于深度学习优化光照的暗光下的图像增强

论文地址:Underexposed Photo Enhancement using Deep Illumination Estimation

暗光拍照也清晰,这是手机厂商目前激烈竞争的新拍照目标。

提出基于深度学习优化光照的暗光下的图像增强模型,用端到端网络增强曝光不足的照片。

而且不是像以前的工作那样,直接学习图像到图像的映射,而是在新网络中引入中间照明,将输入与预期的增强结果相关联,增强网络从专家修饰的输入/输出图像学习复杂的摄影调整的能力。在此模型的基础上,构造了一个对光照采用约束和先验的损失函数,结果证明,新算法模型,效果超过了市面上一众当红的多摄多硬手机

传统夜景图像增强算法大致可以分为几个方面: 直方图均衡化(Histogram equalization) ,这种方法简单的利用了图像整体的统计性质,通常不能对复杂场景达到理想效果。

基于Retinex理论的增强算法,通常只能用单通道进行光照优化,颜色无法很好地回复,在光照复杂的情况下还容易出现过曝的现象。

这些传统方法还容易在增加图像亮度的同时,放大噪声等瑕疵,影响图像质量。

基于深度学习的方法,通常是直接训练回归(regression)模型,由于数据本身的特性,这种方法得到的结果通常清晰度、对比度比较低,而且会有一些人工痕迹。

效果图

提出了一种新的端到端图像增强网络。特别地,没有直接学习图像到图像的映射,而是设计网络,首先估计一个图像到光照的映射来建模各种光照条件然后使用光照映射来照亮曝光不足的照片。此外,为了降低计算成本,我们采用了基于双网格的上采样并设计了一个在光照上采用各种约束条件和先验的损失函数,使我们能够有效地恢复自然曝光、对比度合适、细节清晰、色彩鲜艳的低曝光照片。

方法

图像增强的任务可以被看作是寻求一个映射函数

,这样
就是我们想要的图像,由输入图像
增强得到
,最近基于Retinex方法的图像增强,
的逆函数通常被建模为光照映射S,它与反射率图像
以像素级的方式相乘,生成所观察到的图像

这里S建模为RGB三通道是为了增强其对颜色增强的建模能力,特别是对不同颜色通道的非线性处理能力。

是观察图像,
是增强后的图像,因此只要解得
的近似解
即可。为什么这么做有效呢?

因为自然图像的光照图有着相对简单的先验,因此使用光照图做中介可以有效应对各种光照情况,同时也可以通过对光照图进行调整,实现个性化增强,例如可以使用局部平滑的光照图增加对比度

网络架构

网络分成了 全分辨率分支低分辨率分支 。其中低分辨率分支用于学习到全图光照的整体信息,低分辨率图像的使用,有助于增大网络感受野,提高算法速度。

低分辨率分支的结果将会传递给高分辨率网络分支,用于重建全分辨率下的亮度图,并最终得到增强后的图像。

损失函数

从N对图片

学习照明映射,学习出S然后增强图像
,在网络训练过程中,我们设计了一个由三个部分组成的损失函数
,并将其最小化。它表示为:
是是三个部分的损失,
是相应部分的权重

Reconstruction Loss

为了得到预测的S,我们定义

误差度量来测量重建误差为:

其中,

中的所有像素通道归一化为[0,1],
表示像素颜色通道,
是多通道光照范围约束。因为
,将
设为
的下界,确保增强结果
中的所有颜色通道(上界)都有一个上界,因此要避免超出色域的颜色,而将1设置为S的上界可以避免错误地使曝光不足的区域变暗。

Smoothness Loss:

根据先验光滑性,自然图像中的光照一般为局部光滑。在我们的网络中采用这种优先级有两个优点。首先,它有助于减少过度拟合,提高网络的泛化能力。其次,它增强了图像的对比度。当相邻像素点p和q的光照值相似时,它们在增强图像中的对比度可以估计为

,它也应该被放大,因为
。因此,我们将图3中预测的全分辨率光照S的平滑度损失定义为:

其中对所有像素的所有通道(c)求和,

为图像空间水平方向和垂直方向的偏导数,
为空间变化(每个通道)的平滑权值,表示为:

这里,

是输入图像
的对数,
是控制图像梯度灵敏度的参数,
是一个小常数,通常设置为0.0001,防止被0整除。

直观地说,平滑度损失鼓励光照在小梯度的像素上是平滑的,而在大梯度的像素上是不连续的。有趣的是,对于曝光不足的照片,图像内容和细节往往很弱。较大的梯度更可能是由不一致的光照造成的。如图4中的第4幅图像所示,通过进一步加入平滑度损失,我们恢复了良好的图像对比度,与仅重建损失的结果相比,细节更加清晰。

Color Loss

接下来,设计颜色损失来使生成的图像

中的颜色与相应的标签图片
中的颜色匹配
表示一个像素,
是一个运算符,它将RGB颜色作为三维向量计算两种颜色之间的夹角。上面等式对
中每个像素对的颜色向量夹角求和。

我们在其他颜色空间中使用这个简单的公式而不是L2距离的原因如下。首先,重构损失已经隐含地测量了L2色差。其次,由于L2度规仅用数值方法测量色差,因此不能保证颜色向量具有相同的方向。

并在NVidia Titan X Pascal GPU上以mini-batch为16进行40个epoch的训练。优化器使用Adam,固定学习率为

。为了增加数据,随机裁剪了
的patch,然后随机调整大小和旋转所有patch。下采样输入的固定分辨率为
。编码器网络是一个预先训练的VGG16。局部特征提取器包含两个卷积层,全局特征提取器包含两个卷积层和三个全连通层。此外,使用基于双边网格(bilateral grid)的模块对输出进行向上采样。

结果

与最先进的方法进行可视化比较。
与最先进的方法进行可视化比较

使用了两个常用的度量标准(即,PSNR和SSIM)来定量评估我们的网络性能,根据预测结果和相应的专家润色图像之间的颜色和结构相似性。虽然这不是绝对的指示性,但总的来说,高的PSNR和SSIM值对应着相当好的结果。

在自己制作的数据集上定量比较本文的方法和最先进的方法
在MIT-Adobe FiveK数据集上对我们的方法和最新技术进行了定量比较。

retinex 的水下图像增强算法_图像增强论文:腾讯优图CVPR2019相关推荐

  1. 腾讯优图CVPR中标论文:不靠硬件靠算法,暗光拍照也清晰

    雷刚 发自 凹非寺  量子位 报道 | 公众号 QbitAI 暗光拍照也清晰,这是手机厂商目前激烈竞争的新拍照目标. 但除了堆摄像头和硬件,AI科学家带来算法方面的新突破. 他们提出基于深度学习优化光 ...

  2. 全球计算机视觉顶会CVPR 2019论文出炉:腾讯优图25篇论文入选

    全球计算机视觉顶级会议 IEEE CVPR 2019(Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议) 即将于6月在美国长滩召开 ...

  3. 重磅!腾讯优图17篇论文入选ICCV 2021

    计算机视觉世界三大顶会之一的ICCV 2021论文接收结果出炉!本次大会收到来自全球共6236篇有效投稿,最终有1617篇突出重围被录取,录用率约为25.9%.此次ICCV 2021接收的论文分为检测 ...

  4. 腾讯优图提出LCVR-MQVI算法,勇夺NTIRE 2021双赛道冠亚军

    近日,在NTIRE 2021比赛上,腾讯优图提出的LCVR-MQVI算法在Video Super-Resolution: Track 2 Spatial-Temporal赛道和Track 1 Spat ...

  5. 全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选

    全球计算机视觉顶级会议CVPR2020  (IEEE Conference on Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议 ...

  6. 腾讯优图8篇论文入选ECCV 2020,涵盖目标检测/跟踪/Re-ID/人脸等领域

    点击上方"视学算法",选择加"星标"置顶 重磅干货,第一时间送达 本文转载自:腾讯优图 近日,计算机视觉方向的三大国际顶级会议之一的ECCV 2020公布论文获 ...

  7. 腾讯优图10篇AAAI论文解析,涉及数学速算批改、视频识别和语义分割 | 附下载...

    点击上方↑↑↑"视学算法"关注我 来源:公众号 量子位 授权转 AI顶会AAAI开幕在即,入选论文悉数披露. 今日介绍10篇论文,来自腾讯旗下视觉研发平台腾讯优图,涉及数学速算批改 ...

  8. ECCV 2020 | 腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域...

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要10分钟 Follow小博主,每天更新前沿干货 来源:腾讯优图 近日,计算机视觉方向的三大国际顶级会议之一的ECCV 2020公布论文获奖结果 ...

  9. CVPR 2020 | 腾讯优图17篇论文入选,含类比学习、人脸识别、物体检测、行人重识别等领域...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 本文来源:腾讯优图 全球计算机视觉顶级会议CVPR2020  (IEEE Conf ...

最新文章

  1. C++ 容器的综合应用的一个简单实例——文本查询程序
  2. python2.7+opencv3.1人脸识别
  3. python 阿狸的进阶之路(4)
  4. 【转】理解SQL Server的安全对象和权限
  5. Unity3D_(游戏)控制物体的上、下、左、右移动
  6. pythonmap和list_(Python)list的内建函数 filter(), map(), 和 reduce()
  7. 有个稳定的副业,才能有足够的底气面对这个世界
  8. 贪心整理一本通1431:钓鱼题解
  9. Python中如何获取类属性的列表
  10. MarkDown下载以及入门语法(一)
  11. 文本匹配、文本相似度模型之DSSM
  12. Inconsistency detected. Invalid view holder adapter positionVH
  13. Maven项目设置编码
  14. 安卓miracast花屏_计算机通过Miracast无线投屏到其他设备,出现卡顿及花屏现象...
  15. alios下载_AliOS Studio
  16. ASP.NET C#药店管理信息系统(含论文)毕业设计【演示视频】
  17. 镭速传输:TB级大文件传输,一招教你搞定
  18. 在C语言中为什么c1出现错误,我在用C语言编程时,编译后总出现Error:spawning C1.exe的错误,看不懂,是什么意思啊??快快快,谢谢!...
  19. [技术博客] 小程序前端开发流程——用实例介绍
  20. Mac微信怎么多开? 2招教会你

热门文章

  1. synchronized锁
  2. 现代软件工程讲义 5 项目经理 Program Manager
  3. visual paradigm 表示选择关系_知识获取的新挑战—远程监督关系抽取
  4. Nginx的初步安装
  5. pythonwx功能_python中wx模块的具体使用方法
  6. 审计工作存在的难点和问题_电力工程造价审计的难点与对策有哪些?学习安装电力造价广联达计价看这里!!...
  7. 快手用旺旺瓶子做机器人_用罐头瓶子做醪糟容易做好保存
  8. winform checkbox要点击两次_这个Winform的UI库也太全了!四十多个控件都在这一个项目里了...
  9. easyvision视觉软件 源码_一对一直播源码都有哪些独具一格的优势?
  10. 【LeetCode笔记 - 每日一题】519. 随机翻转矩阵(Java、随机、双指针)