论文笔记:Integrating Semantic Segmentation and Retinex Model for Low Light Image Enhancement
来源:Proceedings of the 28th ACM International Conference on Multimedia (2020)
目录
- Contributions
- Mothology
- Architecture
- Information Extraction
- Image Decomposition
- Semantic Segmentation
- Reflectance Enhancement
- Illumination Adjustment
- EXPERIMENTS
- Evaluation on Synthesis Data
- Quantitative
- Evaluation on Real-Captured Data
- Quantitative
- Qualitative
- Ablation Study
- Notes
Contributions
- 提出了一种融合语义分割和Retinex模型的深度网络,用于微光图像的增强。利用语义先验和信号结构引导的能力,该模型能够成功地同时处理光照分布、中等噪声(moderate noise意思是?)和颜色失真的任务,并在弱光增强上有良好的视觉效果。
- 语义先验通过空间变换处理特征来指导光照和反射率的联合增强,从而提高区域恢复的恢复质量,如噪声抑制、颜色校正等。大量的实验表明了该方法的优越性和其各部分的有效性。
- 为了方便相关研究,我们建立了一种新的弱光图像合成模型,生成了2458张欠曝光图像数据集,每一幅图像都基于Cityscapes和Camvid数据集进行了gt图像的润色。在我们的合成过程中,曝光调整、噪音产生和颜色失真都被考虑在内。此外,还收集了100幅真实的微光图像(包含网络资源和亲自拍摄),以评估我们的方法和其他SOTA微光图像增强方法。
其他基于Retinex方法的局限性:
它们是用手工制作的约束条件构建的。因此,这些方法对不同类型的自然图像的复杂信号特性的捕捉都不具有足够的适应性。
Mothology
语义信息可以为微光增强提供丰富的信息。 例如,天空等平滑区域的噪声可以被强烈模糊,而不影响主观效果,而对于街道标识等细节丰富的区域,去噪时要小心,否则会破坏细节。然而,现有的微光增强方法忽视了语义信息的重要性,因而性能有限。
基于此,论文提出了一种新的语义感知的微光增强网络,利用语义信息更好地理解场景和恢复内在反射率(a novel semantic-aware low-light enhancement network, which leverages semantic information for better scene understanding and intrinsic reflectance restoration )。
Architecture
Information Extraction
Image Decomposition
思想:受RetinexNet和KinD的启发,沿用了Retinex理论,将图像III分解为反射层RRR和照明层LLL,有I=R⋅LI=R \cdot LI=R⋅L。这是个ill-posed问题,需要额外的约束。因为观察到相同物体在不同环境光下看起来不同,所以推测低光照下图像ILI_LIL和对应正常光图像IHI_HIH在反射层上有一致的结构。(排除照明层,所以就是反射层相同,是这个逻辑?)
结构:DecompNet,用于提取反射层RRR和照明层LLL。
训练过程:用成对图像训练,用到了 smoothness loss, reconstruction loss, and illumination smoothness loss 。
Semantic Segmentation
思想:SLS_LSL用于引导修复反射层。
结构:SegNet,用于提取语义信息SLS_LSL。
训练过程:这里用到一个轻量级U-Net。训练时都用到了低光和正常图像。
SLS_LSL为ILI_LIL的分割结果,SHS_HSH为IHI_HIH的分割结果,SGTS_{GT}SGT为真实分割标注。CECECE代表element-wise(pixel-wise?)计算交叉熵损失。与SHS_HSH相比SLS_LSL内物体更难检测,L1L_1L1的目的是引导模型更精确地检测SLS_LSL。
Reflectance Enhancement
ReflectNet: 借助语义信息SLS_LSL重建RLR_LRL。
由一些 Residual In Residual (RIR) 块组成。在网络的前后两端,添加了一些 concatenation-based 和 addition-based 的跳跃连接。这种基于残差的结构,让ReflectNet具有很强的像素调节能力,有利于抑制噪声和修正颜色。
为了引进语义信息,设计了一种变体—— Semantic Residual In Residual (SRIR) 块,语义信息通过一个线性转换(a linear transformation),来调节RLR_LRL的特征。如图,语义信息SLS_LSL经过几个卷积层的处理,获得α\alphaα和β\betaβ。RLR_LRL的特征先后与β\betaβ相乘、与α\alphaα相加。
训练时用到了对应正常图的反射层RHR_HRH,用MSE、SSIM、Grad(Gradient Loss)测量损失。
Illumination Adjustment
RelightNet: 用R~L\tilde{R}_LR~L和ρ\rhoρ来重新平衡亮度分布。
用一个轻量级U-Net提取重建后反射层R~L\tilde{R}_LR~L,这样,语义信息SLS_LSL间接参与了照明调节过程。RelightNet的输出结果L~L\tilde{L}_LL~L被sigmoid层限制在[0,1]之间。通过将L~L\tilde{L}_LL~L和R~L\tilde{R}_LR~L逐像素相乘,弱光图像增强网络生成最终结果I^H=L~L×R~L\hat{I}_H=\tilde{L}_L \times \tilde{R}_LI^H=L~L×R~L。
在我们的训练数据集中,光照分布的范围很广,接近于真实的应用场景。但这对模型的训练带来了挑战。为了解决这一问题,引入了**比例参数ρ\rhoρ**来指导调整过程。
对于训练,ρ\rhoρ是根据ground truthIHI_HIH的像素均值与输入ILI_LIL的像素均值之比来定义的,而在测试阶段,我们使用固定的ρ\rhoρ= 5.0。该比例也可让用户交互提供,来控制提亮程度。(可以运用到项目中)
为了更好的利用照明调节比ρ\rhoρ,提出一个比率学习损失:
最终损失函数:
EXPERIMENTS
Evaluation on Synthesis Data
Quantitative
Evaluation on Real-Captured Data
Quantitative
use the no-reference metric NIQE
Qualitative
LIME提高整体亮度,但过度曝光某些区域。
MBLLEN产生相对自然的光照分布,但其结果仍然不够明亮。
RetinexNet造成严重的色彩和对比度失真,导致不自然的结果。
DeepUPE呈现了一种令人满意的对比度,而在欠曝光的地方有细节缺失。
EnlightenGAN产生区域性的颜色伪影,降低视觉质量。
KinD无法预测适当的光照增强,过度曝光使部分过亮,产生奇怪的白色伪影。
而且,大多数方法都会产生颜色失真。相比之下,我们的结果的颜色分布是自然的,这反映了我们在定量评价(怀疑论文有笔误,这里应为定性评价)中的优越表现。
Ablation Study
使用RetinexNet作为baseline,RetinexNet也遵循Retinex分解的pipeline,但有不同的网络架构选择。
消融实验设置:
论文中的解释是
w/o Seg:Compared with the baseline, our new network architectures …
w/o CD:The injection of semantic information(论文的意思是:语义信息帮助学会去除颜色失真?)
对比结果:
Notes
这篇论文将语义分割引入了弱光增强领域,结合Retinex理论,用语义信息引导重建反射层、间接引导重建照明层。
在照明层调节的环节,引入了照明调节比ρ\rhoρ,可借鉴之,让用户通过交互,自己控制增强程度。
另外,项目的数据集基于街景,可用于大创项目。
论文笔记:Integrating Semantic Segmentation and Retinex Model for Low Light Image Enhancement相关推荐
- 论文阅读笔记--Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers
最近在阅读一些关于transformer的论文,在此记录是为了看看到底天天学了些什么.目前阅读这些论文感觉还是似懂非懂的阶段,还需要时间细细斟酌,共勉! Rethinking Semantic Seg ...
- 【论文笔记8】Tree-Structured Neural Topic Model (分层神经主题模型 / TSNTM)
Tree-Structured Neural Topic Model 树结构的神经主题模型 论文概述 题目:Tree-Structured Neural Topic Model 作者:Masaru I ...
- Self-supervised Low Light Image Enhancement and Denoising 论文阅读笔记
这是哈工大的一篇无监督暗图增强和去噪的论文,似乎还没有在哪个会议期刊正式发表 文章提出了一个能够同时进行暗图增强和去噪的框架,由两部分组成,一部分是对比度增强网络(ICE-Net),一部分是进一步增强 ...
- [深度学习论文笔记]Brain tumour segmentation using a triplanar ensemble of U-Nets 基于Unet三平面集成的脑肿瘤分割
Brain tumour segmentation using a triplanar ensemble of U-Nets 基于U网络三平面集成的脑肿瘤分割 Published: May 2021 ...
- [论文阅读] Semi-supervised Semantic Segmentation via Strong-Weak Dual-Branch Network
[论文地址] [代码] [ECCV 20] Abstract 虽然现有的工作已经探索了各种技术来推动弱监督语义分割的发展,但与监督方法相比仍有很大差距.在现实世界的应用中,除了大量的弱监督数据外,通常 ...
- 论文笔记-Multi-view Incremental Segmentation of 3D Point Clouds for Mobile Robots
标题:Multi-view Incremental Segmentation of 3D Point Clouds for Mobile Robots 作者:Jingdao Chen1, Yong K ...
- 论文笔记(A Neural Influence Diffusion Model for Social Recommendation)
神经影响传播模型为了社交推荐 原文链接:A Neural Influence Diffusion Model for Social Recommendation, SIGIR'19 原理:社交网络上应 ...
- 论文笔记:SESF-Fuse: an unsupervised deep model for multi-focus image fusion (2021)
SESF-Fuse: an unsupervised deep model for multi-focus image fusion [引用格式]:Boyuan Ma et al. "SES ...
- 【论文笔记之 SN-Net】Interactive Speech and Noise Modeling for Speech Enhancement
本文对 Chengyu Zheng 于 2021 年在 AAAI 上发表的论文进行简单地翻译.如有表述不当之处欢迎批评指正.欢迎任何形式的转载,但请务必注明出处. 论文链接:https://ojs.a ...
最新文章
- getDeclaredField(x);与set方法的用法
- 字符设备之register_chrdev与register_chrdev_region
- [外文理解] DDD创始人Eric Vans:要实现DDD原始意图,必须CQRS+Event Sourcing架构。
- 【IP地址の乾坤大挪移】C语言实现“IP地址/数字”互转
- 查看 linux 硬件信息:内存、分区、系统、环境变量、防火墙、路由、端口监听、进程、CPU...
- Java OCR tesseract 图像智能字符识别技术
- fedora 22 安装 flash player
- 关于caffe-ssd训练时smooth_L1到底参与运算与否的问题
- 三阶段DEA模型操作步骤笔记
- .npy文件打开方式
- Python 数组高级索引
- 洛谷P6685 可持久化动态仙人掌的直径问题
- 淘宝店群的失败,标志另一代店群平台的崛起,店群“时代在发展”
- WordPress主题:Dux主题 V6.4免费分享(113p.cn)
- 检索匹配的利器:正则表达式
- 云堡垒机相关概念汇总说明
- W5500参考电路图
- 音乐探索3:关于放克
- 软件项目开发与管理(赢得值分析参考例题)
- python中文版编程软件-Python编程软件下载
热门文章
- php源码密码正确登录不了,PHP源码session失效不传递的解决办法(无法登录和注册或者登录注册失效)...
- 在使用macbook合并Excel表格时,系统报错。(XLRDError)
- gitlab 批量添加用户并去掉邮箱验证(亲测有效)
- 线性代数 --- 投影Projection 一(投影向量p)
- SSL证书/TLS证书是什么
- (二十四)优秀员工 - 6
- android手机禁止休眠_android设置屏幕禁止休眠的方法
- 啊哈!算法—小猫钓鱼(Java实现)
- 2022-5-18[树] 后继者, 检查子树, 删点成林, 树的深度
- 路哥从不低头 dfs