DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs 阅读笔记
DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs 阅读笔记
- 引言
- 介绍
- 主要贡献
- 提出的方法
- 总体架构
- 网络结构
- 损失函数
- 训练
- 测试
- 小细节
- 待续
- 参考
论文地址:https://arxiv.org/abs/1712.07384
如有侵权请联系我们
引言
文章中提出了一种基于深度学习架构,用于融合多曝光图像的算法
在神经网络的训练过程,一般都是监督学习,这样训练出的神经网络都有很不错的效果。但是由于没有足够的数据集供其使用,所以该篇论文提出了无监督的MEF(多曝光融合)深度学习框架。
介绍
首先引入HDRI的概念,这是一种存储图像的格式,相对于RGB格式来说,HDRI有更大的亮度范围,图像会更好,更清晰。
比较流行的生成HDR图像的方法被称为MEF(多次曝光融合),该方法就是将具有不同曝光的多个LDR图像(例如我们熟知的jpg,png等)融合为一个HDR图像。不同曝光的多个LDR文件也被称为曝光堆栈。
如果曝光堆栈中多个图像之间的曝光偏差最小时,大部分的MEF算法都可以取得不错的效果。但是这就带来了一个问题,曝光偏差小时,就意味着我们需要更大的存储容量以及更长的处理时间,论文中的方法是直接输入一个图像对,曝光偏差可以很大,该论文在这种情况下也可以工作的不错。
主要贡献
一种基于CNN的无监督图像融合算法,用于融合曝光叠加静态图像对。
一个新的基准数据集,可用于比较各种MEF方法
针对各种自然图像的7种最新算法的广泛实验评估和比较研究
提出的方法
总体架构
论文中使用的是使用CNN的图像融合框架。
为什么使用CNN?
因为CNN可以通过损失函数来自动更新网络中的参数,使得输出的结果不断地逼近预测值,运用在图像融合上也是一样,通过我们设定好的损失函数,CNN的输出图像结果就会逐渐趋近我们希望的结果。
主要流程
将输入曝光堆栈转换为YCbCr色通道数据。CNN用于融合输入图像的亮度通道。这是因为亮度通道中存在图像结构细节,亮度通道中的亮度变化比色度通道中的明显。
获得的亮度通道
网络结构
如上所示,特征提取层(C11,C21,C12和C22),融合层(Tensor addition)和重构层(C3,C4,C5)。
输入的Y1和Y2分别为曝光不足和曝光过度的图像。
C11和C12,C21和C22的参数是共享的,这有什么好处呢?
从另一角度来说C11,C21和C12,C22提取的特征是相同的,这就使得提取出的F11和F21可以通过融合层直接融合。这里融合的策略是直接相加。
损失函数
因为MEF没有预期的输出图像,因此像监督学习中使用的各种损失函数,在这里就不适用了,这里使用MEF SSIM作为损失函数,详情可参考以下论文。
K. Ma, K. Zeng, and Z. Wang. Perceptual quality assess-
ment for multi-exposure image fusion. IEEE Transactions
on Image Processing, 24(11):3345–3356, 2015.
如上图,yk代表表示在输入图像p像素位置周围提取的块,这里k属于(1,2),即代表一张高曝光和曝光不足的图像;uyk代表yk的平均值,Ck代表yk这里的对比度,Sk代表结构,Lk代表亮度
知道了以上公式之后我们再往下看
对比度越高,图像越好,因此这里c hat(就是c的预测值)就是两张图像中yk中的最大的c
结构的预测值公式如下
总体的y的预测如下
由于局部面片中的亮度比较不重要,因此从上述等式中删除亮度分量(文章中提到的,不是很理解)
以上都是为损失函数做铺垫,接下来才到了真正的损失函数
σ2y hat 是y hat的的方差,σy hat yf是是二者之间的协方差,N是图中像素总数
以上就是对论文中的损失函数的介绍了
训练
训练数据
25个公开的曝光堆栈+50个不同场景特征的曝光堆栈,每个场景由两个LDR图像组成。
在这些堆栈中剪裁了30000个大小为64*64的图像用于训练。
训练参数
学习率为10的-4次方,经过100次训练,每次训练所有的数据
测试
遵循标准的交叉验证程序来训练模型,并在不相交的测试集上测试最终模型。
图像的关键细节主要再Y通道上,因此Y通道和Cb/Cr所采用的融合策略是不同的
此外,MEF SSIM损失被公式化以计算2个灰度(Y)图像之间的得分
不知道大家有没有和我一样的疑惑,这里为什么是计算两个灰度图像之间的得分,来看下百度给结果
前文中我们已经提到了,论文中的方法主要是融合Y通道,这就很明朗了。
小细节
- 这里和之前阅读的一篇论文中一样,都需要对输入的图像进行配准和对齐,因为在采集过程中,不可避免的会出现摄像机和物体的移动。 另一篇论文
- 这里的相加策略中是单纯的相加,这时候我们想如果在两张图像中,一张图像中的特征是我们希望在融合时占的比重较大,另一张占的较小,这样实现起来也许融合图像的效果会更好,但是这就要我们计算融合时的权重了,而经过论文作者的测试,发现增加C3后的过滤器和层数也可以达到这个效果。(神经网络yyds)
待续
关于实验结果以及总结部分,这里就不赘述了,大家有兴趣可以看一下
文章读的比较糙,因为我的目的主要是想了解这个MEF SSIM损失函数,大家如果有兴趣的话建议好好读一下,非常好的论文
参考
[1] DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme
Exposure Image Pairs
DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs 阅读笔记相关推荐
- 论文笔记:DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs
论文笔记:DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs co ...
- Do Deep Neural Networks Learn Facial Action Units When Doing Expression Recognition?阅读笔记
Do Deep Neural Networks Learn Facial Action Units When Doing Expression Recognition?阅读笔记 前言 Abstract ...
- 文献 Application of deep learning tothe diagnosis of cervical lymph node metastasis from thyroid阅读笔记
文献 2019.02-Application ofdeeplearning tothe diagnosis of cervical lymph node metastasis from thyroid ...
- DenseFuse: A Fusion Approach to Infrared and Visible Images 阅读笔记
DenseFuse: A Fusion Approach to Infrared and Visible Images 阅读笔记 摘要 介绍 相关工作 融合方法 编码器 解码器 融合层 训练 网络结构 ...
- 图像融合:Exposure Fusion
Exposure Fusion 文章目录 Exposure Fusion Quality Measures Fusion 本篇文章提出了一种将多曝光序列融合成一帧包含更多细节.内容,更高质量的图像,是 ...
- 论文笔记:SESF-Fuse: an unsupervised deep model for multi-focus image fusion (2021)
SESF-Fuse: an unsupervised deep model for multi-focus image fusion [引用格式]:Boyuan Ma et al. "SES ...
- 最新年龄估计综述(Deep learning approach for facial age classification: a survey of the state of the art)
目录 @[TOC](文章目录) #一.常用数据集 #二.常用的年龄识别方法 #1.多分类(MC) #2.度量回归(metric regression,MR) #3.排序(ranking) #4.深度标 ...
- 解读《A Regularized Deep Learning Approach for Clinical Risk Prediction of Acute Coronary Syndrome》
全文名称:A Regularized Deep Learning Approach for Clinical Risk Prediction of Acute Coronary Syndrome Us ...
- scDeepCluster:Clustering single-cell RNA-seq data with a model-based deep learning approach论文解读
这是2019年发表于nature子刊machine intelligence的一篇论文,作者是Tian Tian , Ji Wan, Qi Song and Zhi Wei.论文主要是提出了一个新的框 ...
最新文章
- java递归排雷_C语言实现扫雷小游戏
- python 之socket 网络编程
- windows XP系统Stop c0000218 unknown hard error 蓝屏故障的解决方法
- js 获取鼠标在画布的位置_javascript求鼠标在canvas画布里的坐标
- windows linux 通过SSH X11Forwrding 使用图形化界面
- FreeBSD没有安装Ports的解决办法
- C语言编译过程总结详解
- 【HDU - 1247】Hat’s Words(字典树,预处理,tricks)
- 在新建FileInputStream时使用当前相对路径或者绝对路径作为参数的问题
- linux系统查看进程并杀掉,Linux如何查找8080进程并杀掉该进程
- HyperLedger Fabric 1.0的Transaction处理流程
- 极客大学架构师训练营 JVM虚拟机原理 JVM垃圾回收原理 Java编程优化 秒杀 第九次作业
- Excel·VBA破解密码
- Android EditText去掉下划线
- 百度地图点击城市的出现下钻
- mmdetection 安装与使用(win10)
- 解决Deepin15.10安装后无WiFi和无线网卡驱动问题
- 假设有一段英文,其中有单独的字母I误写为i,请编写程序进行纠正。
- 智能+建筑>智能建筑
- zookeeper添加ip白名单
热门文章
- CRM客户关系管理系统UI设计作品
- 三态门三个状态vhdl_[转帖]INOUT双向端口仿真 三态门构成 三态门原理 三态门仿真...
- 彻底理解setTimeout()
- 移动客户端中高效使用SQLite
- 关于SetCapture() 和 ReleaseCapture()的用法的个人理解
- js本地图片预览,兼容ie[6-9]、火狐、Chrome17+、Opera11+、Maxthon3tr 						td style=width:35%; class=noBorderL
- 重装系统后电脑没有声音输出怎么办
- linux进程资源分配命令,linux进程cpu资源分配命令nice,renice,taskset
- python编程amd和intel哪个好_计算机专业 CPU 应该用 AMD 还是 Intel?
- EPSON墨盒及打印机型号对照