论文阅读之《Quasi-Unsupervised Color Constancy 》
CVPR2019
Simone Bianco
University of Milano-Bicocca
Claudio Cusano
University of Pavia
作者在论文中提出了一种新的计算颜色恒常性的方法,在该方法中,通过训练深度卷积神经网络来检测彩色图像中转换为灰度后的消色差像素。该方法不需要任何关于场景中光源的信息,并且依赖于弱假设,即训练图像已经近似平衡,这一假设在网络上几乎所有可用的图像中都得到了实现。由于这一要求,作者将他们的方法定义为准无监督方法。经过训练后,不平衡的图像可以通过对输入的神经网络进行初步的灰度转换来处理。大量的实验结果表明,本文提出的方法能够在现有的技术状态下优于其他无监督方法,同时,足够灵活的监督微调,达到与最好的监督方法相媲美的性能。
Introduction & Related work
原有的计算颜色恒常性方法:
灰度世界、完美反射、均值白平衡、动态阈值、伽马校正、最大RGB、灰度边缘......
深度学习计算颜色恒常性难点:
将深度学习方法应用于颜色恒常性的主要困难在于缺乏大量的地面真相光源注释的数据集。对于有监督深度学习所需要的大型数据集的收集,这个过程显然是不切实际的。基于机器学习的颜色恒常性方法的另一个问题是,被学习的模型通常专门用于使用收集训练集的相同设备获取的图像。
解决办法:
基于深度卷积神经网络的计算颜色恒常性利用大量公开的图像数据集在准无监督设置下训练网络。光源的颜色不需要地面真相。只考虑输入图像的灰度版本。输出就与发光体的实际颜色无关。所述被检测像素的加权平均是最终用于校正输入彩色图像的光源的估计。
Method
提出的方法总结:
1.使用卷积神经网络进行光源估计
2.不需要依赖场景光源信息
3.准无监督,不需要ground truth
4.估计出光源颜色后,由von Kries模型通过估算值的相应分量来缩放像素的颜色分量。
5.该网络通过建模大量“几乎平衡”的图像来平衡颜色失真的图像。
网络结构:
输入:256 × 256的灰度图像
输出:256 × 256的权值映射
总体结构:采用一个U形的编码器-解码器与跳跃连接。
编码器:8个4×4卷积核和stride=2的卷积层
解码器:8个4×4卷积核和stride=2的反卷积层
注:除了第一层和最后一层,其他的层都采用batch normalization 和ReLU操作,在反卷积的前三层使用了Dropout=0.5。最后一层采用Sigmoid替换ReLUs产生分配给输入的像素的权重。整个网络包含5400万个学习参数。
训练后生成的模型应用到不平衡的原始图像中需要解决两个主要问题:
(i)这些图像将与用于培训的图像类型不同。
(ii)将提供用于评估的实际地面真相但不是用于训练。
问题解决方法:
(i)在将图像传送到网络之前,先将图像转换成灰度,使它们几乎不依赖于场景光源的颜色。
(ii)缺乏地面真实输入的问题是通过训练网络来解决的,可以被认为是光源估计的代理问题:无色像素的检测。
Experiment
数据集:Ilsvrc12;Places365;Flickr100K
第一行显示输入图像,圆形表示估计的光源颜色。圆内值为角差。
第二行报告网络分配给像素的权值(蓝色→0,黄色→1)。
第三行报告的是与估计光源相平衡的图像。
Conclusion
1.提出一种使用深度卷积神经网络计算颜色恒常性的方法(基于深度学习实现颜色恒常性)。
2.利用准无监督学习大型未注释的数据集从而估计不平衡的图像光源信息(解决无参考图像问题)。
3.可以对特定数据集进行有监督微调提升网络结构效率。
论文阅读之《Quasi-Unsupervised Color Constancy 》相关推荐
- 论文阅读之《DeepIlluminance: Contextual IlluminanceEstimation via Deep Neural Networks》
ArXiv2019 Jun Zhang合肥工业大学 Tong Zheng合肥工业大学 Shengping Zhang哈尔滨工业大学(威海) Meng Wang合肥工业大学 Introduction 回 ...
- 论文阅读 (69):Collaborative Learning for Deep Neural Networks
文章目录 1 引入 1.1 题目 1.2 摘要 1.3 Bib 2 协作学习 2.1 训练图的生成 2.2 学习目标 2.3 一组分类器头的优化 2.3.1 同步SGD 2.3.2 反向传播重缩放 2 ...
- 论文阅读:Aggregated Residual Transformations for Deep Neural Networks
本萌新记录一下看过的论文,如果理解有误大佬们体谅下QAQ. 摘要: 作者提出一个用于图像分类的.简单.高度模块化的网络结构.该网络是通过重复一个构建块(building block)来构建的,该构建块 ...
- 【论文阅读】A Gentle Introduction to Graph Neural Networks [图神经网络入门](7)
[论文阅读]A Gentle Introduction to Graph Neural Networks [图神经网络入门](7) Into the Weeds Other types of grap ...
- 【论文阅读】A Gentle Introduction to Graph Neural Networks [图神经网络入门](5)
[论文阅读]A Gentle Introduction to Graph Neural Networks [图神经网络入门](5) Graph Neural Networks 图神经网络 Now th ...
- 【论文阅读】A Gentle Introduction to Graph Neural Networks [图神经网络入门](4)
[论文阅读]A Gentle Introduction to Graph Neural Networks [图神经网络入门](4) The challenges of using graphs in ...
- 【论文阅读】A Gentle Introduction to Graph Neural Networks [图神经网络入门](3)
[论文阅读]A Gentle Introduction to Graph Neural Networks [图神经网络入门](3) What types of problems have graph ...
- 【论文阅读】A Gentle Introduction to Graph Neural Networks [图神经网络入门](2)
[论文阅读]A Gentle Introduction to Graph Neural Networks [图神经网络入门](2) Graphs and where to find them 图以及在 ...
- 【论文阅读】A Gentle Introduction to Graph Neural Networks [图神经网络入门](1)
[论文阅读]A Gentle Introduction to Graph Neural Networks [图神经网络入门](1) 最近读了一篇Distill网站上的一篇文章,讲的是图神经网络的入门, ...
- 【论文阅读】A Gentle Introduction to Graph Neural Networks [图神经网络入门](6)
[论文阅读]A Gentle Introduction to Graph Neural Networks [图神经网络入门](6) GNN playground Some empirical GNN ...
最新文章
- java web服务与配置,Java Web远端服务器的配置与部署
- 干货丨一文介绍机器学习中基本的数学符号
- 编程题:两个数比较大小,之后用变量t互换。
- java一个点围着另一个点转_Java:按指定的度数值旋转另一个
- 关于数据访问模式(三)—— Data Accessor模式
- SAP标准培训课程C4C10学习笔记(四)第四单元
- redux-form V.7.4.2学习笔记(六)表单同步校验技术
- 一个500强公司的数据化运营管理实践
- 洛谷 P1187 3D模型
- xx云网络实施方案案例
- paip.提升用户体验---c++ ide 自动化注释插件的开发...
- Linux驱动开发-编写FT5X06触摸屏驱动
- 2022年自考专业考试(计算机应用)软件工程练习题
- python批量将PPT导出成图片集
- 缓动动画_核心动画概念:缓入缓出
- day27 学习HTML-01天
- OpenGL进阶示例1——动态画线(虚线、实线、颜色、速度等)
- linux aria进程,Linux安装 Aria2
- 数据库设计--实体关系图(ERD)
- 计算机工作理想湿度,计算机理想的工作温度七月的盛夏,碧空中没有一丝云彩,只剩下纯(11)...