FC4: Fully Convolutional Color Constancy with Confidence-weighted Pooling

  • 网络结构
  • 权重池化层
  • 总结

基于patch的CNN网络会因为patch包含的信息不足,无法确定一个唯一的颜色或者范围。在此提出一个基于全卷积网络结构,其中patch可以携带用于估计颜色恒定的置信度权值。权重在一个独特的(novel)pool层中学习和应用,在该层中局部估计被合并到全局解中。用了该公式网络话就知道在数据集中要学习什么并且如何pool而不需要额外的监督。还允许端到端的训练。

网络结构


网络生成的特征图(4维度)被传递到加权池层,从局部到全局进行聚合,生成之前所说的颜色恒定性估计。我们强制前三个通道表示每个对应patch估计出的颜色元组p ̂_i=g(R_i ),最后一个通道表示对最终全局估计的置信度c_i=c(R_i )
然而,由于颜色恒常性问题的性质,最优模型至少受到两个重要性质的约束:
(1)网络应该能够提取足够的语义特征来区分模糊的patches(如无纹理的墙壁)以进行照明估计;
(2)网络不应该是照明不变的,但它应该对不同的灯光颜色敏感。
如我们所见,第二个要求违反了在分类任务训练网络中嵌入的知识,因为照明条件不应影响对象的类别。不幸的是,具有较强语义信息提取能力的网络通常对光照条件的变化也不敏感,这意味着提取的特征对光照颜色具有不变性。为了在上述两个特性之间找到一个很好的平衡,我们尝试了不同的网络配置。我们尝试了一个去掉conv4和/或conv5的较浅版本的AlexNet,发现性能变差,可能是由于语义特征提取能力不足。此外,我们还尝试了conv6的其他核大小,包括1×1、3×3和10×10,但是发现6×6,即AlexNet经过卷积层后的原始输出大小,得到了最好的结果。为了减小模型尺寸,我们用挤压网[25]v1.1进行了实验,发现它也能带来良好的效果。

权重池化层

当c(Ri)=1等于1时,就是一种特殊情况。在我们的网络中,由于FCN的结构,卷积操作在同一个图像中的patch之间共享,而对于基于patch的cnn,每个patch需要依次通过同一个网络。也存在其他的池方法,例如完全连接池或最大池;但是,它们要么缺乏灵活性(即需要特定的输入图像大小),要么已经被证明对于颜色恒定性估计不是非常有效。根据[38],中值池做得更好,因为它可以防止异常值直接影响全局估计,但在很大一部分估计是噪声的情况下,它并不能完全消除它们的影响。此外,即使我们将其合并到端到端的训练管道中,每次损失也只能反向传播到图像中的单个(中值)面片,忽略面片之间的成对依赖关系。
数学分析

在估计值p ̂_i 中,方向是一致的,但是大小由权值ci来决定。这个置信度可以作为mask来减少我们学习到的噪声。

直观地说,只要局部估计有助于全局估计更接近地面真实,网络就增加了相应的置信度。否则,置信度就会降低。这正是学习置信度的方法。

总结

该方法是需要真实光照值和图片来进行训练的。我自己读的就是作者通过分割图片,然后通过网络得出四个通道的值,用最后一个通道的值去乘前三个通道,再求和得出真实图像。但是这里还是有很多问题不是很明白:
1.最后的求和真的是最后一个通道去分别乘前三个通道再相加吗?
2.CNN网络在目标探测时是不希望对亮度敏感的。那么用CNN是不是无法完成亮度调整。

今天的学习都没学明白,啥也不是,散会。

基于置信加权池的全卷积保证颜色恒常性相关推荐

  1. 基于空间金字塔池化的卷积神经网络物体检测

    基于空间金字塔池化的卷积神经网络物体检测 原文地址:http://blog.csdn.net/hjimce/article/details/50187655 作者:hjimce 一.相关理论 本篇博文 ...

  2. CNN应用之SPP(基于空间金字塔池化的卷积神经网络物体检测)-ECCV 2014-未完待续

    基于空间金字塔池化的卷积神经网络物体检测 原文地址:http://blog.csdn.net/hjimce/article/details/50187655 作者:hjimce 一.相关理论 本篇博文 ...

  3. 深度学习(十九)基于空间金字塔池化的卷积神经网络物体检测-ECCV 2014

    基于空间金字塔池化的卷积神经网络物体检测 原文地址:http://blog.csdn.net/hjimce/article/details/50187655 作者:hjimce 一.相关理论 本篇博文 ...

  4. 深度学习(十九)基于空间金字塔池化的卷积神经网络物体检测

    基于空间金字塔池化的卷积神经网络物体检测 原文地址:http://blog.csdn.net/hjimce/article/details/50187655 作者:hjimce 一.相关理论 本篇博文 ...

  5. 开源|如何利用Tensorflow实现语义分割全卷积网络(附源码)

    导读:本项目是基于论文<语义分割全卷积网络的Tensorflow实现>的基础上实现的,该实现主要是基于论文作者给的参考代码.该模型应用于麻省理工学院(http://sceneparsing ...

  6. 论文理解 R-FCN:基于区域的全卷积网络来检测物体

    本文转载自: http://blog.csdn.net/shadow_guo/article/details/51767036 原文标题为"R-FCN: Object Detection v ...

  7. 基于全卷积神经网络的图像分割方法详解(二)

    最近这段时间刚好忙完学业作业,抽空来总结一下前段时间的工作. 前段时间一直忙于用深度学习做医学图像分割,采用的方法是FCN,也就是全卷积神经网络.全卷积神经网络是基于卷积神经网络的改进,使得输入和输出 ...

  8. 【数据挖掘】卷积神经网络 ( 池化 | 丢弃 | 批量规范化 | 卷积神经网络完整流程示例 | 卷积 | 池化 | 全连接 | 输出 | 卷积神经网络总结 )

    文章目录 I . 池化 II . 丢弃操作 III . 批量规范化 IV . 卷积神经网络 完整流程示例 ( 1 ) : 原始输入图 V . 卷积神经网络 完整流程示例 ( 2 ) : 卷积层 C1C ...

  9. 基于全卷积神经网络的前列腺磁共振图像分割

    (本科毕业论文题目.摘要.关键词及相应的英文翻译,欢迎做前列腺分割的小伙伴可以加我qq:604395564一起交流呀) 基于全卷积神经网络的前列腺磁共振图像分割 目的研究从前列腺磁共振图像中自动分割的 ...

  10. 自动驾驶系统进阶与项目实战(三)基于全卷积神经网络的点云三维目标检测和ROS实战

    自动驾驶系统进阶与项目实战(三)基于全卷积神经网络的点云三维目标检测和ROS实战 前面入门系列的文章中我介绍了几种点云三维分割/目标检测模型,在做点云预处理上,有通过球面投射(SqueezeNet)得 ...

最新文章

  1. layui中laydate兼容ie_layui菜鸟教程--乐字节前端
  2. Android之全面解析OkHttp源码
  3. python subprocess.Popen 实时输出 stdout
  4. jQuery单选按钮监听事件
  5. eclipse中birt插件使用_waves教学:如何使用通道条插件在DAW中创建模拟工作流
  6. 51nod 1851 俄罗斯方块(思维题)
  7. 线性代数 —— 矩阵快速幂
  8. 【SolidWorks、URDF】在SolidWorks里面插入URDF方法步骤以及无法启动的解决问题
  9. html播放韰 寸 频,asp.net 汉字转换拼音及首字母实现代码
  10. 【msvcr100.dll文件下载】msvcr100.dll丢失的解决方法
  11. 08年计算机组成原理自考试卷,2008年04月自学考试02318《计算机组成原理》试题...
  12. 21天挑战赛第三文——多线程threading
  13. 改写[转载]关闭危险端口的批处理文件FOR WIN7
  14. 计算机小游戏有哪些,计算机有哪些单机游戏可以耐玩,4 G以下?
  15. CMD 常用命令总结
  16. BZOJ4919: [Lydsy1706月赛]大根堆(set启发式合并)
  17. Java课堂笔记第九次428
  18. 系统集成项目管理工程师备考资料(口袋应试第二版第3章)
  19. linux课程设计网络应用,Linux技术应用课程设计的详细实例资料说明
  20. MIPS微程序CPU设计(Logism)

热门文章

  1. 数据库设计(一)——数据库设计
  2. Java对接西门子S7
  3. 999页阿里P7Java学习笔记在互联网上火了,完整版开放下载
  4. Delphi7串口通讯实例(含Spcomm控件)
  5. linux多线程编程书籍推荐:linux大牛之路从这几本书开始总结
  6. 强行卸载趋势科技防毒墙网络版客户端
  7. 动易 dw css不对,动易模板制作示.doc
  8. 关于QQ表情数据库的复制
  9. 动易 当前服务器不允许上传文件,动易网站详细安说明及常见疑难解答.doc
  10. Spring Boot设置上传文件大小