目录

背景

数据的处理

模型修改

模型训练

后续


背景

《bringing old photos back to life》是一篇用于老照片修复的论文,论文的故事讲的很好,但是不利于读者的理解,而且代码中的很多细节,论文中并未提到。具体的代码背景等可以查看我之前写的一些文章,本次博客主要记录我用它的模型做的我一些任务(去雾),并写出一些主要得坑和tips。

下面从三部分记录,分别为数据的处理,模型修改,模型训练,中间加插一些坑与tips。过些时间我会上传一份我训练的代码和数据集(等我的论文出版之后吧==)。

数据的处理

原始论文得数据处理就是一个坑。

1.

原论文一共需要两种数据集,一种是清晰的图片(Pascal VOC dataset),一种是他们收集的老照片(5718张,未公开)。

其实,准确的说还有两种,即利用清晰得图片(Pascal VOC dataset)通过降质算法(如高斯、白噪声、椒盐等)模拟生成的模糊图片,这一步骤嵌入在模型里,训练时自动生成;单纯这样不足还以模拟破旧的照片,还需要一些裂痕(mask,未公开),这比较复杂,需要标注生成。

你如果想要完全复原原始论文,是不可能的!我没关注他们最近是否完全公开了数据集。

但是,你可以拿它来做类似得任务,你只需要有 三种图像,输入图像(可由输出图像生成),输出图像,真实收集的输入图像(可无)。

因此,你如果实在想使用这个模型的话,你最少可以只有一种数据,就是你想要模型的输出的图像,,前提是你模拟生成的输入图像(如利用清晰图像生成的雾图,利用清晰的图像生成的海底图像....)足够逼真。当然,这里的输入和输出互相可以调换,做相反的任务,哈哈,我已经用它做了加雾和去雾,你们不要再做了喔 ==!,如果不嫌弃需要我的论文的话,可以私聊我。

2.

有了数据之后,如果按照他们的流程,你需要将训练数据进行打包,即把各训练集分别打包成一个文件,这样可能会让模型读取数据更快。但是,这在训练时会直接内存爆掉(严重会使电脑死机...),因为,它会一次性读取所有的数据!

因此,如果你的内存不大的话,一个解决办法是,不进行打包,修改它得dataload文件,读取训练所需要的图像,而不是读取打包的所有图像。

模型修改

模型修改可以分两大部分:一是直接添加模块,主要加在网络的mapping net上;二是修改模型的主要部分,如映射,对齐。

1.

添加小模块,为什么不添加到编码和解码上呢? 主要是我觉得如果你在编码器上添加的话,而解码器进行的是完全逆的操作,你添加的模块需要能进行逆的操作,不然可能模型会坏掉(当然,只是我的猜测,你们可以看下模型)。

因此,添加模块操作最简单的是在论文中的mapping T,在代码中是mapping_model。你可以添加任何即插即用的模块,如注意力,往里怼就行,(注意通道数即可,好像是64),然后开启你的改模型之旅吧==!

2.

论文模型有两个重点,一个是mapping T,另一个是align ,即对齐操作。我们加小模块就是在mapping T里面加的。

注意的是,默认情况下,mapping T是在最后训练的,前面会先训练VAE A 和VAE B(A、B无先后),然后固定住VAE A和VAE B的权重,再训练mapping T。

因此,你可以尝试完全删除mapping T,查看训练的结果,当然肯定很差;或者删除之后,你可以不固定VAE A,B的权重,训练的结果应该还凑合(未尝试),但是这就失去了模型的灵魂,因为这只训练一个VAE A 和 VAEB 一样了。你可以尝试删除align操作,在代码里只有一行,就是一个对抗损失而已,你也可以尝试将align操作反向一下,这样可以用于你做相反的任务!

模型训练

其实做好了第一步的  数据的处理, 训练就很简单了,可以完全按照代码中得readme进行操作。

需要注意的是,代码中有进行人脸提取和优化的操作,用的是Unet,在论文中并未提及,我也没细致的查看。其实如果不做原始任务,这部分没啥用。

另外,模型针对有无裂缝使用了不同的模型,我们使用无裂缝的代码。有裂缝的代码主要用部分卷积partial convolution。

后续

=================================分割线================

请查看该系列的下一篇文章,代码开源实现,地址:

https://blog.csdn.net/Crystal_remember/article/details/122753946https://blog.csdn.net/Crystal_remember/article/details/122753946

图像去雾,利用《bringing old photos back to life》 训练并修改相关推荐

  1. BidNet:无视差估计的双目图像去雾(CVPR2020)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者:陈翔 https://zhuanlan.zhihu.com/p/148344528 本文仅做学术 ...

  2. 避免图像去雾算法中让天空部分出现过增强的一种简易方法

    FROM:http://www.chawenti.com/articles/25193.html 在经典的几种去雾算法中,包括何凯明的暗通道去雾.Tarel的基于中值滤波的去雾以及一些基于其他边缘保留 ...

  3. 去雾综述_【综述】图像去雾的前世今生

    1. 前言 其实之前对图像去雾也没有什么深入的理解,只是了解,实现过一些传统的图像去雾方法而已.个人感觉,在CNN模型大流行的今天,已经有很多人忽略了传统算法的发展,以至于你今天去搜索10年前的传统去 ...

  4. [论文阅读] (11)ACE算法和暗通道先验图像去雾算法(Rizzi | 何恺明老师)

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  5. [Python图像识别] 四十六.图像预处理之图像去雾详解(ACE算法和暗通道先验去雾算法)

    该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...

  6. 去雾综述_图像去雾的算法历史与综述

    图像去雾的算法历史与综述 1. 前言 其实之前对图像去雾也没有什么深入的理解,只是了解,实现过一些传统的图像去雾方法而已.个人感觉,在CNN模型大流行的今天,已经有很多人忽略了传统算法的发展,以至于你 ...

  7. 图像去雾算法(二)基于暗通道先验算法学习笔记

    在http://write.blog.csdn.net/postedit/78301999中介绍了图像去雾的相关研究方法,发现目前为止在图像去雾方面,何凯明博士基于暗通道先验的算法具有很好的效果,关于 ...

  8. Single Image Haze Removal Using Dark Channel Prior 基于暗原色先验的单一图像去雾方法【翻译】

    Single Image Haze Removal Using Dark Channel Prior Kaiming He, Jian Sun, Xiaoou Tang The Chinese Uni ...

  9. 一种基于暗通道先验算法的图像去雾技术研究

    目录 一.绪论 二.雾霭图像模型与暗通道先验 三.透射率估计 四.大气光值估计 五.实例分析 参考文献 一.绪论 图像去雾技术,是由何凯明.孙健等人在CVPR2009提出来的,并获得当年CVPR最佳论 ...

  10. 遥感图像去雾文章解读

    参考遥感图像去雾文章解读 - 云+社区 - 腾讯云 1.Single Remote Sensing Image Dehazing 基于暗原色先验和常见的雾霾成像模型.为了消除光环伪影,使用低通高斯滤波 ...

最新文章

  1. 03-SpringMVC-获得用户请求数据
  2. ig信息增益 java_文本分类综述
  3. 正数数组的最小不可组成和
  4. 我的2015:创业年终总结
  5. SSIS数据转换组件_复制转换、数据转换、行计数
  6. input输入框获取焦点时,光标置于最右
  7. 使用MyBatis框架连接MySQL数据库查询记录,全部步骤
  8. 博客主之自我介绍(不长,随便瞅瞅)
  9. 【浏览器】谷歌浏览器自带翻译失效
  10. 天正网络版修改服务器地址,修改天正网络版服务器地址
  11. Apache Jena入门
  12. 基于聚集诱导荧光探针细胞膜/细胞膜表面GABA受体荧光探针/上汞离子荧光探针的研究
  13. linux调试工具ipcs的深入分析
  14. 人脸识别 Face Recognition 入门
  15. powerbi中的earlier函数
  16. 今天用手绘板画了一个simple的,见笑老
  17. 拆了小米的小台灯,手贱,多图
  18. 苏嵌实训——day18
  19. 云从科技上市在即:发行价15.37元/股,总市值将超过113亿元
  20. 360浏览器如何禁止切换到兼容模式[终极办法]

热门文章

  1. element tree不刷新视图_我不告诉你的话,你不会知道iPad原来也有这么多窍门,学起来...
  2. 喜茶入股7家茶饮,从“打工仔”做起了“金主爸爸”?
  3. 立体仓库货物识别率99.9%!AI让仓储管理事半功倍
  4. 木聚糖-氨基|Xylan-NH2|木聚糖-聚乙二醇-氨基|氨基-PEG-木聚糖
  5. 云计算概念活跃 浪潮软件放量涨停
  6. 什么是RPA? ——业务流程自动化的革命
  7. 权重初始化方法及适用情况
  8. 根据excel的链接下载到电脑上
  9. 【即点即改】关于PHP即点即改的一些东西
  10. win7电脑蓝屏没有修复计算机,win7电脑蓝屏怎么办