点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


作者:Pratik Katte

编译:ronghuaiyang

导读

之前分享了一篇文章,说到可以只用一张图像训练,进行图像的复原,用到的方法就是深度图像先验,今天,我们来解密这篇文章,到底讲了些什么。

在这篇文章中,我将主要关注图像恢复的任务,以及如何使用deep image prior来解决这个任务。

图像恢复介绍

图像恢复是指从退化图像中恢复未知真图像的任务。图像的退化可能发生在图像的形成、传输和存储过程中。这个任务有一个广泛的使用范围,卫星成像,暗光线的摄影,由于数字技术的发展,计算机和通信技术恢复退化图像是非常重要的,因此,这已经演变成一个交叉研究领域,包括图像处理,计算机视觉和计算成像。

图像恢复主要有三个任务:

1. 图像去噪

图像去噪是指对加性噪声污染的图像进行恢复。这是图像恢复中最简单的任务,因此已被多个技术团体广泛研究。

Fig.1 (左)加噪声的图, (中间)真实图, (右)高斯噪声

2. 超分辨率

超分辨率是指从一组低分辨率图像中生成高分辨率图像(或高分辨率图像序列)的过程。

Fig2. (左)低分辨率图像, (右)高分辨率图像

3. 图像修复

图像修复是对丢失的图像退化部分进行重建的过程。In-painting其实是一种古老的艺术,它要求人们去画出画作中已经变质和遗失的部分。但在当今世界,研究人员已经想出了许多方法,利用深度卷积网络来实现这一任务的自动化。

Fig. 3 (左) 输入, (右) 输出

什么是深度图像先验?

随着2012年alexnet在image-net比赛中的成功,卷积神经网络在计算机视觉和图像处理任务中得到了广泛的应用,被广泛应用于执行图像的逆重构任务,并取得了优异的成绩。

深度卷积网络之所以成功,是因为它能够从大量的图像数据集中学习。Dmitry Ulyanov在其令人吃惊的论文《Deep Image Prior》中指出,为了解决像图像恢复这样的逆问题,网络的结构是充分的,并且在从退化图像中恢复原始图像时施加了一个强先验。本文强调,要完成这些任务,不需要预先训练的网络或大型图像数据集,只需考虑退化图像即可完成。

学习先验和显式先验是图像恢复中最常用的两种方法。

学习先验是一种通过数据集直接训练深度卷积网络学习世界的方法,它以噪声图像作为输入,以干净图像作为期望输出。

另一方面,显式先验或手工先验方法,是我们嵌入一个硬约束,并从生成的数据中教给网络什么类型的图像是自然的,比如说脸等。用数学的方法来表达约束条件是非常困难的。

我们来看看技术...

Fig.4. (左)干净图像, (中间)退化的图像,(右)复原图像

x干净图像

退化图像

x*恢复图像

我们可以使用最大后验分布从经验数据估计未观测值

利用贝叶斯规则,我们可以把它表示为似然×先验

我们可以把这个方程写成最优化问题,而不是单独处理分布:

对式(1)加个负号

E(x;ẋ)是数据项,也就是似然的负对数,R(x)是图像的先验项,也就是先验的负对数。

现在的任务是在图像x上最小化Eq(2)。传统的方法是用随机噪声初始化x,然后计算函数关于x的梯度,遍历图像空间直到收敛到某个点。

Fig. 5 常规方法的可视化

另一种方法是构造一个函数g,使用随机θ进行初始化,其输出来自一个不同的空间,可以映射成图像x,并且可以使用梯度下降来更新θ直到收敛到某个点。所以,与其在图像空间进行优化,我们可以优化θ。

FIg. 6 参数方法的可视化

但是,为什么这种方法是可能的,为什么我们应该使用它?这是有可能的,因为从理论上讲,如果g是满射的g:θ↦x (如果至少一个θ映射到图像x )那么这个优化问题是等价的,这样他们有相同的解决方案。但是在实践中,优化方法搜索图像空间的方式发生了巨大的变化。实际上,我们可以将g视为超参数并对其进行优化。如果我们观察,g(θ)作为先验可以帮助选择一个好的映射,能够输出所需的图像并且可以防止我们得到错误的图片。

那么,不是去优化两个分量的和。我们现在只优化第一项。

现在Eq 2,可以表示为,

其中,z 是随机的固定输入图像,θ是随机初始化权,可以梯度下降法来进行更新,以获得所需的输出图像。

但为什么要考虑这种参数化方法还不清楚。理论上乍一看,它似乎会产生原始的噪声图像。在本文中,作者进行了一个实验,该实验表明,当使用梯度下降法对网络进行优化时,卷积神经网络不愿意接受噪声图像,更容易快速地向自然图像下降。

Fig. 7 重建任务的学习曲线使用:一张自然图像,加上相同的i.i.d.噪音,相同的随机打乱,白噪声。自然外观的图像收敛速度更快,而噪声被拒绝。

一步一步来做深度图像先验

ẋ=损坏图像(观察)

  1. 初始化z:用均匀噪声或任何其他随机图像填充输入z。

  2. 求解,利用基于梯度的方法对函数进行优化。

  1. 最后当我们找到最佳的θ,我们可以获得最佳的图像,只需向使用参数θ的网络中传入固定的输入z,然后前向传播就可以了。

Fig. 8: 利用深度图像先验进行图像恢复。从一个随机权重θ0,我们通过最小化数据项方程(2)反复进行更新。在每一个迭代权重θ映射到图像x = fθ(z), z是一个固定的张量和映射f是一个神经网络其参数为θ。图像x用于计算任务相关损失E(x, x0),损失关于θ的梯度,.然后更新参数。

结论

本文尝试证明了在深度卷积神经网络结构中构造随机权值的隐式先验的方法非常适合于图像恢复任务。本文的研究结果在很大程度上表明,适当的手工网络架构可以很好地解决图像恢复的问题。

—END—

英文原文:https://towardsdatascience.com/demystifying-deep-image-prior-7076e777e5ba

请长按或扫描二维码关注本公众号

喜欢的话,请给我个好看吧

解密深度图像先验,使用深度图像先验来复原图像相关推荐

  1. 图像视频压缩:深度学习,有一套

    摘要:得益于深度神经网络提取信源特征的能力,深度学习技术在信源压缩编码领域取得了比传统方法更 本文分享自华为云社区<基于深度学习的图像视频压缩编码>,原文作者:罗鹏. 得益于深度神经网络提 ...

  2. [Python图像识别] 四十七.Keras深度学习构建CNN识别阿拉伯手写文字图像

    该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...

  3. 【CV】用于图像恢复的深度学习方法综述论文(2022年)

    论文名称:A survey of deep learning approaches to image restoration 论文下载:https://www.sciencedirect.com/sc ...

  4. hikey970学习-012 hikey970上移植图像去雨深度神经网络算法

    摘要:本文在hikey970嵌入式设备上运行图像去雨深度神经网络算法,验证hikey970运行神经网络模型的性能与效果. 一.图像去雨简介     图像去雨处理指的是对于一张雨中的图片,去除画面中的雨 ...

  5. [Python人工智能] 三十.Keras深度学习构建CNN识别阿拉伯手写文字图像

    从本专栏开始,作者正式研究Python深度学习.神经网络及人工智能相关知识.前一篇文章分享了生成对抗网络GAN的基础知识,包括什么是GAN.常用算法(CGAN.DCGAN.infoGAN.WGAN). ...

  6. 纯c语言实现的改进暗通道去雾算法测试程序(附赠大量测试图像),基于改进暗通道先验算法的图像去雾...

    邱清辉 摘要:针对普通暗通道先验算法去雾能力的不足,本文提出了一种改进算法,通过采用高斯平滑将原图像分为基础子图和细节子图,基础子图采用暗通道先验算法,细节子图采用gamma变换方法,再采用图像融合进 ...

  7. 自动化特征提取器:图像特征提取和深度学习

    自动化特征提取器:图像特征提取和深度学习 转载:github 译者:@friedhelm739 视觉和声音是人类固有的感觉输入.我们的大脑是可以迅速进化我们的能力来处理视觉和听觉信号的,一些系统甚至在 ...

  8. 图像协方差矩阵_深度学习的预处理:从协方差矩阵到图像白化

    图像协方差矩阵 by hadrienj 由hadrienj The goal of this post is to go from the basics of data preprocessing t ...

  9. 瑞典卡罗林斯卡医学院博士后招聘,图像流行病学和深度学习领域

    项目描述 该博士后项目主要针对癌症组织病理学图像数据的深度学习模型和图像处理方法进行开发和验证.机器学习和深度学习技术是该项目的核心技术.入选博士后之后需要参与机器学习/深度学习模型的实施和评估,为该 ...

最新文章

  1. CMMI for Development读书笔记-目录
  2. deamon守护进程
  3. 小师妹学JavaIO之:NIO中Channel的妙用
  4. vlc传输_如何使用VLC通过网络流式传输视频和音乐
  5. .NET/C# 使用 ConditionalWeakTable 附加字段(CLR 版本的附加属性,也可用用来当作弱引用字典 )...
  6. bigquery数据类型_将BigQuery与TB数据一起使用后的成本和性能课程
  7. 苹果考虑3月8日或前后发布5G iPhone SE
  8. HDU 1213 How Many Tables 并查集 水~
  9. 让你页面速度飞起来的前端性能优化方案
  10. C# 只允许运行一个实例
  11. oracle技术之让数据库变快的10个建议
  12. linux 进程通信 - 消息队列
  13. 瑞斯康达raisecom交换机基础配置
  14. pearlovell
  15. seo单页html模板,竞价单页模板设计思路
  16. Scrum: 时间框 (Timeboxing) 是什么?
  17. 算法的时间复杂度取决于:
  18. 深度解密Mysql数据库索引
  19. 实施化化工厂人员定位系统势在必行,你不知道的化化工厂人员定位
  20. html自动淡入淡出,纯css实现淡入淡出_html/css_WEB-ITnose

热门文章

  1. LAC:location area code 位置区码
  2. 苹果系统测试硬盘软件怎么看,苹果电脑怎么检查或修好磁盘
  3. 第四篇、vue组件生命周期 beforeDestroy()和destroyed()
  4. 赢商大数据厦门sm城市广场_厦门商业体竞争越来越激烈 老牌商场需加快调整步伐...
  5. 【一分钟解决】SublimeText3多次保存自动弹出窗口
  6. JUC:通过PrintAB管中窥豹
  7. 教你Redis 如何清空所有数据
  8. 超详细的 MySQL 学习教程(多实例、附练习、视频讲解持续更新)
  9. 2023离职与调薪调研报告
  10. android指南针功能,足球竞猜平台 -官网