#深度学习图像去噪发展概述

由于深度学习,特别是卷积神经网络(CNN)在图像识别等领域取得了较好的成果,近年来,基于深度学习的图像去噪方法也被提出并得到了发展。2008年,Viren Jain等提出用CNN处理自然图像的去噪问题[21],得到了与常规方法(如小波变换和马尔可夫随机场)相近或更优的结果。并说明了特定形式的CNN可以被视为图像去噪的马尔可夫模型推断的结果的一种近似,但是神经网络模型可以避免了马尔可夫模型在概率学习和推断过程中的计算困难,从而降低了计算的复杂度。在训练神经网络的过程中为了更加快速和准确的收敛,采取了逐层训练的方法。该方法网络结构如下图所示:

图2.1 Viren Jain等的图像去噪卷积神经网络模型(CN1和CN2区别于训练集的不同)

该网络由四个隐含层组成,每个隐含层含有24个特征通道,每一个特征通道都与8个随机选择的上一层的特征通道相连接。该网络的卷积核大小为5×5,网络的损失函数为带噪图像经过神经网络去噪后的恢复图像和真实图像的误差平方和,即:。除了对噪声已知的情况进行训练和去噪,作者还测试了噪声未知情况下的去噪情况,将在σ=[0,100]的范围内随机变化的不同水平的噪声加入真实图像,并进行训练,此时将隐含层设置为5层,相对于传统方法也取得了较好的效果。

2012年,Xie等利用栈式去噪自编码器(stacked denoising auto-encoder)进行图像去噪以及图像修复(image inpainting)[22],其网络结构为多层的全连接网络,如图2.2所示。

图2.2 栈式稀疏去噪自编码器(SSDA)

为了将稀疏编码的思想和深度神经网络结合,作者提出了栈式稀疏去噪自编码器(stacked sparse denoising auto-encoder, SSDA),其损失函数如下:

其中KL散度中的ρ^ 代表隐含层激活函数输出的平均值,如果我们设定较小的ρ,则可以通过优化损失函数,使得每一层中被激活的神经元尽可能少,以此达到稀疏约束的目的。训练过程为逐层训练,每训练完一层后,将训练用的数据(带噪图像)和标签(真实图像)都通过该层,将输出送至下一层作为数据和标签进行训练。

Burger等人提出了用多层感知机(Multi Layer Perceptron,MLP)的方法实现神经网络去噪[23],并说明如果训练集足够,MLP模型可以达到图像去噪的当前最优水平。MLP模型对噪声类型不敏感,对于不同类型的噪声,只要对带有该类噪声的图像进行处理,即可得到较好的结果。作者认为,MLP相对于CNN的优点在于,MLP可以近似所有函数,而CNN可以学习到的函数相对有限。为了使MLP网络达到最优水平,训练网络应足够大,分割图像得到的区块大小应足够大,以及训练集也应足够大。该方法的一个不足之处为它无法适应不同强度的噪声,若将不同水平的噪声图像作为输入进行训练则无法达到对特定噪声进行训练时的结果。

2016年,Mao等提出了深度的卷积编解码网络应用于图像去噪[24]。编码(Encoding)和解码(Decoding)结构对称,且每隔较少层就存在一条由编码卷积层到与其对称的解码层的跨层连接。该网络结构如图2.3所示。该网络共采用了对称的10层卷积层,其中前5层为编码层,后5层为解码层。在该CNN网络的编码层中,每隔2层就用一条跳线将编码层连接到对称的解码层,因此可以直接进行正向和反向传播。从该网络开始,图像去噪神经网络层数开始向更深层发展。以前的神经网络层数普遍较浅,原因在于:一方面,与图像分类等问题只需要提取关键特征的任务不同,图像的复原要求图像的细节在网络传播中不能丢失,而网络层数变深可能会导致图像细节的丢失;另一方面,层数较深容易在训练过程中导致梯度弥散,不容易收敛到最优解。由于该网络采用了卷积和解卷积层间的跳线连接,因此可以较好的解决上述的问题,因此网络相对较深。

图2.3 卷积编解码去噪网络结构(示跳线)

2017年,Zhang等提出用较深层的CNN网络,称为DnCNN[25],实现去噪,为了解决网络层数加深导致的梯度弥散效应,DnCNN并不对图像进行学习,而是以输出与噪声的l2范数为损失函数来训练网络。网络结构如图2.4所示。DnCNN网络可以视为一个残差学习的过程,这样可以较好的训练。在该网络中利用了BN层(Batch Normalization),实验表明BN层与残差学习共同使用可以提高模型的性能,DnCNN在不同噪声水平上训练,得到的结果要优于现在的最优结果,如BM3D等。

图2.4 DnCNN 网络结构

dncnn图像去噪_深度学习图像去噪发展概述相关推荐

  1. 深入浅出深度学习(一)深度学习的发展

    人工智能.机器学习.深度学习的关系 1. 人工智能--机器推理 利用计算机构建具有人类智力特征的复杂机器,即为通用人工智能或强人工智能,即让机器拥有人类的所有感觉.所有理智.像人类一样思考.要实现真正 ...

  2. 深度学习 图像分类_深度学习时代您应该阅读的10篇文章了解图像分类

    深度学习 图像分类 前言 (Foreword) Computer vision is a subject to convert images and videos into machine-under ...

  3. 机器学习_深度学习毕设题目汇总——场景

    下面是该类的一些题目: 题目 场景语义解析理论与方法研究 基于RGB-D视频序列的大尺度场景三维语义表面重建技术研究 基于图神经网络的场景理解算法研究 基于场景理解和深度学习的滞留物识别和异常行为检测 ...

  4. 处理器_深度学习及 KPU 基础知识

    kpu 处理器_深度学习及 KPU 基础知识_weixin_39909212的博客-CSDN博客深度学习及 KPU 基础知识1. 阅读完本章文档可以了解什么?了解深度学习一些基础内容了解 K210 内 ...

  5. 差分隐私 深度学习_深度学习中的差异隐私

    差分隐私 深度学习 I would like to thank Mr. Akshay Kulkarni for guiding me on my journey in publishing my fi ...

  6. 深度学习深度前馈网络_深度学习前馈网络中的讲义第4部分

    深度学习深度前馈网络 FAU深度学习讲义 (FAU Lecture Notes in Deep Learning) These are the lecture notes for FAU's YouT ...

  7. 常见的深度学习优化算法(概述)

    这边简要都说一下深度学习各种优化算法的原理,以及实现. 梯度下降(Gradient Descent) 在说梯度下降前先了解一下学习率(learning rate,我们这里记作η\etaη) 学习率作为 ...

  8. 深度学习的发展可能已达极限!

    [编者按]回首 2018 年,身处技术圈的你是否曾反思过些什么--科技与非科技企业界限的日益模糊.技术的发展现状和前景.科技发展的正向助推到负面效应,乃至个人心态上的变化.人文.生态.社会--玩技术的 ...

  9. 卷积神经网络精确率不增反降_深度学习 第四门课:卷积神经网络(Convolutional Neural Networks)...

    "本文大约有 4864 字. 01|引言 在这两周时间里,我主要的学习内容如下: 重新复习了一遍前三门课: 学完第四门课卷积神经网络(ConvolutionalNeural Networks ...

最新文章

  1. 【OpenCV】将图像数据由YUV格式转换成JPG格式直接使用,而不保存成文件
  2. vsftpd服务安装与虚拟用户配置
  3. 如何评价软件写的好还是坏?
  4. 论文笔记 Spectral Regularization Algorithms for Learning Large IncompleteMatrices (soft-impute)
  5. thinkphp scws mysql_thinkphp buildHtml 函数实现网站静态化
  6. 最全的C#图片处理类ImageHelper.cs
  7. Shiro <shiro:hasPermission >标签不生效,shiro权限不生效原因
  8. 文本分类-TensorRT优化结果对比图
  9. TQ210——S5PV210启动过程
  10. springboot+security框架整合
  11. 【Oracle】ORA-00054: resource busy and acquire with NOWAIT specified or timeout expired
  12. 华为虚拟专网客户端SecoClient报错“接受返回码超时”故障
  13. android ios 声音大小,嫌手机声音太小?打开这个,声音瞬间放大10倍!
  14. [MATLAB]代数/常微分求解(solve/dsolve)
  15. 苹果 服务通知 V2
  16. 第十六周助教工作总结——NWNU李泓毅
  17. CrystalDiskInfo 各项参数说明
  18. python读取txt文件中的数字_python从txt文件读取数据
  19. 网页设计实验四(DIV+CSS 综合运用 )
  20. 为什么手机充电时会感觉麻麻的,有问题吗?

热门文章

  1. setaspectratio函数_ProCAST介绍及菜单详解分解
  2. 自定义jsp标签来防止表单的重复提交
  3. AVI 视频文件的播放
  4. [nssl132][jzoj cz 2106] 买门票 {dfs}
  5. K8S日志挂载到本机
  6. 利用python库中的turtle模块绘制自己的名字
  7. JavaWeb+MySQL+MVC三层架构实现课程管理系统
  8. 所有部门之间的比赛组合
  9. 显示器要申请BS 476-7 怎么送样?跟显示屏一样吗
  10. 微信小程序开发07 数据监控:善用数据驱动产品迭代