时间 期刊 方法 训练集 测试集 损失函数 效果 评价指标
2017年 cvpr 一种从粗到细逐步预测的方法。 291数据集。使用三种方式进行数据扩充。 SET5 [2], SET14 [39], BSDS100 [1], UR-
BAN100 [15] and MANGA109 [23]
鲁棒的Charbonnier损失函数 在基准数据集上进行的大量定量和定性评估表明,该算法在速度和准确性方面优于最新的方法 PSNR、SSIM[32]和IFC[27]

论文地址:Deep laplacian pyramid networks for fast and accurate super-resolution

代码: twtygqyy/pytorch-LapSRN: Pytorch implementation for LapSRN (CVPR2017) (github.com)

LapSRN (ucmerced.edu)

引言

近年来,基于实例的SR方法通过使用大型图像数据库学习从LR到HR图像补丁的映射,展示了最先进的性能。很多学习算法被用于学习这样的映射,包括字典学习[37,38],局部线性回归[30,36],随机森林[26]。

SRCNN

目前存在通过在低分辨率空间执行卷积操作,最后使用反卷积或者是亚像素卷积来实现放大来加速SRCNN。比如FSRCNN,ESPCN。但是这些方法网络结构相对较小,没法学习复杂的映射。而且,现在存在的方法大都使用L2损失函数,这将会导致模糊。这是因为L2损失没法捕捉高分辨率图片的多模态分布。现有的方法都是基于一个上采样因子重建图像,而且不能生成中间的预测结果。

提出了基于级联卷积神经网络(CNNs)的拉普拉斯金字塔超分辨率网络(LapSRN)。我们的网络以LR图像作为输入,并以从粗到细的方式逐步预测子带残差。在每一层,我们首先应用卷积层来提取特征。然后,我们使用转置卷积层将特征映射上采样到更精细的级别。最后,我们使用卷积层来预测子带残差(上采样图像和地面真实HR图像在各自层次上的差异)。利用每一层的预测残差,通过上采样和额外的操作高效地重建HR图像。

我们的算法与现有的基于cnn的方法有以下三个方面的不同:

  1. 精度。直接在低分辨空间提取特征。使用优化的深度卷积预测子带残差。使用Charbonnier损失函数。
  2. 速度。
  3. 逐步重建。使用拉普拉斯金字塔渐进式重建,在前馈过程中可以生成多个中间SR预测。

相关工作

基于内部数据库的SR

基于内部数据库的SR方法的主要缺点是在尺度空间金字塔中进行patch搜索的计算量大,速度慢。

基于外部数据库的SR

大量的SR方法使用监督学习算法从外部数据库中收集的图像对学习LR-HR映射,如最近邻[10],流形嵌入[2,5],核脊回归[19]和稀疏表示

基于卷积神经网络的SR

为了快速训练比较深的网络,VDSR训练残差而不是真实的像素。

Wang等人[33]将稀疏编码的领域知识与深度CNN结合起来,训练一个级联网络(SCN),逐步将图像上采样到所需的尺度。

Kim等[18]提出了一种深度递归层的浅层网络(DRCN),以减少参数的数量。

为了实现实时性,ESPCN网络[28]在LR空间提取特征映射,并用高效的亚像素卷积代替双三次上采样操作。FSRCNN网络[8]采用了类似的思路,它使用的是沙漏形CNN,与ESPCN相比,CNN的层数更多,但参数更少。以上方法都是使用L2损失函数,但是这往往会导致结果过于平滑。

拉普拉斯金字塔

拉普拉斯金字塔被广泛应用于图像混合[4]、纹理合成[14]、边缘感知滤波[24]和语义分割等领域[11,25]。Denton等人提出了一种基于拉普拉斯金字塔框架(LAPGAN)的通用模型来生成[6]中的逼真图像,这与我们的工作最为相关。然而,所提出的LapSRN与LAPGAN有三个不同之处

首先,LAPGAN是一种生成模型,旨在从随机噪声和样本输入中合成不同的自然图像。相反,我们的LapSRN是一个超分辨率模型,它基于给定的LR图像预测特定的HR图像。LAPGAN使用交叉熵损失函数。相反,我们使用Charbonnier惩罚函数。

其次,LAPGAN的子网络是独立的(即不共享权重)。因此,网络容量受到每个子网深度的限制。与LAPGAN不同,LapSRN中每一层的卷积层都是通过多通道转置卷积层连接的。因此,通过在较低层次上共享特征表示的更深层次网络来预测较高层次上的残差图像。较低层次的特征共享增加了较精细卷积层的非线性,以学习复杂映射。此外,LAPGAN中的子网络是独立训练的。另一方面,LapSRN中所有用于特征提取、上采样和剩余预测层的卷积滤波器以端到端、深度监督的方式联合训练。

对抗训练

SRGAN方法[20]利用感知损失[16]和对抗性损失优化了网络。我们注意到我们的LapSRN可以很容易地扩展到对抗性训练框架。

Deep Laplacian Pyramid Network for SR

网络结构

特征提取

在s层,特征提取分支由d个卷积层和一个反卷积层组成,对提取的特征进行2倍上采样。每个反卷积层的输出连接到两个不同的层 (1)用于重建s级残差图像的卷积层,(2)用于提取s + 1级精细特征的卷积层。

我们在粗分辨率上执行特征提取,并在只有一个转置卷积层的较细分辨率上生成特征图。

与现有网络在精细分辨率下进行所有特征提取和重建相比,我们的网络设计大大降低了计算复杂度。请注意,较低层次的特征表示是与较高层次共享的,因此可以增加网络的非线性,以在较细的层次学习复杂的映射。

图像重建

在s级,输入图像通过一个反卷积(上采样)层以2的比例上采样。我们用双线性核初始化这一层,并允许它与所有其他层联合优化。然后,将上采样图像与来自特征提取分支的预测残差图像结合(使用元素求和),产生高分辨率输出图像。然后将输出的s级HR图像送入s + 1级图像重建分支。整个网络是一个级联的cnn,每一级的结构都是相似的

损失函数

提出的LapSRN,每级都有对应的损失函数。这种多重损失结构类似于用于分类[21]和边缘检测[34]的深度监督网络。然而,[21,34]中用于监督中间层的标签在整个网络中是相同的。在我们的模型中,我们使用相应级别的不同比例的HR图像作为监督。深度监督引导网络训练预测不同层次的子带残差图像,产生多尺度输出图像。例如,我们的8×模型可以在一个前馈通道中产生2×、4×和8×超分辨率的结果。

训练细节

在提出的LapSRN中,每个卷积层由64个大小为3 × 3的滤波器组成。我们使用He等人[13]的方法初始化卷积滤波器。

反卷积滤波器大小为4 × 4,权值由双线性滤波器初始化。

所有的卷积层和反卷积(除了重建层)之后都有一个负斜率为0.2的LReLUs。在应用卷积之前,我们在边界上添加0,以保持所有特征映射的大小与每级的输入相同。卷积滤波器具有较小的空间支持(3 × 3)。然而,我们可以实现高非线性,并通过深度结构增加接收域的大小。

我们使用Yang et al.[38]中的91幅图像和Berkeley Segmentation Dataset[1]的训练集中的200幅图像作为我们的训练数据。[17,26]中也使用了相同的训练数据集。在每个训练批中,我们随机抽取64个patch,patchsize大小为128 × 128。一个epoch有1000次反向传播。我们通过三种方式对训练数据进行扩充:(1)scale:在[0.5,1.0]之间随机降尺度。(2)旋转:随机旋转图像90◦,180◦,或270◦。(3)翻转:水平或垂直翻转图像,概率为0.5。

我们使用双三次降采样生成LR训练块。

我们设置动量参数为0.9,权重衰减为1e−4

所有层的学习率初始化为1e−5,每50个epoch学习率降低2倍

实验结果

模型分析

残差学习

为了证明残差学习的效果,我们去除图像重建分支,直接对每一层的HR图像进行预测。

图2给出了4× sr时SET14的PSNR收敛曲线。“非残差”网络(蓝色曲线)的性能收敛缓慢,波动明显

另一方面,提出的LapSRN(红色曲线)在10个epoch内表现优于SRCNN

损失函数

为了验证Charbonnier损失函数的效果,我们使用L2损失函数训练所提出的网络。

我们使用更大的学习率(1e−4),因为L2梯度幅度更小。

金字塔结构

网络深度

视觉对比实验

SET5、SET14和BSDS100由自然场景组成;URBAN100包含具有挑战性的城市场景图像,细节在不同频段;MANGA109是日本漫画的数据集。我们训练LapSRN,直到学习率下降到1e−6,在Titan X GPU上训练时间约为三天。

执行时间

总结

提出了一个深度卷积网络内的拉普拉斯金字塔框架,以快速和准确的单图像超分辨率。

我们的模型以从粗到细的方式逐步预测高频残差。通过用学习得到的转置卷积层替换预定义的双三次插值,并使用鲁棒损失函数优化网络,所提出的LapSRN缓解了不必要的伪信号问题,降低了计算复杂度。对基准数据集的大量评估表明,该模型在视觉质量和运行时间方面优于最先进的SR算法。

Deep Laplacian Pyramid Networks for Fast and Accurate Super-Resolution相关推荐

  1. Drafting and Revision: Laplacian Pyramid Network for Fast High-Quality Artistic Style Transfer--T Li

    [1] Lin T , Ma Z , Li F , et al. Drafting and Revision: Laplacian Pyramid Network for Fast High-Qual ...

  2. CVPR-Drafting and Revision: Laplacian Pyramid Network for Fast High-Quality Artistic Style Transfer

    [CVPR-2021] Drafting and Revision: Laplacian Pyramid Network for Fast High-Quality Artistic Style Tr ...

  3. 论文笔记:Large Deformation Diffeomorphic Image Registration with Laplacian Pyramid Networks

    本文是论文<Large Deformation Diffeomorphic Image Registration with Laplacian Pyramid Networks>的阅读笔记 ...

  4. 超分辨率图像重建-拉普拉斯金字塔(laplacian pyramid)

    <Deep Laplacian Pyramid Networks for Fast and Accurate Super-Resolution>笔记,有什么理解错误的地方,欢迎大家指正. ...

  5. Feature Pyramid Networks for Object Detection论文翻译——中英文对照

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 声明:作者翻译论文仅为学习,如有侵权请联系作者删除博文,谢谢! 翻译论文汇总:https://github.com ...

  6. 论文精读:FPN:Feature Pyramid Networks for Object Detection

    Abstract 特征金字塔是识别系统中检测不同尺度物体的基本组成部分.但最近的深度学习对象探测器已经避免了金字塔表示,部分原因是它们是计算和内存密集型的.本文利用深度卷积网络固有的多尺度金字塔层次, ...

  7. 【论文笔记】Feature Pyramid Networks for Object Detection

    文章目录 Abstract 1. Introduction 3. Feature Pyramid Networks 4. Applications 4.1. Feature Pyramid Netwo ...

  8. 【深度学习】论文导读:ELU激活函数的提出(FAST AND ACCURATE DEEP NETWORK LEARNING BY EXPONENTIAL LINEAR UNITS (ELUS))

    论文下载: FAST AND ACCURATE DEEP NETWORK LEARNING BY EXPONENTIAL LINEAR UNITS (ELUS)(2016,Djork-Arn´e Cl ...

  9. 论文翻译——Feature Pyramid Networks for Object Detection

    摘要: 特征金字塔是识别系统中检测不同尺度目标的基本组成部分.但最近的深度学习对象检测器已经避免了金字塔表示,部分原因是它们需要大量的计算和内存.本文利用深度卷积网络固有的多尺度金字塔层次结构,以额外 ...

最新文章

  1. CVPR2020事件相机(Event Camera)研究文章汇总
  2. 小程序中Cannot read property ‘setData‘ of undefined问题的解决
  3. python人脸识别毕业设计-Python基于Dlib的人脸识别系统的实现
  4. MATLAB中常用的产生随机数的几种函数
  5. CSMA/CD协议分析笔记
  6. iis设置服务器文件权限设置,iis7如何配置写入权限以上传文件---急急急
  7. Jquery快速构建可拖曳的购物车-DragDrop
  8. 汽车上的一些名词缩写解释
  9. 【一线】亚马逊AWS首席科学家:语音识别取得突破
  10. redis的安装和常用命令
  11. 实习踩坑之路:实习以来获得的踩坑经验、一些提升开发效率的方法或者常用技巧
  12. 线性代数及其应用(part2)--特征方程
  13. 20189216 2018-2019-2 《密码与安全新技术专题》课程总结报告
  14. 关于未来IOT和移动APP集成的五个预言
  15. redhat6静默安装oracle11g,redhat6.2静默安装oracle11gr2
  16. Error: PostCSS received undefined instead of CSS string核心解决方法
  17. 计算机apk文件无法打开,【电脑怎么打开apk文件】电脑如何打开apk文件_电脑上怎么打开apk-系统城...
  18. 攻防世界逆向-logmein
  19. 以“掌上东航”为例,论混合开发在企业级项目中的实践
  20. windows批量删除指定后缀文件

热门文章

  1. 第一次课设完成后的闲谈——学生宿舍管理系统
  2. 微星小飞机无法定位序数6744
  3. A*寻径算法新手入门
  4. EMC测试(5)——传导发射测试(CE)
  5. (全网最细)顺序栈详解 +实例解析
  6. 用 js判断 一个数是否是素数(质数)_小学五年级下册数学公式打印版,孩子考试用的上!...
  7. 如何创建个人微信公众号
  8. 软件测试的起源 [ 光影人像 东海陈光剑 的博客 ]
  9. iOS 打包上线 bitcode问题
  10. html中如何插入草书,行草书转折十法举例