计算机视觉中存在许多的不适定问题ill-posed problem。先来看什么是适定问题well-posed problem,适定问题必须同时满足三个条件:

  • 1. a solution exists      解必须存在
  • 2. the solution is unique       解必须唯一
  • 3. the solution's behavior changes continuously with the initial conditions. 解能根据初始条件连续变化,不会发生跳变,即解必须稳定

CV中的一些问题经常不满足于条件2和3,,比如图像去噪(ImageDe-nosing),图像恢复(Image Restorsion),图像放大(Image Zooming),图像修补(ImageInpainting),图像去马赛克(image Demosaicing),图像超分辨(Image super-resolution)等。这些问题往往同时属于反问题inverse problem,所以往往需要构建正向过程的模型,而这种逆推的解往往不是唯一的,即有多种可能性,每次只能选择可能性最大的或者说最适合的那一个。

好比是通信中的维纳滤波和信道均衡。

在超分辨率重建中,有两个应用广泛的衰退模型。一个是先使用模糊核卷积,然后以尺度s下采样,然后对信号加一个高斯加性白噪声。模糊滤波卷积核有很多种,比如高斯核,Motion blur和disk blur。如果使用这种模型就意味着我们需要知道卷积核的种类,即便知道了种类也有很多超参数是待定的。另一种是简单地使用三次方插值,比如matlab中的resize函数就是这样。这种模型使得SISR中的CNN方法发展很快,但是因为模型简单,在很多情况下的效果也比较差。至于为什么三次插值的模型对DNN有帮助,需要看一下文献2.

所以,需要做的是改进现有的模型,但是还需要新的模型对DNN也适用。新模型也使用了卷积,下采样,加噪三要素,但是不同的是三者的先后顺序不同。之前的模型是先卷积再下采样,新的模型是先下采样,再卷积。相比于模糊卷积核和加噪,下采样之后的图像仍然可以认为是clean image,所以可以将通常的超分辨重建问题转化为先进行图像去噪和纯粹的超分辨重建,可以利用成熟的去噪方法来估计得到k。

有了退化模型,就可以基于模型和最大后验概率MAP得到能量函数的表达式。能量函数energy function分为两部分,一部分是保真项fidelity(likehood term),一部分是正则项regularization(prior) term。对于判别学习的方法,预测模型对应能量函数;用于训练的HR和LR数据则对应衰退模型,这就解释了为什么基于三次插值衰退模型训练的方法无法在真实数据中依然有较好的表现,因为真实数据的衰退方法更加复杂,且不同。

现在的目标函数是最小化能量函数。首先增加了一个辅助变量z,将原函数变成约束型函数。然后使用HQS方法或者ADMM方法求解。HQS方法又在函数中引入了一个二次惩罚项,惩罚参数越大,使得z越靠近下采样之后的x。求解的过程是一个迭代的过程,分别对z和x求最小化。在假设卷积有圆形边界限制circular boundary condition下,可以在频域得到对z求最小化时的闭式解。

而当对x求最小化时,卷积已经没有了,这时求解对应的衰退模型其实就是下采样+噪声。注意这时对应的模型其实相比于传统的三次下采样模型只是加了一个噪声,所以仍然可以很方便地使用DNN训练。这个衰退模型的参数有两个,一个是采样的尺度参数,一个是噪声的标准差。

总结一下,公式7和8是原问题的两个子问题,公式7可以从频域求解,注意这里包含了模糊卷积核k,减轻了卷积核的变形对结构的影响;公式8则进一步使用更简单的衰退模型和DNN得到没有模糊和噪声的HR图像。可以把公式8对应的求解看作是super-resolver prior,具体地可以使用SRMD网络,因为它本身就包含noise level map,不用额外增加噪声的输入。在这篇文章里,他使用的是基于SRResNet的修改,得到SRResNet+,改变是首先增加了噪声的输入;特征图的数目从64增加到96,;安装文献58的建议去除了BN层。

训练时是对每个尺度因子分别训练一个模型,HR图像从DIV2K数据集中得到,LR是HR经过下采样和加噪的模型得到,噪声图像大小和LR尺寸一样,所有的元素都是sigma,范围从[0,50]

训练时使用Adam优化器,l1损失函数,学习率从e-4开始,每5e+5次迭代学习率减半。batchsize是16,LR的patch尺寸是48x48.

https://arxiv.org/pdf/1903.12529.pdf

即插即用+任意blur的超分辨率重建——DPSR相关推荐

  1. CVPR 2019 神奇的超分辨率算法DPSR:应对图像模糊降质

    点击我爱计算机视觉标星,更快获取CVML新技术 上两幅图像中上面为低分辨率模糊图像,下面大图来自几天前刚出来的超分辨率算法DPSR的结果.在我们的印象中,往往超分辨率后的图像会看起来轻微模糊,但该算法 ...

  2. 视频帧超分辨率重建综述

    **摘要:**序列图像的超分辨率复原是指采用信号处理的方法通过对序列低分辨率退化图像的处理来获得一幅或者多幅SR复原图像,该技术可以弥补硬件实现的局限并且成本低,在视频.遥感等领域有着重要的应用前景. ...

  3. 经典论文复现 | 基于深度学习的图像超分辨率重建

    过去几年发表于各大 AI 顶会论文提出的 400 多种算法中,公开算法代码的仅占 6%,其中三分之一的论文作者分享了测试数据,约 54% 的分享包含"伪代码".这是今年 AAAI ...

  4. 学习笔记之——基于深度学习的图像超分辨率重建

    最近开展图像超分辨率( Image Super Resolution)方面的研究,做了一些列的调研,并结合本人的理解总结成本博文~(本博文仅用于本人的学习笔记,不做商业用途) 本博文涉及的paper已 ...

  5. 基于深度学习的图像超分辨率重建

    最近开展图像超分辨率( Image Super Resolution)方面的研究,做了一些列的调研,并结合本人的理解总结成本博文~(本博文仅用于本人的学习笔记,不做商业用途) 本博文涉及的paper已 ...

  6. 超分辨率重建数据集制作:生成低分辨率数据集

    目录 背景 代码 结果 其他 注意: 超分主流有两种BI.BD. 1.实际上公认的是使用MATLAB进行插值. 2.Bicubic(双三次插值)方式.(BI方式) 3.高斯模糊+双三次插值是另一种常用 ...

  7. 图像超分辨率重建算法,让模糊图像变清晰(附数据和代码)

    一.  图像超分辨率重建概述 1. 概念 图像分辨率是一组用于评估图像中蕴含细节信息丰富程度的性能参数,包括时间分辨率.空间分辨率及色阶分辨率等,体现了成像系统实际所能反映物体细节信息的能力.相较于低 ...

  8. 一文掌握图像超分辨率重建(算法原理、Pytorch实现)——含完整代码和数据

    目录 一.  图像超分辨率重建概述 1. 概念 2. 应用领域 3. 研究进展 3.1 传统超分辨率重建算法 3.2 基于深度学习的超分辨率重建算法 二.  SRResNet算法原理和Pytorch实 ...

  9. 超分辨率重建开山之作——SRCNN

    论文及代码地址:Learning a Deep Convolutional Network for Image Super-Resolution) 基于卷积神经网络的影像超分辨率重建 摘要: 我们提出 ...

最新文章

  1. U3D中可以直接使用GL!!!
  2. 高德深度信息接入的平台化演进
  3. 技术实战 —— 快速实现语聊房搭建
  4. mapreduce 算法_MapReduce算法–顺序反转
  5. java怎么用doss窗口_GitHub - doss128/symphony: 一款用 Java 实现的现代化社区(论坛/BBS/社交网络/博客)平台。...
  6. (转)使用Spring的注解方式实现AOP的细节
  7. figma客户端_小白的Figma入门手册
  8. pandas小记:pandas数据输入输出
  9. 根据crash学习用户空间程序内存布局
  10. Nsight Compute Profile Kernel无法定位源码问题
  11. m3 pcb开孔 螺丝_螺丝过孔及工艺孔尺寸参照表
  12. 地震勘探算法matlab,SeismicLab 地震勘探,matlab程序包, 地球物理, 学。作图工具等。 249万源代码下载- www.pudn.com...
  13. 前端工程化之前端静态资源缓存优化和部署
  14. 海康威视工业相机驱动下载地址
  15. 单文件PHP版视频解析源码(中间件)
  16. 学习计划大纲(大一)
  17. html卷轴展开动画,Flash制作卷轴展开的动画
  18. python自动录音程序
  19. youtube 字幕视频搬运
  20. 初识设计模式 - 解释器模式

热门文章

  1. 转usb驱动cmw500 ni_支持USB Type-C接口的外置蓝光驱动器IO Data BRP-UT6 / MC2本月发售...
  2. PAT乙类1009 说反话 (20 分)
  3. 卷积神经网络中十大令人拍案叫绝的操作
  4. 论文浅尝 | IRW:基于知识图谱和关系推理的视觉叙事框架
  5. 论文浅尝 | 用于开放领域的问题生成
  6. day-17 包与模块
  7. 网络版ATM项目的实现——客户端
  8. day2-元组 列表-赋值和深浅拷贝
  9. iOS加入百度地图的几个问题
  10. 404页面自动跳转javascript