图像超分辨率 之 DRN (Closed-loop Matters: Dual Regression Networks for Single Image Super-Resolution)论文解读与感想

DRN是在2020年顶会(CVPR)上发表的一篇想法简单,但是结果非常不错的文章。

  1. 先来说一下文章的切入点

首先,对于图像超分辨率,可以说是一个经典的病态问题(ill-posed problem)。因为一个高分辨率图像可以通过不同的下采样(downscaled)方法获得不同的低分辨率图像,这也就是论文中所表达的 HR images that can be downscaled to obtain the same LR image。什么叫做病态问题呢,就是说这类问题是没有一个真正正确的结果的,或者说是我们无法去验证我们的结果是否正确。这让我联想起类似于一个一元函数,一个自变量却对应多个函数值(数学上这是不成立的)。由于病态问题的解不唯一,这就使得可能的模型映射空间无比巨大,在这个空间中寻找一个合适且性能优异的映射非常困难(the space of the possible functions that map LR to HR images becomes extremely large)。
其次,在真实应用时,我们通常是无法获取成对(paired data)的HR image和LR image的。我们知道在进行仿真实验时,我们通常会选择将一张HR图像进行人工降低分辨率(e.g.,performing Bicubic kernel to produce LR-HR pairs)那么我们的模型实际上是已知自变量和结果,在模拟一个Bicubic的逆变换,然而如果这个LR不是通过Bicubic 方法得到的,甚至是多种下采样方法共同得到的,很明显我们事先使用Bicubic人工生成的paired data所训练的模型,就会出现问题,这也就是作者所说的以往传统方法泛化性不好的原因(incur a severe adaptation problem and yield poor performance)。

  1. 针对上面两个问题,作者提出了理论上的解决方法

降低映射空间的复杂度 and 直接使用LR image对模型进行训练
如何降低映射空间的复杂度,很明显,给模型添加更多的限制就可,因为限制越多,所满足限制的可能的解就越少嘛。但是有一点需要强调,所添加的限制一定是对模型原本的限制有促进作用的限制,这样才能在原本的映射空间里求子空间(这样万能的对抗损失就没法用了)。了解过data imputation领域的应该知道,data imputation也是一种经典的病态问题,而如果将结果的不确定性考虑进去,所获得的结果精度往往会有很大的提升(经典的有GAIN1, MICE2
直接使用LR image对模型进行训练,这就牵扯到一个image to image conversion中一个经典的问题,unpaired data。在图像风格转换领域,使用unpaired data的经典之作是CycleGAN,它是通过将输入图像映射为目标域中的结果,又将这个结果映射回原始的输入图像来进行训练的,这就巧妙的避开了使用paired data训练模型。

  1. 紧接着,作者给出了一种全新的模型:DRN

给出一个论文的模型图。可以看到相比于传统的SR model(蓝色部分),这篇文章多了一个往回的步骤(红色部分),因而整个训练过程呈现出一个循环,这也是为啥这篇文章叫这么个名字,生动形象。这个图中有两个已知量(x,y)(x,y)(x,y),这代表成对的LR image和HR image,在训练过程中,模型将xxx映射成伪HR image y^\hat{y}y^​,然后和真实的HR image求一个primal regression loss Lp(y,y^)L_p(y,\hat{y})Lp​(y,y^​),之后通过dual regression task将y^\hat{y}y^​再映射成LR image x^\hat{x}x^,求取一个dual regression loss Ld(x,x^)L_d(x,\hat{x})Ld​(x,x^)。最后联合优化Lp+LdL_p+L_dLp​+Ld​。
当输入的数据是unpaired data时,也就是此时没有y,那么我们就放弃LpL_pLp​一项,转而仅仅优化LdL_dLd​一项,这么看,后一项才是本文的灵魂。

这个过程乍一看和CycleGAN很像,但是作者也对二者进行了对比,给出了不同点:
首先,CycleGAN是通过cycle loss实现的,而本文是通过添加额外的约束LdL_dLd​实现的。这点我的理解是 在CycleGAN中,模型需要训练两个生成器和两个鉴别器,这就使得模型的训练时间和参数都增加了一倍,而在DRN中,这个往回走的过程是通过一个简单的下采样网络(文章称之为 dual network)来实现的,很明显这个下采样网络的结构要比原始网络简单,训练起来也容易的多。这里给出我个人的一个疑问:既然这个采样过程都是将一个图像进行相同倍数的下采样,可否将dual network和primal network的前半部分下采样共享参数呢,理论上这样可以在不破坏模型性能的基础上进一步提升模型训练效率,减少参数,这个问题有待思考。
其次,在训练数据的选择上,作者提出CycleGAN直接放弃了paired data,仅仅使用unpaired data进行训练,而本文可以同时使用paired data和unpaired data进行训练,其中两部分数据的比例使用ρ=m/(m+n)ρ = m/(m + n)ρ=m/(m+n) 进行调节,其中m,n是两类数据的数量。关于这一点我觉得有点牵强,因为相比于图像超分辨率领域,图像风格转换领域的paired data难以获得的多,所以CycleGAN仅仅针对于unpaired data也是有现实因素在里面的(大清自有国情在啊…)不过我们不可否认,从文章后面的消融实验可以看出,通过ρρρ来调节两类数据为适当比例进行训练,确实在一定程度上可以提升模型性能。

  1. 总结

本文作为第一篇在图像超分辨率领域使用环形训练方式的文章,用一种很独特的方法极大的提升了模型的性能。此外,虽然文章给出的是一种具体模型,但是我个人认为,这种方法是通用性的,只需将dual network稍加改进,便可添加到已有的图像超分辨率模型中使用。


  1. Yoon J., Jordon J. & van der Schaar M. (2018) Gain: Missing data imputation using generative adversarial nets. In International Conference on Machine Learning (ICML).。 ↩︎

  2. Sanchez-Morales, A., Sancho-Gómez, J. L., Martınez-Garcıa, J. A., & Figueiras-Vidal, A.R. (2020). Improving deep learning performance with missing values via deletion and compensation. Neural Computing and Applications, 32(17), 13233-13244 ↩︎

图像超分辨率 之 DRN 论文解读与感想相关推荐

  1. 图像超分辨率 之 GLEAN论文解读与感想

    本文出发点: 对于图像超分,目前主流方法有两种: 其一是已经非常完善的基于GAN的图像重建.生成器接受一个LR图像,并将其上采样为一个SR图像,鉴别器负责度量生成的图像和真实高分辨率图像的差异.这样的 ...

  2. 经典论文复现 | 基于深度卷积网络的图像超分辨率算法

    过去几年发表于各大 AI 顶会论文提出的 400 多种算法中,公开算法代码的仅占 6%,其中三分之一的论文作者分享了测试数据,约 54% 的分享包含"伪代码".这是今年 AAAI ...

  3. 【图像超分辨率】基于ResNet或GAN的遥感图像超分辨率论文

    基于ResNet或GAN的遥感图像超分辨率论文 <空间感知残差网络的遥感图像超分辨率重建> 操作: 遥感图像特点: 网络模型: 去掉批处理层的原因: 具体操作 损失方程: <改进的残 ...

  4. ICCV2021|底层视觉(图像生成,图像编辑,超分辨率等)相关论文汇总(附论文链接/代码)[持续更新]

    ICCV2021|底层视觉和图像生成相关论文汇总(如果觉得有帮助,欢迎点赞和收藏) 1.图像生成(Image Generation) Multiple Heads are Better than On ...

  5. 【图像超分辨率重建】——EnhanceNet论文精读笔记

    2017-EnhanceNet: Single Image Super-Resolution Through Automated Texture Synthesis(EnhanceNet) 基本信息 ...

  6. 图像超分辨率近两年几篇优秀论文及代码

    最近看了很多图像超分辨率方面的文章,所以做一个总结,希望对大家有所帮助.所列出的文章都是很好的文章,其中包括一些顶级会议:CVPR,ICCV,ECCV等.其中有代码的我会给网址,还有的代码不公布.最后 ...

  7. 【图像超分辨率论文】BasicVSR: The Search for Essential Components in Video Super-Resolution and Beyond

    BasicVSR: The Search for Essential Components in Video Super-Resolution and Beyond Abstract 视频超级分辨率( ...

  8. 【图像超分辨率重建】——HAN论文精读笔记

    2020-Single Image Super-Resolution via a Holistic Attention Network(HAN) 基本信息 作者: Ben Niu; Weilei We ...

  9. 【图像超分辨率重建】——SwinIR论文精读笔记

    2021-SwinIR: Image Restoration Using Swin Transformer (SwinIR) 基本信息 作者: Jingyun Liang, Jiezhang Cao, ...

最新文章

  1. php 7 显示错误信息,PHP 7 错误处理
  2. 如何居中一个元素(终结版)
  3. 解决mysql“Access denied for user root@localhost”
  4. 加法器的verilog实现(串行进位、并联、超前进位、流水线)
  5. IDEA中常用快捷键整理及重置快捷键
  6. MPC运动学方法实现轨迹跟踪推导
  7. win10专业版虚拟机配置服务器,如何在Win10专业版中添加Hyper-V虚拟机?
  8. 也论不使用第三个变量交换两个变量的值[C#]
  9. JAVA项目案例详解带代码
  10. noip2017提高组初赛(答案+选择题题目+个人分析)
  11. 贪心算法解决哈夫曼编码问题
  12. 洛谷试炼场:单词接龙
  13. Unity的超大开放世界解决方案
  14. 工商管理专业知识与实务(初级)【7】
  15. java计算机毕业设计家教平台系统源码+mysql数据库+系统+lw文档+部署
  16. 【Visual Studio 2019 - Unknown override specifier error】Problems when compiling dbghelp.h
  17. 如何实现自定义主题切换?
  18. Ubuntu16.04如何设置自动休眠时间
  19. 【数据结构】算法的渐进分析-渐进时间复杂度
  20. 斯坦福AI2021报告出炉!详解七大热点,论文引用中国首超美国

热门文章

  1. AndroidStudio中使用Git发布与更新,同步到本地(github关联)
  2. vue-router之 tag 和 v-solt 对比
  3. Kcauldron服务端linux版,我的世界1.7.10[KCauldron]服务端精简基础整合包
  4. 论文笔记1-如何书shui论文之会议论文的发表规则与方法
  5. 流浪地球:中国真正意义上的第一部硬科幻电影
  6. MySQL复习笔记(燕十八)
  7. 曹建农院士:未来边缘计算:趋于分布式智能
  8. python命令启动端口
  9. S3C2440 流水灯 (TQ2440)
  10. linux中关闭开机自启动网络服务命令chkconfig