©作者 | 高帆

学校 | 北京邮电大学

研究方向 | 计算机视觉

随着 Transformer 的提出以及在底层任务上应用的进一步探索,相信在很多底层任务数据集上可以取得新的 SOTA 成绩。但是不可否认的是,现有数据集的指标提升逐渐趋于平缓,似乎来到了一个瓶颈。要继续向前迈步,短期内难以出现超越 Transformer 的网络结构,那另一方面则是方法上的创新,一些被广泛应用于高层视觉任务的方法,诸如对比学习、度量学习等,是否值得借鉴?

CVPR 2021 的文章 Contrastive Learning for Compact Single Image Dehazing 在去雾任务中引入对比学习,消融实验也证明对比学习的引入有助于网络性能的提升。但其使用对比学习的方法仍旧比较粗糙,这也是个人认为这篇文章虽然实验结果提升不大,但是在思路上有较大意义的地方——上文采用一个预训练 VGG 将图像映射至隐空间计算对比损失,去雾网络和 VGG 存在一定的脱节,而且对比学习的成效很大意义上取决于 VGG 的能力强弱。另一点则是正负样本的选择。这两点都是本文所考虑以及试图解决的问题,作者也做出了自己的尝试。个人还是很期待作者能把这个方法继续做 work,提升实验结果的。

论文标题:

A Practical Contrastive Learning Framework for Single Image Super-Resolution

论文链接:

https://arxiv.org/abs/2111.13924

Abstract

对比学习在高层视觉任务中取得了巨大成功,但在底层视觉任务中很少提出相关方法。将为高层任务设计的原始对比学习方法直接应用于底层任务是颇具挑战性的,因为获取的全局视觉表征不足以重建得到丰富的纹理与细节信息。本文基于样本构建与特征提取两个角度,为单图超分(SISR)提出了一种显著的对比学习框架。

现有方案提出了一些简单的样本构建方法(例如将低质量输入视为负样本,gt 视为正样本)并采用先验模型(预训练的 VGG)以获得特征嵌入而不是探索一种任务友好的方式。为此,我们为 SISR 提出了一种实用的对比学习框架,涉及在频率空间中生成信息量大的正样本与困难负样本。

本文设计一种从鉴别器网络继承的简单但有效的嵌入网络,而不是利用额外的预训练网络,并且可以使用主 SR 网络进行迭代优化,使其具有任务泛化性。最后我们进行额外的验证实验相比于基准方法并比现在的 SOTA 方法获得 0.21dB 的增益。

Introduction

对比学习在无监督表示学习已经成为一种有效的范例。基于实例差异的前置任务,这些方法通过从相同实例相似性与不同实例差异性获得经验以学习视觉表征。这些学习到的视觉表征对以高层任务为主的许多下游任务均增益,且效果可观,如有监督的图像分类,图像聚类,细粒度图像分类和知识蒸馏。

但在底层图像处理任务上,直接应用对比学习仍存在诸多挑战:

1. 学习到的全局视觉表征缺乏低层任务所需的丰富纹理和结构信息;

2. 高层下游任务适用的数据增强,除一些简单的几何增强外均不适用于底层任务;

3. 需要一个有意义的隐空间(或特征嵌入空间)以计算对比损失。

目前底层任务的对比学习方法主要注重于探索负样本,同时将 gt 作为正样本。文章总结了一些最新的相关文章,一些在正刊上发表一些只是挂在 arXiv 上。

这些方法均存在一定的缺陷。[19, 57, 59] 将 gt 作为正样本,退化的图像或数据集中其余图像作为负样本。这些负样本与重建图像相似度低,导致容易区分,难以对对比损失做出贡献。而对一些特定的图像重建任务,另一些基于对比学习研究 [9, 14, 55, 63] 致力于生成图像的全局不变特征,免于噪声、雨、分辨率以及模糊。这些方法忽视了构建有效正负样本对这一部分。此外由于这些方法的对比损失定义在某些特定特征空间内,无法很好泛化至其他任务。

本文调查研究了 SISR 的对比学习并提出一种有效的 SISR 对比学习框架,可同步生成多个正负样本。最近的研究显示现有深度学习方法得到的超分结果趋于平滑,视觉上不自然不合理。基于这些发现和对困难负样本的挖掘研究,文章通过将轻微模糊添加于 gt 以生成困难负样本以及简单锐化以生成富含信息的有效正样本。从而为超分图像获得正负样本对。

进一步,区别于现有方法采用额外预训练特征提取网络(例如预训练的 VGG),文章利用轻便且任务友好的特征提取网络:SR 网络的鉴别器,将正/负/锚点样本嵌入至对比损失定义的特征空间。对于锚点样本,对比损失将使它原理负样本,靠近正样本。由于该特征提取网络继承自 SR 网络的鉴别器,该鉴别将超分图像与高分辨率图像进行区分,因此嵌入的特征对图像退化十分敏感。故而超分图像可以很好的与负样本区分开同时靠近正样本。

总结贡献如下:

1. 提出了针对 SISR 任务的一种有效对比学习框架;

2. 重新思考并提出了一个显著方法以获得任务友好或任务泛化性墙的特征,通过重新利用 SR 网络的鉴别器,对比损失可以很好的工作;

3. 额外实验证明本文的方法(PCL-SISR)表现在定量与定性方面均优于代表性的 SISR 方法。

Related work

简要介绍了对比学习、图像恢复和图像间转换中的对比学习以及 SISR 领域的相关研究。

Method

4.1 Preliminaries

对比学习是最强大的表征学习方法之一。致力于将锚点样本在隐空间中推向正样本,远离负样本。对于数据集 ,表征学习模型 E 使用 InfoNCE 损失,被训练于提取表征 。 基于 softmax 形式,对第 i 个样本的损失定义如下:

其中 是温度超参数, 代表正样本,通常由样本 经随机数据增强生成。 是负样本集的数量, 代表负样本集。整体对比损失定义如下:

在有监督分类任务中,通常正样本不止一个。在此任务中,监督对比损失定义为:

是正样本集数目, 是正样本集,整体监督对比损失定义为:

4.2 Positive and Negative Sample Generations

通过将不同高通核作用于 HR 图像生成 张正样本,因为:

1. SISR 任务致力于得到细节化的结果,而细节通常存在于高频成分中;

2. SISR 问题是一个不适定问题,LR 图像和 HR 图像间的对应关系通常是一对多,也就是应该有多张合理的 GT。

之前的任务中将退化的图像或者不同图像作为负样本,锚点与负样本间过于不相似,很容易区分,在计算损失时作用受限。因此利用随机的高斯模糊核作用于将 HR 图像生成多个负样本。

4.3 Feature Embedding Network

文章提出了一个类似于 GAN 的框架结构,使用原始 GAN 网络中鉴别器作为特征提取网络,将图像映射至隐空间计算对比损失。为增强高频成分的学习,将低频成分与高频成分相分离,上述特征提取网络仅输入高频成分。具体实现时,采用哈尔小波变换,保留 LL,LH,HL,HH 四个子带中的 LH,HL,HH,鉴别损失定义如下:

并采取类似 GAN 网络的训练策略,每次 freeze 一部分然后训练另一部分:

4.4 Contrastive Loss

为了充分利用生成的多个正负样本,文章利用特征提取网络 的多个中间特征计算对比损失。 第 层第 个样本的对比损失定义如下:

其中 是相似度函数, 和 分别代表正负样本集。对于 的特征图, 采用像素级别的余弦相似度的均值,定义如下:

完整对比损失定义如下:

实际采用前四个中间层用于计算。

4.5 Training and Implementation Details

网络整体损失定义如下:

默认取 1,其余还有一些细节设置可以详见论文。

Experiments

特别鸣谢

感谢 TCCI 天桥脑科学研究院对于 PaperWeekly 的支持。TCCI 关注大脑探知、大脑功能和大脑健康。

更多阅读

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

PCL-SISR:基于对比学习的单幅图像超分辨率重建方法相关推荐

  1. 毕业设计-基于深度学习的单幅图像超分辨率重建算法

    目录 前言 课题背景和意义 实现技术思路 一.超分辨率图像数据集 二.单幅图像超分辨率重建的研究 三.图像质量评估 实现效果图样例 最后 前言

  2. PANet:基于金字塔注意力网络的图像超分辨率重建(Pytorch实现)

    PANet:基于金字塔注意力网络的图像超分辨率重建 [!] 为了提高代码的可读性,本文模型的具体实现与原文具有一定区别,因此会造成性能上的差异 文章目录 PANet:基于金字塔注意力网络的图像超分辨率 ...

  3. 不同分辨率图片匹配_超实用的图像超分辨率重建方法及应用介绍

    在之前的文章中已经讲述过很多的传统超分辨率算法.而在AI领域中这几年也是很大热门.CVPR2017超分辨有7篇论文,2018 ICCV共有9篇 ,在CVPR2018中,共收录979篇,而超分辨率论文有 ...

  4. 实践:基于深度学习的卫星图像超分辨率处理技术(一)

    本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译. 以下为译文: Yann Lecun曾将无监督学习比作蛋糕,将监督学习比作蛋糕上的糖霜,声称我们仅懂得如何做糖霜却不知道怎样才能做出蛋糕. ...

  5. 那些让人耳目一新的深度学习图像超分辨率重建方法

    本文章只记录(按时间),不分析网络结构.优劣.可能会有遗漏,见谅. 1. SRCNN -- ECCV2014 paper:Learning a Deep Convolutional Network f ...

  6. 基于深度学习的图像超分辨率重建技术的研究

    1 超分辨率重建技术的研究背景与意义 图像分辨率是一组用于评估图像中蕴含细节信息丰富程度的性能参数,包括时间分辨率.空间分辨率及色阶分辨率等,体现了成像系统实际所能反映物体细节信息的能力.相较于低分辨 ...

  7. 图像超分辨率重建算法,让模糊图像变清晰(附数据和代码)

    一.  图像超分辨率重建概述 1. 概念 图像分辨率是一组用于评估图像中蕴含细节信息丰富程度的性能参数,包括时间分辨率.空间分辨率及色阶分辨率等,体现了成像系统实际所能反映物体细节信息的能力.相较于低 ...

  8. 一文掌握图像超分辨率重建(算法原理、Pytorch实现)——含完整代码和数据

    目录 一.  图像超分辨率重建概述 1. 概念 2. 应用领域 3. 研究进展 3.1 传统超分辨率重建算法 3.2 基于深度学习的超分辨率重建算法 二.  SRResNet算法原理和Pytorch实 ...

  9. 学习笔记之——基于深度学习的图像超分辨率重建

    最近开展图像超分辨率( Image Super Resolution)方面的研究,做了一些列的调研,并结合本人的理解总结成本博文~(本博文仅用于本人的学习笔记,不做商业用途) 本博文涉及的paper已 ...

最新文章

  1. FFmpeg中AVDictionary介绍
  2. Oracle11g_同义词
  3. mysql count 返回0_如何在MySQL中使用COUNT時返回0而不是null
  4. 图灵今年的生日礼物,是新版50英镑纸币
  5. @ComponentScan配置扫描多个包
  6. matlab 功率谱分析函数psd用法
  7. UML类图之六种基本关系详解
  8. 掌握这8个CSS开发工具让你瞬间成为开发高手
  9. 《JSP实用教程(第2版)/耿祥义》错误之tomcat虚拟服务目录
  10. 黑客帝国中的代码雨写法
  11. sql数据库去重语法_数据库去重语句
  12. vue项目打包后index.html文件打开空白
  13. 云计算工程师面试题集锦,常见云计算面试题及答案
  14. Unity 抛物线,直线,Sine曲线等
  15. Lucas Kanade 光流法(来自wiki 百科)
  16. 经典回顾:福禄克FLUKE DTX-1800如何配合DTX-LABA测试6A,7类跳线patchcord
  17. 【YOLOv7_0.1】网络结构与源码解析
  18. localstorage使用
  19. 哈希值 哈希码_什么是哈希? 哈希码如何工作-带有示例
  20. 原型设计软件Axure RP 9中文版

热门文章

  1. 第五届蓝桥杯真题解析【JavaC组】
  2. 货运从业资格证考试技巧
  3. shellcode加密过杀软
  4. 抖音seo源码,抖音seo矩阵系统源码搭建技术+二开开源代码
  5. Qt 字符编码转换(UTF-8 转换为 GBK) \u7528\u6237\u672a\u7b7e\u7ea6
  6. 椭圆加密算法(ECC加密)原理及应用
  7. 用友U8+ V16.0 V15.1 V15.0 V13.0 V12.5 12.1 12.0 11.1 11.0注册
  8. 元素偏移量 offset 系列
  9. 药店计算机信息系统知识培训,的药店信息管理系统.docx
  10. windows双屏显示如何设置