一种轻量高效的自注意力机制助力图像恢复网络

这是一种基于锚点Anchored的条纹自注意力机制用于实现全局范围依赖性建模,它在自注意力的空间和时间复杂度以及超越区域范围的建模能力之间取得了良好的平衡。

PDF: https://arxiv.org/pdf/2303.00748

Code: https://github.com/ofsoundof/GRL-Image-Restoration.git

全局,区域和局部范围的特征可以很好地被神经网络用于图像恢复任务,本文提出了一种基于锚点Anchored的条纹自注意力机制用于实现全局范围依赖性建模,它在自注意力的空间和时间复杂度以及超越区域范围的建模能力之间取得了良好的平衡;其次提出了一种新的Transformer网络GRL通过基于锚点的条纹自注意力机制,窗口自注意力和通道注意力,明确地模拟了全局、区域和局部范围内的图像层次结构特征。最后将提出的网络应用于七种图像恢复任务中,都达到了最先进的结果!

图1. 局部特征(边缘、颜色)和区域特征(粉色框处)可以很好地由卷积神经网络(CNN)和窗口自注意力进行建模。但相比之下,全局特征(青色矩形处)难以有效且明确地进行特征建模。

图像恢复旨在从低质量图像恢复出高质量图像,这些低质量图像通常是由于图像退化过程(如模糊、降采样、噪声引入和JPEG压缩)导致的。因为在图像退化过程中,其重要内容信息缺失,所以图像恢复是一个具有挑战性的逆过程。因此为了恢复高质量图像,应该充分利用退化图像中展现出的丰富信息。

自然图像包含全局、区域和局部范围内的一系列特征,这些特征可以被深度神经网络用于图像恢复。 局部特征通常是一些边缘和颜色特征,由于其只跨度几个像素,所以可以使用小卷积核(例如3 x 3)进行建模捕获;对于区域特征,其通常跨度数十个像素,这一窗口区域特征通常可以覆盖一些小物体和大物体的某个部分(如上图1的粉色框),由于区域特征范围更大,因此可选择使用大卷积核进行建模,但其参数量和计算量未免过大且低效,因此带有窗口注意力机制的Transformer会是更好的选择;除了局部和区域特征之外,某些特征具有全局跨度性(图1中的青色矩形):主要体现在对称性和多尺度模式重复性(图1a),同一尺度的纹理相似性(图1b),以及大物体内容结构相似性和一致性(图1c),为了建模处理这个范围的特征,需要网络具备全局图像理解的能力。

上面提到的局部和区域范围特征可以很好的建模捕获,但全局特征的建模存在两个主要的挑战:

  • 首先,现有的基于卷积和窗口注意力的图像恢复网络不能通过使用单个计算模块来明确捕获长距离依赖关系,因此全局图像理解主要通过将特征通过重复的计算模块进行逐步传播来实现。

  • 其次,当图像的分辨率不断提高,长距离依赖建模面临计算负担的挑战。

上述讨论引出了一系列研究问题:

  • 如何高效地在高维图像中对全局范围特征进行建模以进行图像恢复?

  • 如何通过单个计算模块明确地建模图像层次结构信息(局部、区域、全局),以进行高维图像恢复?

  • 这种联合建模如何能够在不同的图像恢复任务中带来统一的性能改进?

为此,本文围绕以上三个研究问题,逐一提出解决方案:

首先,本文提出了一种基于锚点的条纹自注意力机制用于实现全局范围依赖性建模;其次,提出了一种新的Transformer网络GRL用于在单个计算模块中明确地模拟全局,区域和局部范围的依赖关系;最后,所提出的GRL网络在七类图像恢复任务中(图像超分,去噪,JPEG压缩伪影去除,去马赛克,真实图像超分,单图运动去模糊,散焦去模糊)全部表现SOTA!如下图2所示:

图2. 所提出的GRL网络在各种图像恢复任务中都实现了最先进的结果

方法

图3. 上图(a)展示了所提出的GRL网络架构图,它由多个Transformer Layer组成。上图(b)展示了Transformer Layer计算模块,**它由三个子模块组成并用于建模全局,区域和局部图像结构特征,其中基于锚点的条纹自注意力机制Anchored Stripe Attention用于建模全局图像结构特征,基于窗口的自注意力机制Window Attention V2用于建模区域特征,而两个串联的3 x 3卷积再接一个通道注意力Channel Attention可用于建模出高效的局部特征。** 上图(c) 展示了基于锚点的条纹自注意力机制结构图,该注意力机制可以帮助网络捕获超越区域范围(全局)的图像结构特征。

Transformer自注意力机制架构虽然可以很好的建模出长远距离依赖关系并以此捕获全局特征信息,但图像tokens数量众多导致计算量巨大。为了降低计算复杂度,所以可以在窗口区域进行自注意力,但该类基于窗口的自注意力机制受限于窗口大小,仅能捕获基于窗口区域的上下文特征信息。那么这就引出一个问题:如何在低计算量情况下,建模出超出窗口区域范围的特征呢?

图4. 上图(a)和(b)是来自两个不同分辨率的相同图片,(a)中蓝色的像素点和(b)中红色的像素点都取自相同的一个位置。图(c)表示了蓝色像素点和其它像素点的注意力图;图(d)表示了红色像素点和其它像素点的注意力图。我们可以发现:图(c)和图(d)注意力图是非常相近的,这就是本文所说的**跨尺度相似性**。

作者通过如上图4发现了跨尺度相似性原理,于是作者想到了一个办法:通过对具有小分辨率的图像进行自注意力(小分辨率图像具有更少的tokens)来达到大分辨率图像进行自注意力的效果(基于跨尺度相似性原理),这就大大降低了计算量,而又可以有效建模出超越窗口区域范围的特征(全局特征)

图5. 自然图像的特征通常以非各向同性的方式出现

为了进一步降低计算量,作者发现了自然图像另一个重要的特性:自然图像的特征通常以非各向同性的方式出现,如上图5所示,图5(c)和(d)中的单个物体、图5(h)中的多尺度相似性、图5(e)和(g)中的对称性等。因此,全局范围的各向同性注意力对于捕捉非各向同性图像特征是多余的。基于此,文章提出了在非各向同性条纹内进行注意力处理的方法,该注意力机制包括四种模式:水平条纹、垂直条纹、平移水平条纹和平移垂直条纹。水平和垂直条纹的注意力机制可以在Transformer网络中交替使用。通过这种注意力方式,可以在保持全局范围建模能力的同时,降低全局自注意力计算的复杂度。

因此,再结合锚点的概念,提出了锚定条纹自注意力。对于这种注意力机制,利用引入的锚点在垂直和水平条纹内进行高效自注意力计算。

实验结果

单图运动去模糊结果

虚焦去模糊结果

彩色和灰度图降噪结果

经典图像超分辨结果

灰度图JPEG压缩伪影去除结果

 一些消融实验结果

结论

本文受到两个图像属性的启发:跨尺度相似性和各向异性图像特征,从而提出了一种高效的锚定条纹自注意力模块,用于建模图像的长远距离依赖关系。以此进一步提出了一种多功能网络架构GRL用于图像恢复任务,该网络可以有效的建模出全局,区域和局部范围的距离依赖关系,具备低计算量的同时,还在各大图像恢复任务中取得了最先进的结果。 whaosoft aiot http://143ai.com

GRL-Image-Restoration相关推荐

  1. 【图像超分辨率重建】——GRL论文精读笔记

    2023-Efficient and Explicit Modelling of Image Hierarchies for Image Restoration(RGL) 基本信息 作者: Yawei ...

  2. GRL(CVPR2023图像修复)训练自己的数据集

    最近看完"GRL for Image Restoration"论文后想要尝试用自己的数据训练一下模型,但是实际操作下来发现整个过程还是踩了非常多的坑的,所以记录一下便于需要的朋友使 ...

  3. 图像去噪--Noise2Noise: Learning Image Restoration without Clean Data

    Noise2Noise: Learning Image Restoration without Clean Data ICML 2018 1 Introduction 基于 corrupted or ...

  4. ECCV2020论文-稀疏性表示-Neural Sparse Representation for Image Restoration翻译

    Neural Sparse Representation for Image Restoration 用于图像复原的神经稀疏表示 Abstract 在基于稀疏编码的图像恢复模型中,基于稀疏表示的鲁棒性 ...

  5. [2020-ECCV]PIPAL-a Large-Scale Image Quality Assessment Dataset for Perceptual Image Restoration论文简析

    [2020-ECCV] PIPAL: a Large-Scale Image Quality Assessment Dataset for Perceptual Image Restoration 论 ...

  6. Uformer: A General U-Shaped Transformerfor Image Restoration

    目录 (1)Encoder (2)Bottleneck stage(图一,最下面的两个LeWin Transformer blocks) (3)Decoder LeWin Transformer Bl ...

  7. Codeforces Round #445 div.2 D. Restoration of string 乱搞

    D. Restoration of string 题意:给你n个字符串,让你构造一个终串,使得这n个字符串都是终串的最小频繁子串,如果不存在输出NO.  最频繁子串:出现次数最多的子串 tags: 直 ...

  8. 提供高速信号接口认证测试 GRL上海实验室成立

    GRL (Granite River Labs Inc.),全球领先的工程服务及高速连接测试方案提供商,日前宣布在中国上海成立位于中国大陆地区的首家实验室. GRL上海实验室将为客户提供高速信号接口的 ...

  9. MySQL Bug一例-----ibuf cursor restoration fails

    产生原因: 1.开启change buffer(innodb_change_buffering) 2.对表进行大量delete 操作 3.对相同表进行truncate bug名称:ibuf curso ...

  10. 【论文笔记】Learning Enriched Features for Real Image Restoration and Enhancement

    Learning Enriched Features for Real Image Restoration and Enhancement Abstract Contribution Method(M ...

最新文章

  1. CenterNet 读书笔记
  2. javascript时间格式format函数,js日期格式化函数
  3. 3.jeesite传统开发
  4. 无线路由器发起ARP攻击,致使网络中断,这是为什么?
  5. 关于神经网络训练的一些建议笔记
  6. java HashMap实现中文分词器 应用:敏感词过滤实现
  7. linux下反删除软件,浅谈Linux文件系统反删除方法(二)
  8. Java基础学习总结(68)——有关Java线程方面的面试题
  9. 华中师范大学邮箱matlab,正版软件管理与服务平台(华中师范大学)
  10. python代码运行助手下载_Python自学:使用代码运行助手
  11. 国内29家视觉企业及最新动态一览
  12. 谷歌地球尝试验证时检测到错误_深思考丨验证码为何越来越难了?
  13. 关于java构造函数 的错误 there is no default constructor available in ...
  14. 人员-组织 结构 数据库关系设计
  15. 【SpringMVC(十三)】ResponseEntity 使用 及 原理
  16. 【Minecraft开服教程】使用 MCSM 面板一键搭建我的世界服务器,并内网穿透公网远程联机
  17. 【凯子哥带你学Android】Andriod性能优化之列表卡顿——以“简书”APP为例
  18. 在Chrome、Firefox等浏览器中实现低延迟播放海康、大华RTSP
  19. android 方向控件 MenuView 上下左右,东南西北
  20. Vue中一些需要注意的点(采坑)

热门文章

  1. 【GNN】图解GNN: A gentle introduction(含视频)
  2. Go后台管理系统 | EasyGoAdmin
  3. 基于深度学习的实现影像地图道路提取
  4. 需求说明:请用户输入一个“QQ号码”,我们来判断这个QQ号码是否正确。 要求:使用方法来完成判断功能。
  5. CVPR 2021 速览 | 旷视研究院入选学术成果盘点(上)
  6. Ubuntu 18下C/C++ IDE之CodeLite安装
  7. IDA Pro 7.5版本使用IDAPython
  8. 一本关于ChatGPT的书《ChatGPT 革命:了解大型语言模型的力量》免费下载
  9. AIDA64 v5.00.3300
  10. 行星狩猎”,AI已经出手