双边超分辨率学习语义分割 收录在cvpr2020

摘要:现在的最好的语义分割办法用高分辨率的输入去提高模型性能,这种方法使得计算量增加很多。我们提出了灵活而简单的双支路网络框架(叫DSRL)可以很好的提高网络精度的同时不引入额外的计算量。具体的来说,我们的方法分为三部分:1.超分辨率分割(SSSR)2.单张图像超分辨率(SISR)3.特征关联(FA)模块。可以在低分辨率的输入的情况下保持高分辨率,同时减少计算量。这种方法还可以很简单的应用到其他任务上如人体姿态估计。我们的方法在人体姿态估计与Cityscaps的分割任务上提高了2%的精确度的同时保持Flops不变。

以前的工作中存在的问题是输入分辨率大的情况下精度高,但是计算量也高,降低输入分辨率则精度也会降低,本文提出的方法减轻了这种情况:原理是从低分辨率的输入重建高分辨率的图像。之前类似的工作有四种:1.前上采样超分辨率,就是将输入双线性上采样到高分辨率然后微调网络。2.后上采样超分辨率,就是用网络后端的可学习的上采样层代替前上采样,可以很大程度减少计算复杂度。3.进步上采样超分辨率,是方法2的改进,它针对减少计算复杂度,用渐进的重建高分辨率图像并根据多尺度的单图像分辨率需要进行裁剪。4.迭代式上下采样超分辨率,采用迭代式上下采样产生媒介图像,然后结合它们去重建最后的高分辨率图像。考虑到计算量问题,本文遵循2方法的理念。

网络整体结构:

本文提出的DSRL网络包含三个模块,下面逐一介绍:

1.超分辨率语义分割(SSSR),就是简单的增加了一个上采样,达到提高分辨率的目的。模块输入是512*1024,输出是1024*2048。相较于最近的大多数系统(输入输出都是512*1024,最后再提升至1024*2048分辨率)我们的办法可以充分利用GT的信息,避免GT在以开始的下采样中丢失信息。我们的上采样模块包含一系列的反卷积层后面是归一化和激活函数,只用了很少的参数。

2.单一图像超分辨变率(SISR)。上文提到,在原分辨率作为输入的情况下只用decoder部分是不足以生成类似的高分辨率分割图。因为decoder并不是双线性上采样层也不是一个子网络,它并不会带来额外的信息因为输入就是低分辨率图(512*1024)。此模块的目的是从低分辨率输入构建高分辨率图片。它意味着此模块可以在低分辨率的输入下有效地重建和增强图片的结构信息。下图是此模块的特征可视化:

对比上图的(b)和(c)我们可以发现,SISR包含更多的完整的物体结构,尽管这些结构并不是明确的指像素是同一类,但是他们能被像素间和区域间的关联信息高效的分组。而关联信息可以间接传递语义信息,所以对分割任务是非常有用的。所以我们将SISR生成的高分辨率特征去指导SSSR的高分辨率表征,这些细节可以可以被像素之间的相关性所模仿。关联性学习可以在decoder部分简单实现。对于SISR分支,它与SSSR共享特征提取的部分,如下图所示,整个SISR分支在训练的时候我们用原图像作为监督信号,在推理阶段可以去掉。

3.特征关系学习(FA),因为SISR比SSSR包含更多的完整结构的信息,我们用此模块来指导SSSR去学习高分辨率的表征。

FA为了学习SISR和SSSR之间相似矩阵的距离,如公式1。

相似矩阵的定义如公式2:

Sij代表两个特征图任意两个像素点的关联,p和q代表正则化方式,这里p=2,q=1(就是L1正则和L2正则)。

消融实验和与State of the art 对比:

语义分割效果图对比:

总结:这是一篇利用低分辨率的输入生成高分辨率的图像,从而给模型提供额外的信息进而提高网络精确的文章。它的FA模块和attention机制比较像,而且它额外增加的模块在部署阶段可以去掉,几乎不会增加计算量,是一种提高分辨率的有效策略。

Dual Super-Resolution Learning for Semantic Segmentation解读相关推荐

  1. [论文阅读] Cost-Effective REgion-based Active Learning for Semantic Segmentation

    论文地址:https://arxiv.org/abs/1810.09726 发表于:BMVC'18 Abstract 最先进的语义分割方法在有监督的情况下使用大量的标注训练图像语料库进行训练.然而,与 ...

  2. Squeeze-and-Attention Networks for Semantic Segmentation解读

    最近将注意力机制整合到分割任务通过强调特征里面的信息中来提升模型的表征能力.但是这些注意力机制忽略了一个暗含的分割子任务并且被卷积核的方格型形状所限制.我们提出了一个新颖的压缩注意力网络(SANet) ...

  3. 【论文翻译】PLOP: Learning without Forgetting for Continual Semantic Segmentation

    论文地址:http://​https://arxiv.org/abs/2011.11390​ 代码地址:GitHub - arthurdouillard/CVPR2021_PLOP: Official ...

  4. 语义分割-Unsupervised Domain Adaptation in Semantic Segmentation:a Review语义分割中的无监督领域自适应:综述

    Unsupervised Domain Adaptation in Semantic Segmentation:a Review语义分割中的无监督领域自适应:综述 0.摘要 1.介绍 1.1.语义分割 ...

  5. 【论文合集】RGBD Semantic Segmentation

    来源:GitHub - Yangzhangcst/RGBD-semantic-segmentation: A paper list of RGBD semantic segmentation (pro ...

  6. 【Few-Shot Segmentation论文阅读笔记】PANet: Few-Shot Image Semantic Segmentation with Prototype , ICCV, 2019

    Abstract Target Question: Few-shot Segmentation 本文主要工作: 基于metric-learning的思想,本文提出了PANet(Prototype Al ...

  7. Semi-supervised Semantic Segmentation Papers

    Semi-Supervised Object Detection with Adaptive Class-Rebalancing Self-Training 1.SSOD中的伪标签不准确.此外,在前景 ...

  8. 语义分割--Deep Dual Learning for Semantic Image Segmentation

    Deep Dual Learning for Semantic Image Segmentation ICCV2017 针对语义分割问题,本文提出了一个 dual image segmentation ...

  9. CVPR2020论文解读:三维语义分割3D Semantic Segmentation

    CVPR2020论文解读:三维语义分割3D Semantic Segmentation xMUDA: Cross-Modal Unsupervised Domain Adaptation for 3D ...

最新文章

  1. python中函数的参数:必传参数(位置参数)、默认值参数、参数组传参、关键字传参...
  2. quartz数据库方式与web工程整合
  3. python中输入的字怎么表示_简单讲解Python中的字符串与字符串的输入输出
  4. Java集合框架:ArrayList
  5. PAT L3-007 天梯地图
  6. 每日一题(7) —— 求余运算符
  7. c2010页面闪现_vue使用v-if v-show页面闪烁,div闪现的解决方法
  8. BZOJ 3238: [Ahoi2013]差异 [后缀数组 单调栈]
  9. python的字符串类型_python如何判断某变量是否为字符串类型
  10. 基于RPM包的LAMP搭建
  11. SD与SE的关系,以及异常值
  12. 操作注册表修改防火墙
  13. 广告牌定时器怎么设置时间_广告牌定时器时间到了灯箱不亮怎么回事?
  14. 两台电脑用一根网线组建局域网
  15. 好文:中国Saas蜕变史
  16. 月租最便宜的手机卡_月租最高不超过10元!最适合当副卡的手机卡套餐全在这了...
  17. 求求你,别在MySQL中使用UTF-8了!
  18. OpenCV 视频人数统计研究
  19. win32库关于Photoshop
  20. 172 Factorial Trailing Zeroes(阶乘后的零)————附带详细思路和代码

热门文章

  1. 百度TTS,支持离线环境下使用
  2. pm2在服务器上部署express项目
  3. 下面哪个函数不能作为C++ std::sort的比较函数。
  4. 蓝牙BQB认证费用、周期、资料、检测项目
  5. 浏览器打开本地exe
  6. android下怎样伪装mac,Android刷成iOS?史上最强苹果伪装教程
  7. ML_12 Sum-Produkt Networks 和积网络
  8. [LeetCode-java实现]3. 无重复字符的最长子串
  9. 考研计算机300分什么水平,工科类考研300分什么概念?算不算高?
  10. 中国成为论文发表数量第一的国家