Recovering Realistic Texture in Image Super-resolution by

Deep Spatial Feature Transform

Abstract

在单图像超分辨(SR)的高质量重建上,虽然使用CNN会有很好的结果,但是如何恢复自然且逼真的纹理仍是一个挑战性问题。本文在基于语义分割概率图的单个网络中,通过空间特征变换(SFT)提取中间层特征,实现端到端的超分辨重建。

Introduction

单图像超分辨率旨在从单个低分辨率(LR)图像中恢复高分辨率(HR)图像。传统的SR方法一般是基于MSE,即基于像素空间纬度的MSE loss,这种方法会导致产生的图像模糊且过于平滑。SRGAN提出perceptual loss对特征空间纬度进行优化而不是像素纬度,进一步提出adversarial loss来生成更为自然的图片。使用perceptual loss和adversarial loss极大地改善了重建图像的感知质量。然而,生成的纹理趋于单调且不自然。

作者探讨了纹理不自然的一个重要原因是由于,对于不用HR片段其对应的LR片段可能会很相同,这就导致在上采样的时,模型很难区分当前图像的片断属于哪一个类别,从而导致合成的图像的纹理不真实。

本文使用语义分割图作为分类的先验信息来指导SR中不同区域的纹理恢复,使用空间特征变换(SFT)来转换网络的某些中间层的特征,改变SR网络的性能。SFT层以语义分割概率图为条件,生成一对调制参数,用来在空间上对网络的特征图应用仿射变换。

SFT层通过转换单个网络的中间特征,只需一次正向传递就可以实现具有丰富语义区域的HR图像的重建。同时,SFT层可以很容易地引入现有的SR网络结构,能够与SR网络一起进行端到端的训练。

Methodology

3.0定义假设

给定低分辨率图x,超分辨率估计结果,真实超分辨结果y,基于CNN的映射假设为,则有映射关系:

基于loss的参数设定:

使用语义分割概率图来作为类别先验:

此时,基于先验的映射关系为:

3.1 Spatial Feature Transform SFT层

① 参数对

空间特征变换(SFT)层学习"基于先验条件Ψ,输出调制参数对(γ,β)"的映射函数M.

,M理论上来说应该是任意的方程,但是这里还是指采用卷积神经网络来做这个映射关系,同时SFT得到参数对的过程是条件共享的

参数对(γ,β)通过在空间上对SR网络中的每个中间特征图应用仿射变换来自适应地影响输出,即

② SFT层的结构

SFT layer就是一个小型的network用于生成不同层的condition信息,变换方式:

SFT有两个输入,一个输入是condition network的输出conditions,另一个是上一层的输出F。conditions分别通过两层卷积计算得到γ和β,然后参数对与上层F进行变换,计算整个SFT层的输出,而整个SFT层的输出又作为下一层的输入F。

③ SFT的实现

两层卷积之后直接与F做点乘、加法。

3.2 网络结构

① 网络结构

主体分为三个部分,条件网络condition network、SR网络和上采样部分

a)条件网络将分割概率图作为输入,使用四层卷积处理,它生成所有SFT层共享的中间条件。这里为了避免一个图像中不同分类区域的相互干扰,通过对所有卷积层使用1×1个核来限制条件网络的感受域。

b) SR网络由16个残差块构成,每个残差块包含两个SFT+Conv,所有SFT共享conditions,SFT以共享conditions作为输入并学习(γ,β)以通过应用仿射变换来调制特征图。

c)上采样部分使用最近邻上采样+卷积层进行上采样操作

最近邻插值:在待求像素的四邻象素中,将距离待求像素最近的邻像素灰度赋给待求像素,最邻近元法计算量较小,但可能会造成插值生成的图像灰度上的不连续,在灰度变化的地方可能出现明显的锯齿状。

3.3 Loss Function

感知损失perceptual loss

其中使用预训练的VGG-19特征

对抗损失 adversarial loss

传统的GAN loss,使D对G的判定尽可能的准确

Experiments

①限定七个类别,不属于7类别的则为背景。在训练时,将图像裁剪到只包含一个类别来训练D的识别能力。

②训练时使用包含单个类别的图像进行训练,测试时使用包含多个类别的图像进行测试。

PS:训练时单个类别损失,测试时多个类别,网络是否有效?

——作者在test阶段,输入LR图片和k张分割概率图,每一张概率图中都显示着某一特定物体在该位置存在的概率,输入数据兵分两路进入G,得到输出的SR图像。已经训练好的G+分割概率图,G网络便获得了根据概率图针对性重建图像的能力(根据概率图,将多类别问题转化为单类别问题)

——训练时不是整张图片的训练,而是将原图裁剪到98*98大小进行训练,保证只包含一个分类。但由于使用的是概率图,虽然每次是单个类别,但是整体数据包含了所有的类别,也就保证了结果的鲁棒性。

③D部分,除了包含常规GAN的real/fake分支损失,还包含了一项类别损失,使D能够对不同的类别进行识别,具体是使用多类交叉熵CrossEntropyLoss来对类别进行限制。

summary

① 使用perceptual loss和adversarial loss极大地改善了重建图像的感知质量。然而,早缺少先验信息的情况下,生成的纹理趋于单调且不自然。

② 使用语义分割概率图作为条件先验。传统SR算法着重与PSNR,基于MSE的损失使得图像模糊;SRGAN引入perceptual loss,通过VGG网络提取深层特征进行训练,但纹理信息缺少,因为笼统的提取特征,在遇到不同事物具有相似纹理时往往导致误判,也就是说D网络不尽责,区分墙壁与野草的能力差,使得效率低的G网络轻松通过鉴别,;SFT使用seg map来进行引导,一方面明确告诉G物体的类别,(seg提供信息,SFT处理信息)另一方面告诉D如何识别物体的类别

③ SFT对每个分类寻找通用的增强信息。由于seg map是概率图,所以除了包含spatial信息之外,还会包含一定的纹理细节信息 这些信息会对sft有一定的影响。sft实际上就是针对每个不同的分类对LR feature加入特定的纹理细节,即(β,γ)的作用。整体的过程就是在保留LR的空间信息的情况下,加入基于分类的纹理细节。

转载于:https://www.cnblogs.com/mjhr/p/11233583.html

论文笔记SR——SFT相关推荐

  1. Deep RGB-D Saliency Detection with Depth-Sensitive Attention and Automatic Multi-Modal Fusion论文笔记

    CVPR2021论文笔记 题目:Deep RGB-D Saliency Detection with Depth-Sensitive Attention and Automatic Multi-Mod ...

  2. 论文笔记 [5] SRCNN

    论文笔记 [5] Learning a Deep Convolutional Network for Image Super-Resolution emmm--这篇文章就是在那篇做deblocking ...

  3. 论文笔记 | 【CVPR-2023】Activating More Pixels in Image Super-Resolution Transformer

    论文笔记 | [CVPR-2023]Activating More Pixels in Image Super-Resolution Transformer 抛砖引玉了,如有不同意见欢迎讨论. 目录 ...

  4. 论文笔记 | DCS-RISR: Dynamic Channel Splitting for Efficient Real-world Image Super-Resolution

    论文笔记 | DCS-RISR: Dynamic Channel Splitting for Efficient Real-world Image Super-Resolution 太久没更新了,因为 ...

  5. ORB-SLAM3 论文笔记

    ORB-SLAM3 论文笔记 这篇博客 ORB-SLAM3系统 相机模型的抽象(Camera Model) 重定位的问题 图片矫正的问题 视觉惯性SLAM的工作原理 相关公式 IMU初始化 跟踪和建图 ...

  6. 【论文笔记】 LSTM-BASED DEEP LEARNING MODELS FOR NONFACTOID ANSWER SELECTION

    一.简介 这篇论文由IBM Watson发表在2016 ICLR,目前引用量92.这篇论文的研究主题是answer selection,作者在这篇论文基础上[Applying Deep Learnin ...

  7. 最新图神经网络论文笔记汇总(附pdf下载)

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 [导读]近年来,图神经网络变得非常火热,每年顶会在该领域内都会出现大量的研究论文,本文为大家提 ...

  8. [论文笔记] Fast Quality Driven Selection of Composite Web Services (ECOWS, 2006)

    Time: 4.0 hours Jae-Ho Jang, Dong-Hoon Shin, Kyong-Ho Lee, "Fast Quality Driven Selection of Co ...

  9. 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning

    论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning  2017-06-06  21: ...

最新文章

  1. 在Ubuntu 14.04上设置生产环境可用的Node.js
  2. VMware Workstation 重启服务脚本 解决连不上ssh问题
  3. VTK:图片之ImageImport
  4. 凡事向内求,我心是一切,一切是我心,我是一切的根源,我永远都会成为潜意识中的我。...
  5. Java-马士兵设计模式学习笔记-观察者模式-读取properties文件改成单例模式
  6. 计算机窗口设计java实验,Java银行取款异常处理计算器设计图形用户界面设计实验报告.doc...
  7. 如何在Ubuntu中更改用户密码
  8. [数分提高]2014-2015-2第9教学周第2次课 (2015-04-30)
  9. Google Chrome谷歌浏览器离完整离线安装包下载地址整理总汇
  10. 数控编程加工中心注意事项有哪些,你知道吗
  11. 向量点乘、叉乘几何意义、python实现、应用
  12. 腾讯元老、上市公司CTO辞职后,每天对着200亩地发呆!
  13. mysql8 启动报错:Error while setting value ‘STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DI
  14. [电动智能汽车-3]:原理 - 整车控制器VCU功能
  15. 类似零基础学python的小说_就像看小说一样,让你一个小时学会Python零基础「强烈推荐」...
  16. xamp环境搭建Pikachu实验环境搭建
  17. 瑞尔森大学的计算机科学专业,瑞尔森大学专业介绍
  18. [原创]Java Web——外卖配送系统/在线点餐系统
  19. CY2荧光染料,Cy2@NHS酯基本染料,Cy2DIGE NHS ester的物化性质及光谱特性
  20. 【面试】面试常问之堆栈的区别

热门文章

  1. 【报错记录】RuntimeError: don‘t know how to restore data location of torch.FloatStorage (tagged with CPU)
  2. 360卫士防止自动广告弹窗设置方法
  3. html关闭当前页面前alert,javascript – 停止页面执行,像alert()函数
  4. 怎样找回全国计算机考试的准考证号
  5. 男生气质之身体姿势的训练
  6. Python读写Excel表格,就是这么简单粗暴又好用
  7. CoOS之上下文切换
  8. 《Cocos Creator 代码编辑器》插件使用说明
  9. nodejs 安装node-sass
  10. API 接口的安全性及鉴权方式