目录

介绍

相关工作

1、Unconditional normalization layers

2、Conditional normalization layers(这一部分挺重要的)

方法

3.1 、Spatially-adaptive denormalization

3.2 SPADE generator

3.3 为什么spade好


介绍

先前的工作(指的是pix2pix,pix2pixHD)是:semantic layout  作为网络input。作者认为由于normalization会洗掉语义信息,提出网络的输入the input layout for modulating the activations in normalization layers through a spatially adaptive, learned transformation.通过空间自适应学习转换使用输入语义布局来调制激活函数,这个翻译我一直不怎么理解。

这个怎么理解呢:Previous methods directly feed the semantic layout as input to the deep network, which is then processed through stacks of convolution, normalization, and nonlinearity layers.

这里要说明下,pix2pixHD的gen的输入就是semantic layout,之后通过后面的卷积。SPADE的gen的输入是经历过Spatially-Adaptive Normalization后的actvn:F.leaky_relu,然后一层一层conv啥的。

相关工作

1、Unconditional normalization layers

Local Response Normalization (LRN) in the AlexNet and Batch Normalization (BN) in the Inception-v2 network 等等,they do not depend on external data。

这里的无条件理解为,bn层在train是学习的,test时候这个归一化固定了。SPADE指的是,根据input不同,bn输出结果是不同的。

2、Conditional normalization layers(这一部分挺重要的)

Batch Normalization (Conditional BN) and Adaptive Instance Normalization (AdaIN).

基础 | batchnorm原理及代码详解_Double_V_的博客-CSDN博客_batchnorm这里对bn有一定说明。

方法

3.1 、Spatially-adaptive denormalization

Similar to Batch Normalization, the activation is normalized in the channel-wise manner, and then modulated with learned scale and bias.这两个因子是通过卷积学来的,作者认为they depend on the input segmentation mask and vary with respect to the location (y, x).

注意这里的下标,ɥ和ɓ是和通道C相关的。这里gama和beta是和C,(y,x)相关的,具有位置信息,加上通道C,这也就是空间Spatially-Adaptive。注意这里的h是 the activation at the site。

注意这里的代码:spade是先经历过norm的,输出经过actvn后再conv一大堆。而先前网路是直接喂入mask图后卷积balabala。

    def actvn(self, x):return F.leaky_relu(x, 2e-1)

3.2 SPADE generator

作者舍弃了pix2pix和pix2pixHD中的encoder部分,这里作者认为 spade中的两个因子已经学到mask足够的信息。the learned modulation parameters have encoded enough information about the label layout.。为了多模态生成,使用随机变量作为一开始gen的输入。

说明了残差连接(好像,似乎残差连接再gan生成上效果一直较好)

3.3 为什么spade好

这里作者认为,spade比其他norm保留更好的语义信息。这里说一下对norm的理解,如有错误,请勘误!

假设norm的输入x的维度是 b, c, h, w,经历bn层是以b维度求均值、方差做归一化。后面加入可学习因子。

归一化的过程是线性操作,假设输入是b个二值图,背景的地方是在分布的最左边,目标类是右边。不影响什么。

那为什么作者说其他norm会洗掉 semantic information,出现在gama和beta因子上,这两个因子encoder enough information about the label layout。同时可以看见gen上,spade块有多次的mask输入,不会随着网络深度而消失。

原文做了这样的解释:

现在有一个只有类的mask,例如天空image对应的mask,把mask作为input,先卷积后norm。卷积输出再次均匀化 ,不同的标签具有不同的均匀值 。现在 ,在我们将
InstanceNorm应用于输出之后,无论输入的语义标签是什么,标准化激活都将变为全零。

SPADE Generator中的分割掩模通过空间自适应调制进行馈送而不进行归一化,仅前一层的激活被标准化。

实验

这部分证明了spade的有效、生成器、随机输入,证明了在gen上多次输入mask的好处。

SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization相关推荐

  1. (SPADE)Semantic Image Synthesis with Spatially-Adaptive Normalization

    论文:https://arxiv.org/abs/1903.07291 源码:https://github.com/NVlabs/SPADE 演示:http://gaugan.org/gaugan2/ ...

  2. TensorFlow2实现空间自适应归一化(Spatial Adaptive Normalization, SPADE)

    TensorFlow2实现空间自适应归一化(Spatial Adaptive Normalization, SPADE) 空间自适应归一化(Spatial Adaptive Normalization ...

  3. 【论文简介】CollageGAN: Collaging Class-specific GANs for Semantic Image Synthesis(用于语义图像合成的特定类拼贴GANs)

    项目主页:https://yuheng-li.github.io/CollageGAN/ | github-空项目 | paper 图1:语义条件下高分辨率的图像生成(左上角黄色插图).我们的基本模型 ...

  4. 【CVPR 2019】Semantic Image Synthesis with Spatially-Adaptive Normalization(SPADE)

    文章目录 Introduction 3. Semantic Image Synthesis Spatially-adaptive denormalization. conclusion # 空间自适应 ...

  5. 论文笔记:SPADE(CVPR 2019)-Semantic Image Synthesis with Spatially-Adaptive Normalization

    论文笔记:SPADE(CVPR 2019)-Semantic Image Synthesis with Spatially-Adaptive Normalization SPADE DEMO 前言 语 ...

  6. GauGAN,Semantic Image Synthesis with Spatially-Adaptive Normalization 论文阅读

    简介 本文做的模型是从一张语义图(分割里的semantic mask)生成相应的一张真实图,下图的第一行是输入,不同的颜色代表不同的语义类别,第二行到第三行是生成的真实图像,其中每一行对应一种风格,每 ...

  7. Semantic Image Synthesis with Spatially-Adaptive Normalization阅读

    SPADE模块阅读 解读链接:SPADE 论文阅读–Semantic Image Synthesis with Spatially-Adaptive Normalization https://zhu ...

  8. GAN学习历程之Semantic Image Synthesis with Spatially-Adaptive Normalizatio论文笔记

    Semantic Image Synthesis with Spatially-Adaptive Normalization: 论文地址:https://arxiv.org/pdf/1903.0729 ...

  9. python复现:PCA-based spatially adaptive denoising of CFA images for single-sensor digital cameras

    PCA-based spatially adaptive denoising of CFA images for single-sensor digital cameras 是2009年一篇基于PCA ...

最新文章

  1. linux expect日期加减,如何“输出”出命令“日期”? (linux/expect/sftp)
  2. c语言中isnarc变量,C语言 二级 1-40上机模拟试题答案.doc
  3. String,StringBuffer,StringBulider 三者的区别
  4. Web安全学习Week5
  5. 计算机硬件系统都是看得见的,计算机组成硬件系统).doc
  6. Eclipse 的使用
  7. 中国石油大学--生活学习简易FAQ
  8. MSDN资源下载网站源码
  9. Guava base -- Splitter
  10. HTTP:SSL证书简介!
  11. SysML精粹学习笔记一
  12. 数字信号处理公式变程序(四)——巴特沃斯滤波器(下)
  13. 【动态规划】图像压缩问题
  14. 群晖Mail Plus设置流程及mail-tester得分优化
  15. R 实战 | 使用clusterProfiler进行多组基因富集分析
  16. C++11 enable_if 详解
  17. Python第一阶段学习总结
  18. 数钱数到手抽筋html5,数钱数到手抽筋的经典句子
  19. Smart3d 近景摄影测量与航空摄影测量
  20. MapReduce: Simplified Data Processing on Large Clusters_中文翻译

热门文章

  1. 智慧校园让校园管理更智慧
  2. ArcGIS加载免费在线历史影像作为底图(不需要插件)
  3. 使用Ubuntu+qemu模拟器搭建arm运行环境
  4. ERP系统如何改善企业的业务?
  5. 开启Guest用户__linux虚拟机可共享windows的资料。
  6. Vue整合Rtmp流实现无Flash播放[flv+websocket篇]
  7. ABLIC Inc.推出具有宽工作电压范围的汽车用零点漂移运算放大器S-19630AB
  8. 2.1.6 面向对象:一切皆对象(Python)
  9. numpy 矩阵对角线_NumPy 构建规则矩阵
  10. 学会各种姿势备份与还原达梦数据库