style transfer和domain adaption还是有很多相似之处的,本文挑选几篇文章进行简略介绍

Texture Synthesis Using Convolutional Neural Networks


Image Style Transfer Using Convolutional Neural Networks 16年cvpr

和A neural algorithm of artistic style. 15年8月一样的吧

利用DNN进行style transfer的开篇之作,也是上一篇Texture Synthesis的扩展,Texture Synthesis只有style(纹理),这一篇再加上content。
做法:送入一张噪音图片,然后通过content和style loss约束,梯度下降更改输入使其content和内容图片一致,style和样式图片一致。


Perceptual Losses for Real-Time Style Transfer and Super-Resolution


  1. 做超分那一派,图像生成问题(Feed-forward image transformation),原图-》增强图,后面有pixel loss监督
  2. style transfer这一派,用perceptual loss但是当成了优化问题,速度慢

前向图像生成且用perceptual loss,速度快效果好,消除了上一篇那种看成优化问题每次都要重新训练的缺点。

Texture Networks: Feed-forward Synthesis of Textures and Stylized Images


Ada BN

Adaptive Batch Normalization for practical domain
We hypothesize that the label related knowledge is stored in the weight matrix of each layer, whereas domain related knowledge is represented by the statistics of the BN.
正常的BN是每个batch减自己batch的均值除自己batch的方差,然后再维护一个running mean和running var用于test时用。即训练时每个batch只管自己,而test的mean var是融合了整个数据库的。
Adaptive BN是在源域上正常用BN训练,但是在目标域test前,需要先将已有的所有目标域图片送入网络进行一次前传,统计出一个running mean和running var,然后将这个mean和var用于目标域的test

Ada IN

Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization
AdaIN simply adjusts the mean and variance of the content input to match those of the style input. 换句话就是我们只需要把content图像在encoder后输出的均值和方差归一到style图像就行。(我还做了一点小实验,随意扰动mean var的顺序(本来是按channel算好的),可以得到不同的transfer结果,从结果中可以看到扰动mean影响大扰动var影响小,mean更多地代表着风格,而var则是细节的一些变化)


AutoDIAL: Automatic DomaIn Alignment Layers
adabn没有见过target 图片,target不能参与训练

