总说

对于非监督domain mapping, 要学习的是数据集A到数据集B的一种映射。即GAB可以将A的一个样例映射到B中的一个相似物。人来采用dual learning，提出了训练两个模型，GAB和GBA。使得x（x是A的一个样例）经过GAB,再经过GBA仍旧与x尽量相似，当然对于y是一个B的样例，也有类似。
这种思想有2017年出了N篇论文。主要有：DiscoGAN[1], DualGAN[1]， CycleGAN[3]等等吧。。
这篇论文的主要贡献：提出一种distance的约束，使得非监督domain mapping可以one sided。我可以只训练一个G_{AB}就够了，不用训练G_{BA}

Self-distance constraints

作者提出这个其实只是为了和cyclegan进行比较，因为cyclegan默认的代码的batchsize=1。啊，那distance gan可是基于2幅图片的啊，所以做作者就将一幅图片分成两半（比如左一半，右一半）从而得到distance约束。

Lself−distance(GAB,p^A)=Ex∼p^A|1σA(∥L(x)−R(x)∥1−μA)−1σB(∥L(GAB(x))−R(GAB(x))∥1−μB)|

其中 μA 和 σA 是domain A中的图片的左右两半的均值和方差，但是 μB 和 σB 类似。

这种self-distance约束其实并不是一个好的约束，至少从实验结果可以看出。

比如在car2car，这是对于一个3D数据集分成A，B。显然GAB是学习这种角度不变性。这种模型mapping不会涉及到形状的巨大变化，主要是逐点的映射, 貌似Distance+cycle会有较好的效果。而对于car2head，这种具有外观巨大变化，以前的cyclegan是无法处理的（论文中给出cat2dog失败例子），cyclegan只能处理外观几乎一样（horse2zero之类的）。但是可以看到distance约束有更好点的效果。self dist效果不好也是比较容易解释的因为毕竟是单幅图像内部的距离约束。比如是图片的左右部分的距离约束，那么车和人脸不都具有很强的对称性吗？这种单幅图中的距离约束就会不那么work。

参考论文:One-Sided Unsupervised Domain Mapping[5]

参考文献

Learning to Discover Cross-Domain Relations with Generative Adversarial Networks
DualGAN: Unsupervised Dual Learning for Image-to-Image Translation
Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
Unsupervised Cross-Domain Image Generation
One-Sided Unsupervised Domain Mapping

比CycleGAN更强的非监督GAN----DistanceGAN相关推荐

登顶Github趋势榜，非监督GAN算法U-GAT-IT大幅改进图像转换效果
点击我爱计算机视觉标星,更快获取CVML新技术近日,GAN的大家族又出一位重量级新成员U-GAT-IT,图像转换效果提升明显,原作者开源代码这两天登顶Github趋势榜,引起极大关注. U-GAT- ...
ECCV 2020 | 比GAN更强，ETH提出新型超分辨率模型SRFlow
本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载. 选自arXiv 作者:Andreas Lugmayr等编辑:小舟.魔王近日,来自苏黎世联邦理工学院计算机视觉实 ...
专访微软邓力：语音识别与非监督深度学习、增强学习、词嵌入、类脑智能
在俞栋接受CSDN专访解读基于深度学习的语音识别技术及CNTK开源软件的同时,<解析深度学习-语音识别实践>一书的另一位作者.微软人工智能首席科学家邓力也接受CSDN专访,以另外的视角诠释 ...
SOLOv 2：实例分割（动态、更快、更强）
SOLOv 2:实例分割(动态.更快.更强) SOLOv2: Dynamic, Faster and Stronger 论文链接: https://arxiv.org/pdf/2003.10152.p ...
UC 伯克利华人一作：卷积让视觉 Transformer 性能更强，ImageNet 继续刷点！
转自 | 新智元来源 | arXiv 编辑 | LQ Priscilla Convolutional stem is all you need! Facebook AI和UC伯克利联手,探究视觉Tr ...
超越Swin Transformer！谷歌提出了收敛更快、鲁棒性更强、性能更强的NesT
[导读]谷歌&罗格斯大学的研究员对ViT领域的分层结构设计进行了反思与探索,提出了一种简单的结构NesT,方法凭借68M参数取得了超越Swin Transformer的性能. 文章链接:htt ...
时隔两年，EfficientNet v2来了！更快，更小，更强！
导读谷歌在EfficientNet的基础上,引入了Fused-MBConv到搜索空间中:同时为渐进式学习引入了自适应正则强度调整机制,组合得到了EfficientNetV2,它在多个基准数据集上取得 ...
CenterNet2：比强更强的二阶段网络，COCO成绩最高达到56.4mPA
摘要我们开发了两阶段目标检测的概率解释.我们表明,这种概率解释激发了许多常见的经验培训实践.它还建议更改两阶段检测管道.具体来说,第一阶段应该推断适当的对象与背景可能性,然后应该告知检测器的总体分数 ...
（一）一种硬盘故障预测的非监督对抗学习方法（2019-西安电子科技大学学报）
内含动画的PPT已经上传,可以在我上传的资源里看到,可免费下载该篇论文主要围绕"异常检测+硬盘故障预测+GAN+非监督"展开,以下是个人对整篇文章脉络的整理和理解. 文章目录 * ...

比CycleGAN更强的非监督GAN----DistanceGAN

总说

相关工作

Adversarial constraints

Circularity constraints

Target Domain Identity

Distance Constraints

Self-distance constraints

参考文献

比CycleGAN更强的非监督GAN----DistanceGAN相关推荐

最新文章

热门文章