非监督GAN算法U-GAT-IT大幅改进图像转换效果

复现论文题目:U-GAT-IT: Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation(2019-7-25)
原文
论文复现课程

文章主要解决:

无监督的图像转换的问题,当两个域的图像的纹理和形状差别很大时,现有的一些经典模型(CycleGAN、UNIT、MUNIT、DRIT等)效果不佳,不能很好的到达预期效果,这些算法仅适用于两个差别较小的域,如photo2vangogh和photo2portriat,而cat2dog和selfie2anime(自拍到漫画)效果不好, 本文通过以下方法在几何变形很大的情况下,得到较好的结果:

1、首先是引入注意力机制,这里的注意力机制并不传统的 Attention 或者 Self-Attention 的计算全图的权重作为关注,而是采用全局和平均池化下的类激活图(Class Activation Map-CAM)[2] 来实现的,CAM 对于做分类和检测的应该很熟悉,通过 CNN 确定分类依据的位置,这个思想和注意力是一致的,同时这对于无监督下语义信息的一致性判断也是有作用的,这块我们后续再进行展开。


由上图,我们可以看到对于图像经过下采样和残差块得到的 Encoder Feature map 经过 Global average pooling 和 Global max pooling 后得到依托通道数的特征向量。创建可学习参数 weight,经过全连接层压缩到 B×1 维,这里的 B 是 BatchSize,对于图像转换,通常取为 1。

能够引导生成器G关注那些区分源域与目标域的更重要的区域,从而使得G的性能能够更好发挥,并让G对于图像整体的改变与obj.形变有更好的处理能力。

2、引入新的正则化方式AdaLIN(自适应layer norm与instance norm),其作用是帮助注意力引导模型灵活控制形状和纹理的变化量。


完整的 AdaLIN 操作就如上图展示,对于经过 CAM 得到的输出,首先经过 MLP 多层感知机得到 γ,β,在 Adaptive Instance Layer resblock 中,中间就是 AdaLIN 归一化。

有了上述的两项作用,使得 U-GAT-IT 实现了具有多任务下鲁棒的图像转换模型。

网络结构


图中的模型分为生成器(G)和判别器(D),其中生成器比判别器多了AdaLIN 和 Decoder这部分的操作。

生成器
首先是对输入端进行图像的下采样,配合残差块增强图像特征提取,接下来就是注意力模块,接着就是对注意力模块通过 AdaLIN 引导下残差块,最后通过上采样得到转换后的图像。

判别器
判别器相对于生成器而言,就是将解码过程换成判别输出。

效果图

作者在马和斑马,猫到狗,人脸到油画等不成对的图像数据集评估了方法的性能,我认为最有创意的就是作者团队创建的女性到动漫的数据集的风格场景。

由下图可以看出该方法在定量和定性方面都展示了优越的结果。

总结

论文提出了无监督的图像到图像转换(U-GAT-IT),其中注意力机制模块和 AdaLIN 正规化可以在具有固定网络架构和超参数的各种数据集中产生更加赏心悦目的视觉效果。辅助分类器获得的图像可以指导生成器更多地关注源域和目标域之间的不同区域,从而来提高条件GAN的性能。此外,自适应图层实例规范化(AdaLIN)可以进一步增强模型在不同数据集下的鲁棒性。

【PaddlePaddle论文复现】U-GAT-IT: 基于GAN的新型无监督图像转换相关推荐

  1. Github大热论文 | U-GAT-IT:基于GAN的新型无监督图像转换

    作者丨武广 学校丨合肥工业大学硕士生 研究方向丨图像生成 生成对抗网络(GAN)在这几年的发展下已经渐渐沉淀下来,在网络的架构.训练的稳定性控制.模型参数设计上都有了指导性的研究成果.我们可以看出 1 ...

  2. CVPR 2021 | ShapeInversion: 基于GAN逆映射的无监督点云补全方法

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 摘要 · 看点 在CVPR 2021上,商汤科技-南洋理工大学联合 AI 研究中心 S-Lab 提出了 ...

  3. 又一新框架 | 无监督图像转换任务新境界(附论文代码)

    关注并星标 从此不迷路 计算机视觉研究院 2020 IEEE国际计算机视觉与模式识别会议(IEEE Conference on Computer Vision and Pattern Recognit ...

  4. 登顶Github趋势榜,非监督GAN算法U-GAT-IT大幅改进图像转换效果

    点击我爱计算机视觉标星,更快获取CVML新技术 近日,GAN的大家族又出一位重量级新成员U-GAT-IT,图像转换效果提升明显,原作者开源代码这两天登顶Github趋势榜,引起极大关注. U-GAT- ...

  5. 【PaddlePaddle论文复现】LARGE SCALE GAN TRAINING FOR HIGH FIDELITY NATURAL IMAGE SYNTHESIS阅读心得

    [PaddlePaddle论文复现]LARGE SCALE GAN TRAINING FOR HIGH FIDELITY NATURAL IMAGE SYNTHESIS阅读心得 作者:Andrew B ...

  6. 飞桨PaddlePaddle(论文复现)-BigGAN解读

    飞桨PaddlePaddle(论文复现)-BigGAN解读 先来看看效果(左上脚为生成的图像) 论文在现有GAN的基础上对生成样本的保真度与多样性之间的权衡进行改进 在ImageNet的128*128 ...

  7. 【PaddlePaddle论文复现营】Temporal Pyramid Network for Action Recognition

    [PaddlePaddle论文复现营]Temporal Pyramid Network for Action Recognition 写在前面的话 论文简介 从视频分类领域中的一个痛点谈起 相关工作 ...

  8. “用于无监督图像生成解耦的正交雅可比正则化”论文解读

    Tikhonov regularization terms https://blog.csdn.net/jiejinquanil/article/details/50411617 本文是对博客http ...

  9. 基于图像重建损失的无监督变化检测

    阅读翻译:Unsupervised Change Detection Based on Image Reconstruction Loss Abstract: 为了训练变化检测器,使用在同一区域的不同 ...

  10. 论文Express | 英伟达最新:多模态无监督图像迁移网络框架

    不久前,文摘菌给大家分享了一篇Ian Goodfellow的论文,教大家如何把一张哈士奇的图像硬生生的AI成一只猫咪,论文的结果确实会让人傻傻分不清楚,点击这里查看相关内容. 然而,今天的这篇论文效果 ...

最新文章

  1. MS SQL入门基础:备份和恢复系统数据库
  2. 【每日一算法】两数之和 IV - 输入 BST
  3. OO实现ALV TABLE 八:ALV的布局功能
  4. MongoDB shell 操作
  5. QT的QItemModelBarDataProxy类的使用
  6. cannot import caffe
  7. html 跳转到本页面指定位置
  8. 组建一个局域网一般会用到哪些设备_路由器和交换机的区别是什么?在实际使用中有哪些不同...
  9. 从源码分析RocketMQ系列-RocketMQ消息持久化源码详解
  10. shell 执行qt生成文件_QT-窗口打印debug信息,本地日志保存,以及执行shell脚本并且把信息打印在窗口...
  11. 专业的自建邮件服务器,自己搭建邮件服务器有哪些软硬件需求??
  12. SWAT模型在水文水资源、面源污染模拟中的实践技术应用及典型案例分析
  13. 王道训练营3月27日
  14. 微信小程序-微信支付
  15. 聚苯硫醚的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  16. 原来贝叶斯统计分析这么简单?这个技巧了解一下
  17. Insomnia的下载
  18. SaaS,PaaS和IaaS在一张图中进行了解释
  19. JAVA制作弹出小广告的程序_微信小程序实现首页弹出广告
  20. TensorFlow实践项目的报告

热门文章

  1. 在 Windows Azure 网站上使用 Django、Python 和 MySQL:创建博客应用程序
  2. [zt]软件研发的6sigma案例解析
  3. Yara、Snort和Sigma规则
  4. 2019上半年软件设计师考试体会
  5. 【生信】全基因组测序(WGS)
  6. 【IOS】获取iOS设备唯一标识的演进UDID, MAC Address,UUID,IDFA,IDFV,OpenUDID
  7. 星星之火OIer:C++大纲
  8. 使用 html 来创建站点,怎样使用HTML创建免费网站
  9. php总结与展望_2020 年的 PHP 回顾与展望
  10. android提交sql语句,sql的提交 - 亭子happy的个人页面 - OSCHINA - 中文开源技术交流社区...