来源:新智元

本文约2200字建议阅读7分钟

本文所选论文提供了一个易读的对GAN的介绍,帮助你理解GAN技术的基础。

[ 导读 ]生成对抗网络 (GAN) 是深度学习中最有趣、最受欢迎的应用之一。本文列出了 10 篇关于 GAN 的论文,这些论文将为你提供一个很好的对 GAN 的介绍,帮助你理解最先进技术的基础。

本文选择的 10 篇 GAN 论文包括:

  1.  DCGANs
  2.  Improved Techniques for Training GANs
  3. Conditional GANs
  4. Progressively Growing GANs
  5.  BigGAN
  6. StyleGAN
  7. CycleGAN
  8.  Pix2Pix
  9.  StackGAN
  10.  Generative Adversarial Networks

DCGANs — Radford et al. (2015)

我建议你以 DCGAN 这篇论文来开启你的 GAN 之旅。这篇论文展示了卷积层如何与GAN 一起使用,并为此提供了一系列架构指南。这篇论文还讨论了 GAN 特征的可视化、潜在空间插值、利用判别器特征来训练分类器、评估结果等问题。所有这些问题都必然会出现在你的 GAN 研究中。

总之,DCGAN 论文是一篇必读的 GAN 论文,因为它以一种非常清晰的方式定义架构,因此很容易从一些代码开始,并开始形成开发 GAN的直觉。

DCGAN 模型:具有上采样卷积层的生成器架构

论文:Unsupervised Representation Learning with Deep Convolutional Generative Adversarial NetworksAlec Radford, Luke Metz, Soumith Chintalahttps://arxiv.org/abs/1511.0643

改进 GAN 训练的技术 —— Salimans et al. (2016)

这篇论文 (作者包括 Ian Goodfellow) 根据上述 DCGAN 论文中列出的架构指南,提供了一系列建议。这篇论文将帮助你了解 GAN 不稳定性的最佳假设。此外,本文还提供了许多用于稳定 DCGAN 训练的其他机器,包括特征匹配、 minibatch 识别、历史平均、单边标签平滑和虚拟批标准化。使用这些技巧来构建一个简单的 DCGAN 实现是一个很好的练习,有助于更深入地了解 GAN。

论文:Improved Techniques for Training GANsTim Salimans, Ian Goodfellow, Wojciech Zaremba, Vicki Cheung, Alec Radford, Xi Chenhttps://arxiv.org/abs/1606.0349

Conditional GANs — Mirza and Osindero (2014)

这是一篇很好的论文,读起来很顺畅。条件 GAN(Conditional GAN) 是最先进的 GAN之一。论文展示了如何整合数据的类标签,从而使 GAN 训练更加稳定。利用先验信息对 GAN 进行调节这样的概念,在此后的 GAN 研究中是一个反复出现的主题,对于侧重于 image-to-image 或 text-to-image 的论文尤其重要。

Conditional GAN 架构:除了随机噪声向量 z 之外,类标签 y 被连接在一起作为网络的输入

论文:Conditional Generative Adversarial NetsMehdi Mirza, Simon Osinderohttps://arxiv.org/abs/1411.178

Progressively Growing GANs— Karras et al. (2017)

Progressively Growing GAN (PG-GAN) 有着惊人的结果,以及对 GAN 问题的创造性方法,因此也是一篇必读论文。

这篇 GAN 论文来自 NVIDIA Research,提出以一种渐进增大(progressive growing)的方式训练 GAN,通过使用逐渐增大的 GAN 网络(称为 PG-GAN)和精心处理的CelebA-HQ 数据集,实现了效果令人惊叹的生成图像。作者表示,这种方式不仅稳定了训练,GAN 生成的图像也是迄今为止质量最好的。

它的关键想法是渐进地增大生成器和鉴别器:从低分辨率开始,随着训练的进展,添加新的层对越来越精细的细节进行建模。“Progressive Growing” 指的是先训练 4x4 的网络,然后训练 8x8,不断增大,最终达到 1024x1024。这既加快了训练速度,又大大稳定了训练速度,并且生成的图像质量非常高。

Progressively Growing GAN 的多尺度架构,模型从 4×4 逐步增大到 1024×1024

论文:Progressive Growing of GANs for Improved Quality, Stability, and VariationTero Karras, Timo Aila, Samuli Laine, Jaakko Lehtinenhttps://arxiv.org/abs/1710.1019

BigGAN — Brock et al. (2019)

BigGAN 模型是基于 ImageNet 生成图像质量最高的模型之一。该模型很难在本地机器上实现,而且 BigGAN 有许多组件,如 Self-Attention、 Spectral Normalization 和带有投影鉴别器的 cGAN,这些组件在各自的论文中都有更好的解释。不过,这篇论文对构成当前最先进技术水平的基础论文的思想提供了很好的概述,因此非常值得阅读。

BigGAN 生成的图像

论文:Large Scale GAN Training for High Fidelity Natural Image SynthesisAndrew Brock, Jeff Donahue, Karen Simonyanhttps://arxiv.org/abs/1809.1109

StyleGAN — Karras et al. (2019)

StyleGAN 模型可以说是最先进的,特别是利用了潜在空间控制。该模型借鉴了神经风格迁移中一种称为自适应实例标准化 (AdaIN) 的机制来控制潜在空间向量 z。映射网络和 AdaIN 条件在整个生成器模型中的分布的结合使得很难自己实现一个 StyleGAN,但它仍是一篇很好的论文,包含了许多有趣的想法。

StyleGAN 架构,允许潜在空间控制

论文:A Style-Based Generator Architecture for Generative Adversarial NetworksTero Karras, Samuli Laine, Timo Aila https://arxiv.org/abs/1812.04948

CycleGAN — Zhu et al. (2017)

CycleGAN 的论文不同于前面列举的 6 篇论文,因为它讨论的是 image-to-image 的转换问题,而不是随机向量的图像合成问题。CycleGAN 更具体地处理了没有成对训练样本的 image-to-image 转换的情况。然而,由于 Cycle-Consistency loss 公式的优雅性,以及如何稳定 GAN 训练的启发性,这是一篇很好的论文。CycleGAN 有很多很酷的应用,比如超分辨率,风格转换,例如将马的图像变成斑马。

Cycle Consistency Loss 背后的主要想法,一个句子从法语翻译成英语,再翻译回法语,应该跟原来的是同一个句子

论文:Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial NetworksJun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efroshttps://arxiv.org/abs/1703.1059

Pix2Pix — Isola et al. (2016)

Pix2Pix 是另一种图像到图像转换的 GAN 模型。该框架使用成对的训练样本,并在GAN 模型中使用多种不同的配置。读这篇论文时,我觉得最有趣部分是关于 PatchGAN的讨论。PatchGAN 通过观察图像的 70×70 的区域来判断它们是真的还是假的,而不是查看整个图像。该模型还展示了一个有趣的 U-Net 风格的生成器架构,以及在生成器模型中使用 ResNet 风格的 skip connections。 Pix2Pix 有很多很酷的应用,比如将草图转换成逼真的照片。

使用成对的训练样本进行 Image-to-Image 转换

论文:Image-to-Image Translation with Conditional Adversarial NetworksPhillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. Efroshttps://arxiv.org/abs/1611.0700

StackGAN — Zhang et al. (2017)

StackGAN 的论文与本列表中的前几篇论文相比非常不同。它与 Conditional GAN 和Progressively Growing GANs 最为相似。StackGAN 模型的工作原理与 Progressively Growing GANs 相似,因为它可以在多个尺度上工作。StackGAN 首先输出分辨率为64×64 的图像,然后将其作为先验信息生成一个 256×256 分辨率的图像。

StackGAN是从自然语言文本生成图像。这是通过改变文本嵌入来实现的,以便捕获视觉特征。这是一篇非常有趣的文章,如果 StyleGAN 中显示的潜在空间控制与 StackGAN 中定义的自然语言接口相结合,想必会非常令人惊讶。

基于文本嵌入的 StackGAN 多尺度架构

背后的想法

论文:StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial NetworksHan Zhang, Tao Xu, Hongsheng Li, Shaoting Zhang, Xiaogang Wang, Xiaolei Huang, Dimitris Metaxashttps://arxiv.org/abs/1612.0324

Generative Adversarial Networks — Goodfellow et al. (2014)

Ian Goodfellow 的原始 GAN 论文对任何研究 GAN 的人来说都是必读的。这篇论文定义了 GAN 框架,并讨论了 “非饱和” 损失函数。论文还给出了最优判别器的推导,这是近年来 GAN 论文中经常出现的一个证明。论文还在 MNIST、TFD 和 CIFAR-10 图像数据集上对 GAN 的有效性进行了实验验证。

论文:Generative Adversarial NetworksIan J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengiohttps://arxiv.org/abs/1406.266

原文链接:

https://towardsdatascience.com/must-read-papers-on-gans-b665bbae3317

编辑:黄继彦

校对:林亦霖

— 完 —

关注清华-青岛数据科学研究院官方微信公众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容。

生成对抗网络gan原理_必读!TOP10生成对抗网络GAN论文(附链接)相关推荐

  1. 高级架构师_Docker_第2章_ Docker核心原理_ 第2节_Docker网络

    高级架构师_Docker_第2章_ Docker核心原理_ 第2节_Docker网络 文章目录 高级架构师_Docker_第2章_ Docker核心原理_ 第2节_Docker网络 Docker网络 ...

  2. 生成对抗网络gan原理_生成对抗网络(GAN)的半监督学习

    前言 如果您曾经听说过或研究过深度学习,那么您可能就知道MNIST, SVHN, ImageNet, PascalVoc或者其他数据集.这些数据集都有一个共同点: 它们由成千上万个有标签的数据组成. ...

  3. 20200123_导航电子地图道路网络分层原理_研讨会视频

    导航电子地图道路网络分层原理 1 道路网络的分层简介 2 原始母库数据的路网分层 3 物理格式与导航应用中的路网分层 4 路网分层的一些学术思考 第一讲 导航电子地图道路网络分层原理 会议视频,正式上 ...

  4. python生成二维码教程_使用Python生成个性二维码

    任务目的 这一步会介绍通过Python中的MyQR包实现生成二维码的操作,包括生成普通二维码.带有静态图和动态图的二维码,同时也会对MyQR生成二维码的常用参数进行介绍说明. 任务步骤注:CVM适合用 ...

  5. dcn网络与公网_电信运营商DCN网络的演变与规划方法(The evolution and plan method of DCN)...

    摘要:随着电信业务的发展和电信企业经营方式的转变,DCN网络的定位发生了重大的演变.本文基于这种变化,重点讨论DCN网络的规划方法和运维管理方法. Digest: With the developme ...

  6. 生成对抗网络gan原理_中国首个“芯片大学”即将落地;生成对抗网络(GAN)的数学原理全解...

    开发者社区技术周刊又和大家见面了,萌妹子主播为您带来第三期"开发者技术联播".让我们一起听听,过去一周有哪些值得我们开发者关注的重要新闻吧. 中国首个芯片大学,南京集成电路大学即将 ...

  7. 数据通信原理_跟百哥学网络05同网段主机通信原理

    百哥的第5篇原创 本篇文章介绍数据通信中最基础,最关键的原理之一,两台通网段的主机如何通信. 适合两台普通电脑之间,两台服务器之间,两台手机之间,电脑和打印机之间,手机和小爱同学之间,等等,只要两个同 ...

  8. navicat导出查询结果原理_使用Navicat生成ER关系图并导出

    平时管理数据库一般都是用cmd命令提示符,或是IDEA Intellij自带的Data source,使用Navicat比较少.这段时间,由于要对前后端交互的数据结构进行设计,直接写文档联系多表时有些 ...

  9. 设置好网络协议了为何网络还是不通_记一次菜鸟网络的面试经历

    我是一个不太爱折腾的人,因此在一个公司待久了,就不太会轻易跳槽.正因为如此,我在上家公司待了整整三年,在这里,认识了一群可爱的人,便更不舍得离去. 但因为公司属于传统企业,技术上并没有太大挑战,个人也 ...

最新文章

  1. 2021年大数据常用语言Scala(二十五):函数式编程 排序
  2. 小米亿级大数据实时分析与工具选型 【转】
  3. LV 旗下公司的识别算法: 4 秒鉴定假包,准确率达 99.1%
  4. 不可变的基础架构,热部署和JVM
  5. python创建sqlite3 unicode error_python/sqlite3:发生异常:sqlite3.operationalerror
  6. NDR(网络威胁检测及响应)与NTA的区别(网络流量检测)
  7. [有限元] DistMesh Matlab 程序示例
  8. 【干货下载】2020新基建展望:新战略、新动力、新格局.pdf(附下载链接)
  9. 好的文案,极大的降低沟通成本
  10. mysql错误代码1怎样解决_打开网页提示mysql发生错误,错误号1194,请问下该怎么解决? 爱问知识人...
  11. python做路径图_python实现生成图片路径和对应标签
  12. linux程序员笔记软件,作为合格的程序员,你得知道这8款工具软件
  13. C语言利用堆筛选前1000大元素
  14. 125K非接触IC卡读卡头
  15. 跳出舒适区发现更大的世界,来社科院杜兰金融管理硕士项目汲取能量挑战自我
  16. 为创业者搭建梦想舞台,让技术与创新说话|腾讯数字安全创新大赛 · 嘉宾访谈
  17. 谷歌Chrome浏览器无法安装插件的解决方法
  18. ZBlog支持ppt一键导入
  19. 怎么批量下载哗哩哗哩B站视频
  20. 【一种利用插值验证的FL隐私保护框架】VFL: A Verifiable Federated Learning

热门文章

  1. oracle yyyy和yy,Oracle PL / SQL:SYSDATE与’DD-MMM-YY’的区别?
  2. python基本模块中的对象_Python 学习笔记 -- OS模块的常用对象方法
  3. 计算机应用能力文字录入,2017全国专业技术人员计算机应用能力考试题库-Excel,Word,XP.pdf...
  4. android listview 优化,Android ListView、GridView等性能优化
  5. php能打开.shp文件吗,shp文件是什么格式的
  6. 工业以太网交换机故障的排障步骤
  7. 光模块兼容性介绍,如何测试兼容光模块的兼容性?
  8. 【渝粤教育】国家开放大学2018年春季 0599-22T工程造价管理基础理论与相关法规 参考试题
  9. 【渝粤题库】陕西师范大学200471 英汉翻译
  10. 8. Geometric problems