2019-08-27 20:48:57

作者:Jonathan Hui
编译:ronghuaiyang

导读

GANs被称为是深度学习“过去20年内在深习上最酷的想法”,既然是最酷的想法,那就会有最酷的应用,一起来看看吧!

在GAN发展的头几年,我们取得了令人印象深刻的进展。再也不是恐怖电影里那种邮票大小的面部照片了。在2017年,GAN生成的1024×1024的图像可以让星探上当。在未来几年,我们可能会看到GANs生成的高质量视频。商业应用将会出现!作为GAN系列的一部分,我们将研究一些很酷的应用,并希望它们能够成为你的GAN应用的灵感来源。

创造动漫人物

游戏开发和动画制作成本高昂,需要雇佣许多艺术家来完成相对常规的任务。GAN可以自动生成动画角色并为其上色。

生成器和判别器由多个卷积层、batch normalization和带跳跃连接的ReLU层组成。

人物姿态图像生成

通过额外的姿态输入,我们可以将图像转换成不同的姿态。例如,右上角的图像是ground truth,右下角的图像是生成的图像。

下面的是生成的图像。

这个设计由两级图像生成器和判别器组成。生成器使用元数据(姿态)和原始图像来重建图像。判别器使用原始图像作为CGAN设计的标签输入的一部分。

CycleGAN

跨域转换GANs很可能是第一批的商业应用。这些GANs将图像从一个领域(如真实的风景)变换到另一个领域(莫奈或梵高的绘画)。

例如,它可以在斑马和马之间转换图像。

CycleGAN构建2个网络GF,构建从一个域到另一个域以及相反方向的图像变换。它使用判器来判断生成的图像的好坏。例如,G将真实图像转换为梵高风格的绘画,Dy用于区分图像是真实的还是生成的。

域A➝域B:

我们在相反的方向域B➝域A重复这个过程:

PixelDTGAN

时尚博主和电子商务已经开始流行根据名人照片来推荐商品。PixelDTGAN可以从一张图像来创建服装图像和样式。

PixelDTGAN

PixelDTGAN

超分辨率

从低分辨率创建超分辨率图像。在这一领域,GAN表现出了令人印象深刻的成果,并具有即刻的商业可能性。

SRGAN

与许多GAN设计类似,它由许多卷积层、batch normalization、高级ReLU和skip连接组成。

SRGAN

渐进生成的GANs

渐进式GAN可能是第一个展示商业级图像质量的GAN。下面是由GAN生成的1024×1024的名人图片。

Progressive growing of GANs

它采用分治策略,使训练更加可行。一次训练构建2×分辨率的图像。

9个阶段,生成一个1024×1024的图像。

Progressive growing of GANs

高分辨率图像生成

这不是图像分割!而是反过来,从语义映射生成图像。收集样本是非常昂贵的。我们尝试用生成的数据来补充训练数据集,以降低开发成本。在训练自动驾驶汽车的过程中生成视频,而不是看着它们在你的社区里巡航,这将非常方便。

网络设计:

pix2pixHD

Text to image (StackGAN)

文本到图像是域转换GAN较早的应用之一。我们输入一个句子并生成多个符合描述的图像。

StackGAN

StackGAN

文本到图像的生成

另一个流行的实现:

Generative Adversarial Text to Image Synthesis

人脸生成

合成不同姿势的人脸:用一张输入图像,我们创建不同视角的人脸。例如,我们可以使用它来转换图像,这将更容易进行人脸识别。

TP-GAN

TP-GAN

图像修复

修复图像是几十年前的一个重要课题。GAN用于修复图像,并用创建的“内容”填充缺失的部分。

Context encoder

学习联合分布

用不同的面部特征组合(金发,女性,微笑,戴眼镜),(棕色,男性,微笑,不戴眼镜)创建GANs是很昂贵的…相反,我们可以学习单独的数据分布,并将它们组合成不同的分布。即不同的属性组合。

CoGAN

CoGAN

DiscoGAN

DiscoGAN提供了风格的匹配:许多潜在的应用。disco学习跨域的关系,没有标签或配对。例如,它成功地将样式(或模式)从一个域(手袋)变换到另一个域(鞋子)。

DiscoGAN

Discgan和CycleGAN在网络设计上非常相似。

DiscoGAN

Pix2Pix

Pix2Pix是一种图像到图像的转换,经常在GAN的跨域论文中被引用。例如,它将卫星图像转换为地图(左下角)。

DTN

从图片中创建表情符号。

DTN

DTN

纹理生成

MGAN

图像编辑 (IcGAN)

重建或编辑具有特定属性的图像。

IcGAN

IcGAN

Face aging (Age-cGAN)

Age-cGAN

Age-cGAN

Neural Photo Editor

基于内容的图像编辑:例如,扩展发带。

Refine image

物体检测

这是用GAN增强现有解决方案的一个应用。

Perceptual GAN

图像融合

把图像融合在一起。

GP-GAN

视频生成

创建新的视频序列。它识别什么是背景,并为前台操作创建新的时间序列。

生成3D物体

这是一篇经常引用的用GAN创建3D对象的文章。3DGAN

3DGAN

音乐生成

GAN可以应用于非图像领域,如作曲。

MidiNet

MidiNet

医疗(异常检测)

GAN还可以扩展到其他行业,如肿瘤检测领域。

AnoGAN

英文原文:https://medium.com/@jonathan_hui/gan-some-cool-applications-of-gans-4c9ecca35900

一些非常酷的GAN的应用相关推荐

  1. Pytorch生成对抗网络(GAN)官方入门教程

    目录 引言(Introduction) 生成对抗网络(Generative Adversarial Networks) 什么是GAN?(What is a GAN?) 什么是DCGAN?(What i ...

  2. Ian Goodfellow回忆GAN诞生故事:几杯啤酒喝出“20年来最酷的深度学习想法”

    当Ian Goodfellow解释他在谷歌大脑所做的研究时,他引用了原子物理学家.加州理工学院教授兼畅销书作家的这句格言.但是,Goodfellow不是指自己,也不是Google内的任何其他人.他谈论 ...

  3. BigBiGAN问世,“GAN父”都说酷的无监督表示学习模型有多优秀?

    作者 | Jeff Donahue.Karen Simonyan 译者 | Lucy.一一 出品 | AI开发者大本营(ID:rgznai100) 众所周知,对抗训练生成模型(GAN)在图像生成领域获 ...

  4. 基于生成对抗网络(GAN)的人脸变形(附链接) | CSDN博文精选

    扫码参与CSDN"原力计划" 翻译 | 张一豪 校对 | 吴金笛 来源 | 数据派THU *点击阅读原文,查看「CSDN原力计划」详细说明. 本文详细介绍了生成对抗网络(GAN)的 ...

  5. 面试官:原生GAN都没复现过,自己走还是我送你?

    在近20年,GAN可以算是深度学习中最酷的想法. 而GAN的应用落地也已经非常广泛,包括图像生成(超分辨率).语义分割.文字生成.数据增强.信息检索/排序.聊天机器人等,还有近期席卷B站的AI视频换脸 ...

  6. 这是我见过的GAN的最佳用法!

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 子豪 发自 凹非寺 量子位 报道 | 公众号 QbitAI 用GAN ...

  7. 把梯度下降算法变成酷炫游戏,这有一份深度学习通俗讲义

    公众号关注 "视学算法" 设为"星标",第一时间知晓最新干货~ 晓查 发自 凹非寺 转载自量子位 | 公众号 QbitAI 让小球滚下山坡,找到它们分别落在哪个 ...

  8. 十个效果酷炫的Linux系统操作指令(像黑客帝国般的效果~)

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 想想电影黑客帝国中的画面,估计会令很多人都叹为观止,其实最简单的只 ...

  9. 酷炫的深度学习网络图怎么绘制出来的?

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文我们聊聊如何才能画出炫酷高大上的神经网络图,下面是常用的几种工 ...

最新文章

  1. 红米 Note3 (kenzo)刷入 Lineage OS
  2. 格灵深瞳开盘破发,市值73亿,创始人曾是谷歌眼镜创始成员
  3. python爬虫自学笔记分析解密_python爬虫学习笔记——1 各种文本分析工具简介之汇总...
  4. Redis中的set应用场景
  5. Java Web的web.xml文件作用及基本配置(转)
  6. wps 复制流程图_简单三步,用WPS轻松完成一个又大气又好看的流程图!
  7. easyPR源码解析之plate_locate.h
  8. 题目36:二叉搜索树
  9. 【贪心】POJ - 3069 Saruman's Army
  10. 输出毫秒_毫秒级网络监控(网络示波器)
  11. uint32_t 大小端转换
  12. 过来人给Java初学者的建议!
  13. Scintilla的使用c++ build
  14. SPSS25 软件安装教程(附带网盘资源)
  15. ​LeetCode刷题实战518:零钱兑换 II
  16. 怎么注销百度云服务器账号,百度网盘如何注销账号?百度网盘注销账号的方法步骤...
  17. Caused by: java.io.IOException: Keystore was tampered with, or password was incorrect
  18. Eclipse开发环境搭建
  19. 转:英语 表示字母、数字的复数
  20. html字体颜色 html中设置字体颜色代码 字体颜色获取

热门文章

  1. TSNE 附有codechina代码
  2. python 中遍历表时候,当指定的表的长度超过实际长度时候,实际遍历的长度以表实际长度为准,不会发生越界,如下
  3. numpy常用函数之random.normal函数
  4. 神经网络感知器算法调整原理是什么
  5. 一张图看懂encodeURI、encodeURIComponent、decodeURI、decodeURIComponent的区别 一、这四个方法的用处 1、用来编码和解码URI的 统一资源标识符
  6. LIVE 预告 | 快手宋洋:千亿特征,万亿参数,快手推荐精排模型的发展史
  7. 堪比Focal Loss!解决目标检测中样本不平衡的无采样方法
  8. VS2010 + Qt5.3.2配置教程
  9. c++ demo: 单词转换
  10. Google首席科学家Peyman 《计算成像去噪进展》斯坦福演讲报告,附视频与Slides