转载自

简单介绍了一下GAN和DCGAN的原理。以及如何使用Tensorflow做一个简单的生成图片的demo。

  • Ian Goodfellow对GAN一系列工作总结的ppt,确实精彩,推荐:独家 | GAN之父NIPS 2016演讲现场直击:全方位解读生成对抗网络的原理及未来(附PPT)
  • GAN论文汇总,包含code:zhangqianhui/AdversarialNetsPapers

CycleGAN是在今年三月底放在arxiv(地址:https://arxiv.org/abs/1703.10593)的一篇文章,文章名为Learning to Discover Cross-Domain Relations with Generative Adversarial Networks,同一时期还有两篇非常类似的DualGAN(地址:https://arxiv.org/abs/1704.02510)和DiscoGAN(地址:https://arxiv.org/abs/1703.05192),简单来说,它们的功能就是:自动将某一类图片转换成另外一类图片。

作者在论文中也举了一些例子,比如将普通的马和斑马进行互相转换,将苹果和橘子进行互相转换:

把照片转换成油画风格:

将油画中的场景还原成现实中的照片:

由于CycleGAN这个框架具有较强的通用性,因此一经发表就吸引了大量注意,很快,脑洞大开的网友想出了各种各样神奇的应用。

比如将猫变成狗:

让图片中的人露出笑容:

国外网友Jack Clark还搜集了巴比伦、耶路撒冷以及伦敦的古代地图,利用CycleGAN将它们还原成了真实卫星图像:

还有人使用CycleGAN将人脸转换成娃娃:

将男人变成女人:

把你自己变成一个“肌肉文身猛男”也是可以的:

如果说这些应用多少可以理解,那么下面的应用就有点“匪夷所思”了:你可以想象将人和拉面做转换吗?日本网友加藤卓哉(Takuya Kato)就训练了这样一个模型,它可以从拉面中生成人像,此外将人脸变成拉面的图片。鉴于生成的结果比较鬼畜,如果有兴趣的可以点击这个链接(地址:https://junyanz.github.io/CycleGAN/images/faces_and_ramens.jpg)观看生成结果。

此外,知乎上的 @達聞西 还用CycleGAN训练了可以脱掉女优衣服的模型(可以参考提高驾驶技术:用GAN去除(爱情)动作片中的马赛克和衣服),其脑洞之大,实在是让人惊叹了一番。但是技术水平还很厉害,下一篇博客把其中的技术扒过来。

今天这篇文章主要分成三个部分:

  • CycleGAN的原理解析

  • CycleGAN与原始的GAN、DCGAN、pix2pix模型的对比

  • 如何在TensorFlow中用CycleGAN训练模型

CycleGAN的原理

我们之前已经说过,CycleGAN的原理可以概述为:将一类图片转换成另一类图片。也就是说,现在有两个样本空间,X和Y,我们希望把X空间中的样本转换成Y空间中的样本。

因此,实际的目标就是学习从X到Y的映射。我们设这个映射为F。它就对应着GAN中的生成器,F可以将X中的图片x转换为Y中的图片F(x)。对于生成的图片,我们还需要GAN中的判别器来判别它是否为真实图片,由此构成对抗生成网络。设这个判别器为  。这样的话,根据这里的生成器和判别器,我们就可以构造一个GAN损失,表达式为:

这个损失实际上和原始的GAN损失是一模一样的,如果这一步不是很理解的可以参考一篇专栏:GAN学习指南:从原理入门到制作生成Demo。

但单纯的使用这一个损失是无法进行训练的。原因在于,映射F完全可以将所有x都映射为Y空间中的同一张图片,使损失无效化。对此,作者又提出了所谓的“循环一致性损失”(cycle consistency loss)。

我们再假设一个映射G,它可以将Y空间中的图片y转换为X中的图片G(y)。CycleGAN同时学习F和G两个映射,并要求  ,以及   。也就是说,将X的图片转换到Y空间后,应该还可以转换回来。这样就杜绝模型把所有X的图片都转换为Y空间中的同一张图片了。根据  和  ,循环一致性损失就定义为:

同时,我们为G也引入一个判别器  ,由此可以同样定义一个GAN的损失  ,最终的损失就由三部分组成:

CycleGAN与DCGAN的对比

为了进一步搞清楚CycleGAN的原理,我们可以拿它和其他几个GAN模型,如DCGAN、pix2pix模型进行对比。

先来看下DCGAN,它的整体框架和最原始的那篇GAN是一模一样的,在这个框架下,输入是一个噪声z,输出是一张图片(如下图),因此,我们实际只能随机生成图片,没有办法控制输出图片的样子,更不用说像CycleGAN一样做图片变换了。

CycleGAN与pix2pix模型的对比

pix2pix也可以做图像变换,它和CycleGAN的区别在于,pix2pix模型必须要求成对数据(paired data),而CycleGAN利用非成对数据也能进行训练(unpaired data)。

比如,我们希望训练一个将白天的照片转换为夜晚的模型。如果使用pix2pix模型,那么我们必须在搜集大量地点在白天和夜晚的两张对应图片,而使用CycleGAN只需同时搜集白天的图片和夜晚的图片,不必满足对应关系。因此CycleGAN的用途要比pix2pix更广泛,利用CycleGAN就可以做出更多有趣的应用。

在TensorFlow中实验CycleGAN

最后来讲一讲如何在TensorFlow中实验CycleGAN,打开全球最大的同性交友网站Github,我们可以发现CycleGAN在TensorFlow中已经有很多轮子了,我使用的代码是:vanhuyz/CycleGAN-TensorFlow(地址:https://github.com/vanhuyz/CycleGAN-TensorFlow)。

利用这个代码,我训练了一个从男性和女性图片互换的模型,比如将男人转换成女人(左侧为原图,右侧为模型自动生成的图片):

还可以将女性转换成男性:

为了训练这么一个模型,我们需要分别准备好男性的图片和女性的图片。在实践中,我使用了CelebA数据集,分别取出其中男性和女性的图片并统一缩放到256x256的大小,然后存入两个文件夹中:

如果你对这个实验有兴趣,可以直接在地址https://pan.baidu.com/s/1i5qY3yt下载到我使用的数据集。当然,也可以使用自己的数据,只需要将它们存为jpg格式并统一缩放到256x256的大小就可以了。接下来的步骤为:

1. 下载项目代码

git clone https://github.com/vanhuyz/CycleGAN-TensorFlow.git

2. 将图片转换成tfrecords格式

这个项目中提供了一个build_data脚本,用于将图片转换成tfrecords形式。假设我们的图片存放在~/datasets/man2woman/a_resized/和 ~/datasets/man2woman/b_resized目录下,对应的命令就是:

python build_data.py \
   --X_input_dir ~/datasets/man2woman/a_resized/ \
   --Y_input_dir ~/datasets/man2woman/b_resized/ \
   --X_output_file ~/datasets/man2woman/man.tfrecords \
   --Y_output_file ~/datasets/man2woman/woman.tfrecords

3. 训练

训练的命令为:

python train.py \
   --X ~/datasets/man2woman/man.tfrecords \
   --Y ~/datasets/man2woman/woman.tfrecords \
   --image_size 256

训练的过程比较漫长,此时可以打开TensorBoard来观察训练情况(运行这个命令时需要将“20170715-1622”改成机器中对应的文件夹,下同):

tensorboard --logdir checkpoints/20170715-1622

4. 导出模型并执行单张图片

导出模型的方法为:

python export_graph.py \
   --checkpoint_dir checkpoints/20170715-1622 \
   --XtoY_model man2woman.pb \
   --YtoX_model woman2man.pb  \
   --image_size 256

对单张图片进行转换(将data/test.jpg替换为对应的输入图片地址):

python inference.py \
--model pretrained/man2woman.pb  \
--input data/test.jpg  \
--output data/output.jpg \
--image_size 256

总结

有已经训练好哒model,调用后发现效果很不好。

CycleGAN 各种变变变相关推荐

  1. 网络规划设计师考试命题模式持续在变   你变不变

    命题模式持续在变    你变不变 深入分析2009下半年-2010下半年3次网络规划设计师考试试卷中项目管理模块(约有5~8题,约占总分数的6.67%~10.67%)的命题规律,心中最强烈的一份感觉体 ...

  2. javascript基础——文字变大变小className的使用及JS浮动的兼容用法

    文字变大变小,详情页比较常见的那种 <!DOCTYPE html> <html lang="en"> <head><meta charse ...

  3. 命题模式持续在变 你变不变

    命题模式持续在变    你变不变 深入分析2009上半年-2011上半年历次系统集成项目管理工程师考试试卷的命题规律,心中最强烈的一份感觉体现在一个字--变."变"是事物持续发展的 ...

  4. 三星a7108android 7.0,三星A7108系统运行速度变慢变卡顿了_怎么进行具体的刷机教程...

    这个三星2016版GALAXY A7(A7108/双4G)手机也是在2016年2月就上市的一款手机了,现在用的机友也是不少的,有的机友也是在用这个手机的时候遇到了这些或那样的问题,其中比较常见的问题也 ...

  5. IOS之代理文字点击变大变小

    IOS之代理文字点击变大变小 重点是掌握代理的使用,否则也失去次此意义 #import "ViewController.h" #import "AHLJFontSizeP ...

  6. IOS考试题3字体变大变小

    IOS考试题3字体变大变小 swift写法,oc待续 FontSizePicker.swift import UIKitenum FontSize : Int {case FontSizeSmall ...

  7. matlab做比例积分微分控制,收放卷卷径计算+闭环摆杆控制参数自适应PID控制算法(变比例变积分变微分)介绍...

    项目简介 最近在一个客户现场搞熔边机项目,涉及到收放卷工艺的卷径计算,同时张力控制使用的是摆杆,然后通过PID控制输出辅助转速补偿收卷伺服速度.单一的PID参数不能自动适应卷径变化,如在小卷径200m ...

  8. 出门就背他了!可伸缩的背包,自由变大变小,还有防盗功能!

    ▲ 点击查看 出门能不背包就不背包,几乎是小爆身边每个男生的人生信条. 不背包时,两手空空一身轻,潇洒有型. 但一旦到了必须背包,比如五一外出回家或旅游的时候,男同胞们翻箱倒柜找出来的背包,大多都是这 ...

  9. 怎样洗头使头发变黑变多

    洗头法 头发变黑变粗--用淘米水洗头.每天煮饭时会产生淘米水,请将淘米水留下,装在一个容器内放上二天,让它自然发酵.然后用来洗头,三天洗一次,不出三个月,你的头发就会变粗.变黑. 发酵后的淘米水会有一 ...

  10. 计算机界面横向拉宽了怎样还原,电脑屏幕变大变小了如何还原

    对于电脑屏幕变大变小了不知道还原,如何解决的呢,那么电脑屏幕变大变小了如何还原?下面是学习啦小编收集整理的电脑屏幕变大变小了如何还原,希望对大家有帮助~~ 电脑屏幕变大变小了还原的方法 因为每台显示器 ...

最新文章

  1. Codeforces 815 B Karen and Test 杨辉三角 组合数学
  2. c++标准程序库异常
  3. C语言程序练习-L1-015 跟奥巴马一起画方块 (15分)
  4. elasticsearch 自定义routing
  5. linux sqlserver 管理工具,Linux连接SqlServer的图形化工具SQuirrel
  6. 微信域名屏蔽检测方法 微信域名检测接口的机制
  7. 如果你昨天刚离职却忘了退公司的群,转天一早领导找你让你尽快退群,你会做何感想呢?
  8. Bug:Google Analytics例子未使用example.com
  9. node.js的C++入门
  10. 介绍一些预言性质的梦
  11. 关于Qt的dateTime和时间戳转化数据不对的问题
  12. 学python需要c-为什么我建议每个开发人员都需要学 Python ?
  13. matlab——knnsearch用法介绍
  14. 英文翻译软件哪个好?不能错过的有这几个。
  15. eclipse 装阿里规范模板
  16. correl函数相关系数大小意义_EXCEL中的相关系数能说明什么?
  17. PCIE配置空间设置
  18. 采购要管好供应商,这几个坑勿踩
  19. 【思维导图】canny滤波 原理步骤细致剖析
  20. 赶集网–免费发布信息

热门文章

  1. 通过docker无法访问到tomcat报页面404
  2. html设置一个随机数的抽奖,随机数的运用---抽奖
  3. python用outlook自动发邮件_python使用两种发邮件的方式smtp和outlook示例
  4. 单片机全局有必要封装_C语言开发单片机为什么大多数都采用全局变量的形式?...
  5. java 保留字符串,如何在Java中保留字符串而不使用反转功能
  6. python常见的异常类有哪些_Python常见异常类型
  7. 使用计算机画画需要什么软件,专业电脑绘画用的是什么工具?
  8. html怎么播放下一首,javascript – HTML5音频播放列表 – 第一个结束后如何播放第二个音频文件?...
  9. 1113: 递归调用的次数统计(函数专题)
  10. 操作系统原理:进程 PV 操作如何计算?全网最全三种前驱图计算类型总结