在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。

在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果。

点击本文底部的「阅读原文」即刻加入社区,查看更多最新论文推荐。

这是 PaperDaily 的第 51 篇文章

本期推荐的论文笔记来自 PaperWeekly 社区用户 @LUOHAO本文提出的模型名为 CycleGAN,作者希望在不借助 paired example 情况下,来实现图片的风格转换。

如果你对本文工作感兴趣,点击底部的阅读原文即可查看原论文。

关于作者:罗浩,浙江大学博士研究生,研究方向为计算机视觉和深度学习,现为旷视科技(Face++)的 research intern。

■ 论文 | Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

■ 链接 | https://www.paperweekly.site/papers/807

■ 源码 | https://junyanz.github.io/CycleGAN/

前言

CycleGAN 是发表于 ICCV17 的一篇 GAN 工作,可以让两个 domain 的图片互相转化。传统的 GAN 是单向生成,而 CycleGAN 是互相生成,网络是个环形,所以命名为 Cycle。

并且 CycleGAN 一个非常实用的地方就是输入的两张图片可以是任意的两张图片,也就是 unpaired。

单向GAN

读者可以按照原论文的顺序理解 CycleGAN,这里我按照自己的思路解读。CycleGAN 本质上是两个镜像对称的 GAN,构成了一个环形网络。其实只要理解了一半的单向 GAN 就等于理解了整个CycleGAN。

上图是一个单向 GAN 的示意图。我们希望能够把 domain A 的图片(命名为 a)转化为 domain B 的图片(命名为图片 b)。

为了实现这个过程,我们需要两个生成器 G_AB 和 G_BA,分别把 domain A 和 domain B 的图片进行互相转换。

图片 A 经过生成器 G_AB 表示为 Fake Image in domain B,用 G_AB(a) 表示。而 G_AB(a) 经过生辰器 G_BA 表示为图片 A 的重建图片,用 G_BA(G_AB(a)) 表示。

最后为了训练这个单向 GAN 需要两个 loss,分别是生成器的重建 loss 和判别器的判别 loss。

判别 loss:判别器 D_B 是用来判断输入的图片是否是真实的 domain B 图片,于是生成的假图片 G_AB(A) 和原始的真图片 B 都会输入到判别器里面,公示挺好理解的,就是一个 0,1 二分类的损失。最后的 loss 表示为:

生成 loss:生成器用来重建图片 a,目的是希望生成的图片 G_BA(G_AB(a)) 和原图 a 尽可能的相似,那么可以很简单的采取 L1 loss 或者 L2 loss。最后生成 loss 就表示为:

以上就是 A→B 单向 GAN 的原理。

CycleGAN

CycleGAN 其实就是一个 A→B 单向 GAN 加上一个 B→A 单向 GAN。两个 GAN 共享两个生成器,然后各自带一个判别器,所以加起来总共有两个判别器和两个生成器。一个单向 GAN 有两个 loss,而 CycleGAN 加起来总共有四个 loss。

CycleGAN 论文的原版原理图和公式如下,其实理解了单向 GAN 那么 CycleGAN 已经很好理解。

X→Y 的判别器损失为,字母换了一下,和上面的单向 GAN 是一样的:

同理,Y→X 的判别器损失为:

而两个生成器的 loss 加起来表示为:

最终网络的所有损失加起来为:

论文里面提到判别器如果是对数损失训练不是很稳定,所以改成的均方误差损失,如下:

下面放一张网友们自制的 CycleGAN 示意图,比论文原版的更加直观。

效果展示

CycleGAN 的效果还是不错的,论文里给出了很多结果图,可以欣赏一下。

本文由 AI 学术社区 PaperWeekly 精选推荐,社区目前已覆盖自然语言处理、计算机视觉、人工智能、机器学习、数据挖掘和信息检索等研究方向,点击「阅读原文」即刻加入社区!

点击以下标题查看相关内容:

  • GAN做图像翻译的一点总结

  • GAN眼中的图像翻译(附神奇歌单)

  • PTGAN:针对行人重识别的生成对抗网络

#榜 单 公 布 #


2017年度最值得读的AI论文 | NLP篇 · 评选结果公布

2017年度最值得读的AI论文 | CV篇 · 评选结果公布


  我是彩蛋 


解锁新功能:热门职位推荐!

PaperWeekly小程序升级啦

今日arXiv√猜你喜欢√热门职位

找全职找实习都不是问题

 解锁方式 

1. 识别下方二维码打开小程序

2. 用PaperWeekly社区账号进行登陆

3. 登陆后即可解锁所有功能

 职位发布 

请添加小助手微信(pwbot01)进行咨询

长按识别二维码,使用小程序

*点击阅读原文即可注册


关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 查看原论文

CycleGAN:图片风格,想换就换 | ICCV 2017论文解读相关推荐

  1. PTAV:实时高精度目标追踪框架 | ICCV 2017论文解读

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  2. ICCV 2019 论文解读 | 基于层次解析的Image Captioning

    ©PaperWeekly 原创 · 作者|蔡文杰 学校|华南理工大学 研究方向|计算机视觉 目前大多数的 image captioning 模型采用的都是 encoder-decoder 的框架.本文 ...

  3. ICCV 2019 论文解读:用图神经网络改善视频的多标签分类

    作者 | 王磊 本文介绍了汽车之家团队在ICCV 2019一篇关于视频理解论文相关的工作.针对视频多标签分类的问题,论文提出了将视频多标签之间相关性特征加入到网络之中,结果证明该方法可以显著的提高视频 ...

  4. 商汤科技20篇论文入选ICCV 2017,披露最新研究主线

    来源自 商汤科技 量子位 出品 | 公众号 QbitAI 本月22-29日,是两年一度的国际计算机视觉大会(ICCV)召开的日子. 于往届ICCV相比,本届 ICCV堪称火爆.据组委会统计,ICCV ...

  5. iccv2020论文汇总_ICCV2019 最佳论文出炉,附1987~2019历届ICCV最佳论文汇总( 提供下载)...

    微信公众号:极市平台 极市小编整理了ICCV 2019( IEEE International Conference on Computer Vision)的全部接收论文,大会目前正在韩国首尔如火如荼 ...

  6. 想知道什么换发型软件好用吗?

    当你在网上冲浪看到屏幕上的小哥哥.小姐姐发型发色很是心动的时候,你会不会想要get同款呢?可当我们去弄了同款发型后有时候会发现并没有自己想象中的那么好看,那么这时要是有换发型的软件便可足不出户且不用动 ...

  7. 十代服务器芯片组,英特尔十代酷睿处理器想用先换主板 AMD锐龙将继续碾压英特尔...

    原标题:英特尔十代酷睿处理器想用先换主板 AMD锐龙将继续碾压英特尔 AMD锐龙3代处理器最近可以说是风头正劲,刚一发布就在综合性能方面各种碾压英特尔的同级别处理器,打的九代酷睿处理器必须降价迎战锐龙 ...

  8. 今天不抠图,Python实现一键换底片!想换什么换什么(附源码)

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 生活中我们会拍很多的证件照,有的要求红底,有的是白底,有的是蓝底,今天不通 ...

  9. Nature出炉「中国博士生图鉴」:过半学生想换领域换导师,40%学生受抑郁、焦虑困扰...

    郭一璞  十三 发自 凹非寺 量子位 报道 | 公众号 QbitAI 只有一半博士生对现状满意,过半博士生想换领域换导师,40%受抑郁焦虑困扰-- 没错,这就是中国博士生现状. Nature在两年一度 ...

最新文章

  1. 编程软件python中的if用法-适合Python初学者的一些编程技巧
  2. 常见的几种异常类型 Exception
  3. [bzoj1934][Shoi2007]Vote 善意的投票
  4. springcloud1.5.9+zipkin链路跟踪配置
  5. Apple开发者账号申请学习方式
  6. 开源圆桌 QA 集锦
  7. gn fast-gn_GN的完整形式是什么?
  8. java shapefile 中文乱码_GeoTools操作Shape格式文件
  9. linux下反汇编命令,Linux命令学习手册-objdump命令
  10. Silverlight 数据绑定(Binding)
  11. Meta Learning | 加了元学习之后,少样本学习竟然可以变得这么简单!
  12. 什么是无线射频识别技术(RFID)
  13. MRI图像处理:VBM原理和步骤
  14. linux远程摄像头,通过Web远程浏览Mini6410上的摄像头
  15. “中国如果有五个丘成桐,数学肯定世界一流”
  16. Android 网络质量 + 下载测速 (facebook/network-connection-class 使用)
  17. 物联网的核心技能是什么?
  18. 思科交换机创建子接口
  19. 内网环境下,RSS新玩法——老树能否发新芽
  20. html表格中加背景图片,关于在HTML表格中插入背景图片图片重复显示的问题

热门文章

  1. 电子书下载:Programming Windows Phone 7 SE2
  2. 三维动画制作的基本流程
  3. Zabbix学习之路(一)之Zabbix安装
  4. 第1章 认识jQuery
  5. Java基础语法十二 泛型程序设计
  6. UT源码_105032014033
  7. bootstrap 模态 modal 小例子【转】
  8. Linux网站服务Apache+php+mysql的安装
  9. JVM调优总结 -Xms -Xmx -Xmn -Xss(转载)
  10. matlab 判断文件有多少行,在Matlab中有没有办法确定文件中的行数,而不是循环遍历每一行?...