版权声明:要转随便转,如果能加上原文的链接就感谢各位了。( ⊙ o ⊙ )    https://blog.csdn.net/Hungryof/article/details/78093174

可以看到,猫变狗,单车变摩托了。效果看上去有点尴尬,但毕竟是初步效果是有了。 
但这篇论文的主要贡献是提出了一个“Contrast distance”。

主要思想
我要从小猫变小狗,变的小狗与真实像狗要像,但是到底像到什么程度呢?输入是猫,那么起码生成的小狗,与真实的小狗的相像程度,要大于与其输入的猫的相像程度吧。其实就是一个triple loss的思想。我们要想生成的是狗,希望生成的狗输入真实狗的那一类,那么这两只狗的距离,肯定要小于生成的狗与输入的猫的距离。因为狗与猫是不同类,他们的距离属于类间距离。所以这种”Contrast distance”就相当于类间距离大于类内距离。

损失
对于G来说就有三个损失,除了最简单的 重建损失,还有GAN损失(用LSGAN来让稳定性高点),最后就是这里的重点 对比损失了。比较简单的就是下面这样写: 
∥fx∼fy′∥>∥fy′∼fy¯∥
‖fx∼fy′‖>‖fy′∼fy¯‖

因为我们要比较的距离不是直接在raw image上进行比较,起码是semantic上的距离吧。所以就用一个DcyDcy来提取语义信息,并在特征上进行约束。为了避免模式塌陷,用f¯yf¯y,即抽取多张真实的狗图,提取特征再取个平均,而不是任意抽一张。 
那么距离的具体定义: 
Q(fy′,fx,fy¯)=−loge−∥fy′−fy¯∥2e−∥fy′−fy¯∥2+e−∥fy′−fx∥2
Q(fy′,fx,fy¯)=−log⁡e−‖fy′−fy¯‖2e−‖fy′−fy¯‖2+e−‖fy′−fx‖2

可以看到,如果∥fy′−fy¯∥2‖fy′−fy¯‖2 比∥fy′−fx∥2‖fy′−fx‖2 小的越多,那么QQ值就越小。所以G就最小化QQ,而DcyDcy就最大QQ就行。

值得注意的是,这里只需要用一个cycle网络就行。原因就是因为加了Q约束。

隐藏层加类别选择的方法

这个还是挺常用的,就是你如果要进行对G加入一定的条件,比如这里是要求让G生成狗,那么你在latent representation中直接加入“one-hot”类型的特征就行。不过如果是在隐藏层特征中加入“标签”,比如这里 1*64的被扩展成 16*16*64。当然不能胡乱扩展,扩展方式是,每个spaital size的点,都有one-hot这么多通道。可以这样理解,对于每个点来说,64个通道,只有一个值是1,其余全部为0。相当于这个点是被赋予了“狗”的标签。扩展的16*16*64, 每次只有一个面(假设是第3个)是1,其余63个面全为0。经过网络训练后,会自动认为第3个通道面为1的话,就专门提取一些有助于变成狗的特征。(以后有更好的解释再补充吧。。)其实这在很多地方都这样弄,比如Generative Adversarial Text to Image Synthesis, 在D的隐藏层也是这样加入类别选择的。
--------------------- 
作者:Hungryof 
来源:CSDN 
原文:https://blog.csdn.net/hungryof/article/details/78093174 
版权声明:本文为博主原创文章,转载请附上博文链接!

mask-conditional contrast-GAN相关推荐

  1. 2017 NIPS之GAN+seg:Generative Semantic Manipulation with Contrasting GAN

    Generative Semantic Manipulation with Contrasting GAN 当前的问题及概述: 如今的GAN网络在图片风格迁移方面有了很大的突破,但是现有的模型只能传递 ...

  2. GAN Guides

    Coding Skill目录下的所有Tutorials.Notes.Guides博客都会不定期迭代更新 文章目录 What's GAN Traditional Function 变分自动编码器(VAE ...

  3. 2018 CVPR GAN 相关论文调研 (自己分了下类,附地址哦)

    2018 CVPR GAN 相关论文调研 风格迁移 1. PairedCycleGAN: Asymmetric Style Transfer for Applying and Removing Mak ...

  4. 2018 CVPR GAN 相关论文调研

    2018 CVPR GAN 相关论文调研 风格迁移 1. PairedCycleGAN: Asymmetric Style Transfer for Applying and Removing Mak ...

  5. 2018 CVPR GAN 相关论文

    https://blog.csdn.net/qq_26499769/article/details/84400294 风格迁移 1. PairedCycleGAN: Asymmetric Style ...

  6. FW-GAN: Flow-navigated Warping GAN for Video Virtual Try-on翻译

    FW-GAN:用于虚拟视频试穿的流指导变换GAN 摘要: 在目前越来越受关注的基于图像的虚拟试衣系统之外,我们进一步开发了基于视频的虚拟试衣系统,它可以精确地精确地将衣服转移到人身上,并且能以任意姿势 ...

  7. 天秀! 了解一下GAN都可以做到这些事情

    点击上方"AI算法与图像处理",选择加"星标"或"置顶" 重磅干货,第一时间送达 转载自:算法猿的成长 原文链接:https://machi ...

  8. CVPR 2018 paper list(论文列表)

    原文链接:http://cvpr2018.thecvf.com/program/main_conference 52 Embodied Question Answering Abhishek Das ...

  9. CVPR 2018 paper ---object detection

    转载:https://blog.csdn.net/qq_34848537/article/details/82968217 参考链接 CVPR 2018 论文解读集锦(9月27日更新) CVPR 20 ...

  10. CVPR 2018 paper

    CVPR 2018 参考链接 CVPR 2018 论文解读集锦(9月27日更新) CVPR 2018 open access Paperlist Embodied Question Answering ...

最新文章

  1. Android开发之ContentProvider结合LoaderManager加载数据(图文源代码分享)
  2. java注释跳转方法,Java自定义注解实现Router跳转
  3. 21、Java Swing JOptionPane:对话框组件
  4. 在已有SQL 2005 Server 群集中添加节点
  5. 二十五、Kaggle | 全球听众最多的50首歌曲
  6. VTK:网格之CellEdges
  7. Convert(varchar(8),Getdate(),108) 什么意思
  8. java判断某个字符串是否是数字
  9. 在一个数组中,如何确定所需元素在数组中的位置.
  10. 客户端和服务器实现全双工通信(基于线程)
  11. Python中字符串的连接
  12. SAP License:对一次性’客户‘的了解
  13. jQuery验证码发送时间秒递减(刷新存储cookie)
  14. 错误: 编码GBK的不可映射字符 - Android Studio 生成javadoc文档时报错
  15. 基于数码相机拍照图像分析的植被覆盖率(FVC)计算软件人品大家自己斟酌
  16. A Game of Thrones(60)
  17. Java学习day02-数据类型和运算符
  18. 机房动环监控系统应用意义
  19. 雅可比行列式和雅可比矩阵
  20. 我,程序员,32岁失业后干啥都赔钱,月薪2万的好日子一去不返

热门文章

  1. idm 爬取网站 跳转路径_儋州网站案例基本流程,电子元件网络推广,浅析
  2. spring boot 项目源码_Spring Boot2 系列教程(三)理解 Spring Boot 项目中的 parent
  3. C# Create Access File
  4. 八年磨一剑,重新定义HBase——HBase 2.0阿里云HBase解读
  5. 11月8日学习内容整理:js的引入方式,变量数据类型,运算符,流程控制,函数...
  6. 为什么我还没 Fix 你的 Issue
  7. MSDN中关于变体数据类型
  8. Java与C++Socket通讯注意
  9. socket模块简单使用
  10. 搭建Windows Server 2008故障转移群集