理解生成对抗网络的关键在于理解GAN的损失函数

JS散度

GAN实际是通过对先验分布施加一个运算G, 来拟合一个新的分布

如果从传统的判别式网络的思路出发,只要选定合适的loss,就可以使生成分布和真实分布之间的距离尽可能逼近

KL散度经常用来衡量分布之间距离

但KL散度是不对称的。不对称意味着,对于同一个距离,观察方式不同,获取的loss也不同,那么整体loss下降的方向就会趋向于某个特定方向。这在GAN中非常容易造成模式崩塌,即生成数据的多样性不足

JS散度在KL散度的基础上进行了修正,保证了距离的对称性:

实际上,无论KL散度还是JS散度,在直接用作loss时,都是难以训练的:由于分布只能通过取样计算,这个loss在每次迭代时都几乎为零

GAN loss的推导

GAN的训练方法,能够巧妙的解决这个问题:

先训练D,再训练G,二者相互对抗,直到收敛

在原始的GAN中,提出的loss是:

当G固定且运算可逆时(实际上这一点一般不成立,但不影响了解GAN的思想):

</

gan网络损失函数_GAN的损失函数相关推荐

  1. 换个角度看GAN:另一种损失函数

    转载自:机器之心 选自Medium 作者:Phúc Lê 机器之心编译 参与:张玺 「本质上,GAN 就是另一种.」 Jeremy Howardf 老师曾在(GAN)课程中说过:「--本质上,GAN ...

  2. Nat. Commun. | 条件GAN网络和基因表达特征用于类苗头化合物的发现

    今天给大家介绍的是拜耳作物科学公司.拜耳公司机器学习研发部和遗传毒理学部于2020年1月联合发表在Nature Communications上的一篇论文,这篇文章通过一种生成模型进行分子的从头设计以及 ...

  3. 『TensorFlow』通过代码理解gan网络_中

    『cs231n』通过代码理解gan网络&tensorflow共享变量机制_上 上篇是一个尝试生成minist手写体数据的简单GAN网络,之前有介绍过,图片维度是28*28*1,生成器的上采样使 ...

  4. 简记GAN网络的loss

    <简记GAN loss的理解>   GAN 是一种思想,刚接触的时候极为震撼,后来通过GAN思想也做过模型的优化,写过一篇专利.最近在用 GAN 生成数据,顺手写一写对GAN loss的理 ...

  5. GAN网络的模型坍塌和不稳定的分析

    众所周知,GAN异常强大,同时也非常难以训练.主要有以下亮点原因: 模型坍塌(mode collapse) 难以收敛和训练不稳定(convergence and instability) GAN网络的 ...

  6. GAN网络概述及LOSS函数详解

    Generative Adversarial Nets 上周周报已经写了这篇论文,本周相对GAN网络的LOSS进行进一步的学习和研究. GAN网络: 条件:G依照真实图像生成大量的类似图像,D是辨别输 ...

  7. GAN网络生成手写体数字图片

    Keras真香,以前都是用tensorflow来写神经网络,自从用了keras,发现这个Keras也蛮方便的. 目前感觉keras的优点就是方便搭建基于标准网络组件的神经网络,这里的网络组件包括全连接 ...

  8. 图像对抗生成网络 GAN学习01:从头搭建最简单的GAN网络,利用神经网络生成手写体数字数据(tensorflow)

    图像对抗生成网络 GAN学习01:从头搭建最简单的GAN网络,利用神经网络生成手写体数字数据(tensorflow) 文章目录 图像对抗生成网络 GAN学习01:从头搭建最简单的GAN网络,利用神经网 ...

  9. GAN网络图像翻译机:图像复原、模糊变清晰、素描变彩图

    贴个文章,记录学习历程 http://www.sohu.com/a/169212360_473283 本文介绍深度学习方法在图像翻译领域的应用,通过实现一个编码解码"图像翻译机"进 ...

最新文章

  1. tomcat配置文件server.xml具体解释
  2. python在审计中的应用-基于python的自动化代码审计
  3. 网络:HTTP的请求方法
  4. [转]win7-64位系统添加access的ODBC数据源 看不到其它数据源的问题
  5. 基于SSM的培训机构管理系统
  6. mysql 6位随机数_MySQL生成固定位数的随机数
  7. (传播智客)刘意Java基础班精华版
  8. linux 最新cpu型号,linux如何查看cpu型号
  9. 苹果 CEO 库克“喜当爹”,女子为其孕育双胞胎,索赔31.6亿分手费!
  10. [转帖]ABAQUS学习和开发浅谈 [原创]
  11. 常见的几种视频和音频格式
  12. Product Quantization for Nearest Neighbor Search论文实验
  13. 声纹识别中pooling总结
  14. 泪目!这篇博士论文致谢走红:感谢博一与我结婚的妻子
  15. 微信小程序多次跳转后不能点_微信小程序运营需要先知道它的规则
  16. EM算法估计GMM (二维高斯混合模型)参数 python 2.7(西瓜书版)
  17. 数据结构与算法书籍推荐(7本)
  18. 杭州卫星地图 百度卫星地图(含道路、标签信息叠加)
  19. 移动端Web页面问题解决方案
  20. bookshelf.js笔记

热门文章

  1. 【微信小程序】自定义日志打印
  2. architecture
  3. 下列c语言常量中不正确的是,以下C语言常量不正确的是____。
  4. Decentralized Federated Learning Preserves Model and Data Privacy
  5. 2022全国新高考1卷圆锥曲线答案
  6. png格式图片背景不透明问题解决
  7. 程序员制作网站告白女朋友
  8. 输入与输出后验与先验——学而不思则罔,思而不学则殆
  9. 民营医院员工职业素养培训心得体会
  10. 浙江大学 计算机学院 秦青青,军训倒计时 | 说给辅导员听的“悄悄话”