GAN模型笔记

首先理清楚loss.backward()
只要tensor的属性requires_grad=True,说明这是一个叶子节点,可以对其求导数。
神经网络往往先要进行forward()一次,得到结果,然后由结果backward()反向求各参数的导数,并将结果保存在tensor.grad.data这里,这就是我们求导δlossδw\frac{\delta loss}{\delta w} δwδloss​然后,优化器optimizer.step()这个操作就是更新这些参数,最基本的梯度下降法操作就是w=w−lr∗δlossδww =w-lr*\frac{\delta loss}{\delta w}w=w−lr∗δwδloss​这样就完成一次网络参数的更新。
而为什么每次还要将optimizer.zero_grad()先执行以下,再执行上面操作呢?
这个optimizer.zero_grad()操作是将gard.data清零,因为上一次loss.backward()之后更新完参数,如果不清零,那么现在再次loss.backward(),这个grad.data就会由上次的data和这次的data累加得到,那么在更新参数时,由公式可以看出,就没有意义了。所以要把上次计算的偏导数更新为零,再计算现在的偏导数,从而更新参数。


上面有什么地方理解的不对的,还请各位同学批评指正!下面看GAN模型。


之所以说上面这些,是因为在用pytorch构造GAN模型时,总是要固定某一网络参数,而更新另一网络参数,这是最基本的操作。所以,一定需要了解网络是怎么更新参数的。
GAN模型,由生成器和判别器组成,这是最原始的,现在也有很多变种,这里只讲最原始最经典的GAN模型。
更新时间20190910 19:09 ,今天先到这了

note GAN model相关推荐

  1. 《How to make a pizza: Learning a compositional layer-based GAN model》学习笔记

    简介 提出了一种能反映披萨制作过程的生成模型,基于GAN实现了可组合的模块操作,可以实现对披萨添加/删除特定的配料,甚至可以选择烹饪或者不烹饪输入的披萨.特别地,文章将图层分解问题表述为几个连续的不成 ...

  2. 《Gans in Action》第三章 用GAN生成手写数字

    此为<Gans in Action>(对抗神经网络实战)第三章读书笔记 Chapter 3. Your first GAN: Generating handwritten digits 用 ...

  3. Paper之BigGAN:《Large Scale Gan Training For High Fidelity Natural Image Synthesis》翻译与解读

    Paper之BigGAN:<Large Scale Gan Training For High Fidelity Natural Image Synthesis>翻译与解读 目录 效果 1 ...

  4. 使用GAN 进行异常检测——anoGAN,TODO,待用于安全分析实验

    先说实验成功的代码: git clone https://github.com/tkwoo/anogan-keras.git mkdir weights python main.py --mode t ...

  5. ASP.NET MVC4 传递Model到View

    原文发表在:http://www.star110.com/Note/ReadArticle/60641215331146140043.html 开发环境:.NET MVC4 + EF6.0 模型: 1 ...

  6. plt生成固定的colormap_白话生成对抗网络GAN及代码实现

    本文主要是个简单的笔记,参考资料来自下面三部分 Tutorial_HYLee_GAN Renu Khandelwal 的博客 Jason 的博客 神经网络一览 各种神经网络(全连接前向网络.卷积神经网 ...

  7. SAP CRM Fiori应用My note的技术实现

    (1) 在左边的list里看到的每个entry,在My note odata model里称为note header,右边的每个checkbox后面的entry称为note section. Note ...

  8. gan简介_GAN简介

    gan简介 目录: (TABLE OF CONTENTS:) INTRODUCTION介绍 HISTORY OF GANsGAN的历史 INTUITIVE EXPLANATION OF GANsGAN ...

  9. gan神经网络_神经联觉:当艺术遇见GAN

    gan神经网络 Neural Synesthesia is an AI art project that aims to create new and unique audiovisual exper ...

最新文章

  1. SAP MM MIGO果真不能用于执行By-product的收货?
  2. linux dhclient 与 service network restart
  3. TCL中关于Nets的一些用法?
  4. ALV 简单实现HTML抬头的方法 (介绍 二)
  5. java初学者笔记总结day6
  6. LeetCode 445 分发饼干
  7. (1)定义一个抽象类Weapon,该抽象类有两个抽象方法attack(),move() 这两个方法分别表示武器的攻击方式和移动方式。 (2)定义3个类:Tank,Fl
  8. 【Computer Organization笔记13】指令流水中的结构冲突和数据冲突
  9. opera官方教程 预订二
  10. 觅伊的进化,是陌生人社交的未来吗?
  11. java还原合并单元格_Java 合并/取消合并 Excel 单元格
  12. HDU-1166 敌兵布阵
  13. [大洋] Unity3D架构系列之- FSM有限状态机设计一至四
  14. 深入理解什么是Beta分布
  15. 单点登录(SSO) --UCenter技术实现
  16. 关于随机森林randomforest对结果进行分类的原则的个人理解
  17. python 数列筛选_numpy ndarray 按条件筛选数组,关联筛选的例子
  18. 树莓派安装Ubuntu22.04后使用X86_Linux交叉编译Qt5+opencv4
  19. 香港岭南大学开通CnOpenData试用
  20. Unity3D---快捷键

热门文章

  1. QComboBox选项置灰、不可选择、文本颜色(汉字颜色)
  2. 重装系统后,没有以太网和WLAN怎么办
  3. wps两个段落之间间隔太大,将段落中的行距设为0也没用
  4. android adb命令唤醒屏幕,如何使用adb命令打开和关闭屏幕?
  5. 合天网安实验室CTF-Steg150-一段欢快的曲调
  6. 这是一篇路由器踩坑的文章
  7. Elasticsearch 7.10 之 Indexing pressure
  8. php批量格式化工具下载,源代码格式化工具Co
  9. 当 update 修改数据与原数据相同时会被更新吗?
  10. 流量不清零:还在忽悠广大网民?