我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的、自己不知道的东西。

这是我的李宏毅老师 GAN 系列第2篇笔记,GAN 系列:

  • 1:Basic Idea

本节内容综述

  1. 本节课讲解 Conditional Generation 。本讲将以 Text-to-Image 为例。
  2. 传统的监督学习似乎可以解决 Text-to-Image 这个问题,但其不能生成没见过的 Text 下的图片。
  3. 讲解 cGAN 的结构。
  4. 详细讲了 Discriminator 的设计。
  5. 将生成过程拆成 2 阶的 Stack GAN 。
  6. Image-to-image 技术,其中,因为输出图片很大,其 Discriminator 经过了特殊的设计 Patch GAN 。
  7. 此外,可以用 cGAN 做 Speech Enhancement (去噪音等功能)。
  8. 此外,也可以做图片生成 Video Generation 。

文章目录

  • 本节内容综述
  • 小细节
    • Conditional GAN
    • Discriminator
    • Stack GAN
    • Image-to-image
      • Patch GAN
    • Speech Enhancement
    • Video Generation

小细节

Conditional GAN


如上,除了输入文字“train”外,还输入一个正态分布的向量。此外,我们的 Discriminator 不仅仅判断真假,而要产生一个 scalar :x是否是真实的,且是否与文字相符

其演算法如上。

Discriminator


如上,推荐使用下面的架构(性能不错)。下面的架构,将“是否为真”且“是否匹配”拆开,这样不会让神经网络“困惑”。


去年同学的作业效果如上。

Stack GAN


如上,两截的 Generator ,先产生小图,再产生大图。

Image-to-image


收集一些数据对(抽象数据,真实图片)。如果用传统的监督学习,则生成图片较为模糊。因为训练时,仅仅是为了让各个像素最为接近。

如上,使用 GAN ,输入一个抽象图片+噪音;同时:

  • 在 Discriminator 进行 Generator 生成图片与抽象图片是否匹配的判断;
  • 此外,希望 Generator 生成的图片接近于真实数据。可以看出,GAN+close 效果较好。

Patch GAN


如上,上文中 Discriminator 经过特殊设计,防止一下检查大图片,导致结果坏掉。

Speech Enhancement


架构与 Image-to-image 很像:

  • G 生成的 output 要尽量接近 clean 的数据;
  • 同时,D 要求 G 的 output 与 noisy 要 match,防止信息变形。

Video Generation


如上,生成的片段与原有片段接在一起,让 D 判断是否片段的最新一帧是生成的。

【李宏毅2020 ML/DL】P75 Generative Adversarial Network | Conditional GAN相关推荐

  1. 2020李宏毅机器学习笔记-Generative Adversarial Network - Conditional GAN

    目录 摘要 1. Text-to-Image 1.1 Traditional supervised approach 1.2 Conditional GAN 1.3 Conditional GAN - ...

  2. 【李宏毅2020 ML/DL】P1 introduction

    [李宏毅2020 ML/DL]P1 introduction 本节主要介绍了 DL 的15个作业 英文大意 Regression: 回归分析 Classification: 分类 RNN: 循环神经网 ...

  3. 【李宏毅2020 ML/DL】P86-87 More about Domain Adaptation

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 本节内容综述 本节课由助教 Chao Brian 讲解. 首先讲解些领域适配的基础内容,包括名词.定义等. 接 ...

  4. 【李宏毅2020 ML/DL】P59 Unsupervised Learning - Auto-encoder

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...

  5. 【李宏毅2020 ML/DL】P14 Tips for training DNN | 激活函数、Maxout、正则、剪枝 Dropout

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐): https://github.com/Sakura-gh/ML-not ...

  6. 【李宏毅2020 ML/DL】P58 Unsupervised Learning - Neighbor Embedding | LLE, t-SNE

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...

  7. 【李宏毅2020 ML/DL】P15 Why Deep-

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐): https://github.com/Sakura-gh/ML-not ...

  8. 李宏毅svm_李宏毅2020 ML/DL补充Structured Learning Structured SVM

    李宏毅2020 ML/DL补充Structured Learning Structured SVM [李宏毅2020 ML/DL]补充:Structured Learning: Structured ...

  9. GAN(Generative Adversarial Network,GAN)模型应用

    GAN(Generative Adversarial Network,GAN)模型人脸应用 目录 GAN(Generative Adversarial Network,GAN)模型人脸应用 人脸重构: ...

最新文章

  1. Ocelot简易教程(一)之Ocelot是什么
  2. 神策数据简宁:如何更好地借助数据驱动产品价值提升?
  3. 算法导论第10章习题
  4. spring Beans初始化及配置
  5. javascript ajax 脚本跨域调用全解析
  6. Ubuntu系统设置截图快捷键
  7. PG in not in系列方案比较
  8. flask文件上传 flask-uploads
  9. Android 传感器概述
  10. [转]二十四式太极拳攻防含义拆解
  11. 绿色发展视域下都柳江流域水族传统生态文化研究
  12. Codeforces——C. Yet Another Walking Robot
  13. 微信订阅号和服务器,微信订阅号与服务号有什么不同?
  14. Shader Forge 入门学习(二) 实现发光、火焰燃烧、溶解、扭曲效果
  15. jmeter 5.5+influxdb 2.0+grafana v9.3.2 - 压测看板setup
  16. 如何在不同节之间设置页码
  17. python脚本一键抓考试资料网答案
  18. java 线程ping pong_面试题。线程pingpong的输出问题
  19. 容器化编排部署mall-swarm
  20. 《MFC编程》:MFC程序的分类

热门文章

  1. 【SQL】结构化查询语言
  2. 解决PRINT函数UTF-8问题
  3. Centos7安装完毕后无法联网的解决方法
  4. 【C语言】利用递归解决猴子吃桃问题
  5. 在Linux中使用cURL进行HTTP POST和GET [复制]
  6. Android Studio升级中的“未找到默认活动”
  7. 绝对位置,但相对于父位置
  8. 如何使用jQuery将事件附加到动态HTML元素? [重复]
  9. 在razor视图引擎中转义@字符
  10. 超级电容怎么才能把内阻做小_内置超级电容汽车熄火仍可工作,韩国AHL车载无线充内藏重器...