【李宏毅2020 ML/DL】P75 Generative Adversarial Network | Conditional GAN
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的、自己不知道的东西。
这是我的李宏毅老师 GAN 系列第2
篇笔记,GAN 系列:
- 1:Basic Idea
本节内容综述
- 本节课讲解 Conditional Generation 。本讲将以 Text-to-Image 为例。
- 传统的监督学习似乎可以解决 Text-to-Image 这个问题,但其不能生成没见过的 Text 下的图片。
- 讲解 cGAN 的结构。
- 详细讲了 Discriminator 的设计。
- 将生成过程拆成 2 阶的 Stack GAN 。
- Image-to-image 技术,其中,因为输出图片很大,其 Discriminator 经过了特殊的设计 Patch GAN 。
- 此外,可以用 cGAN 做 Speech Enhancement (去噪音等功能)。
- 此外,也可以做图片生成 Video Generation 。
文章目录
- 本节内容综述
- 小细节
- Conditional GAN
- Discriminator
- Stack GAN
- Image-to-image
- Patch GAN
- Speech Enhancement
- Video Generation
小细节
Conditional GAN
如上,除了输入文字“train”外,还输入一个正态分布的向量。此外,我们的 Discriminator 不仅仅判断真假,而要产生一个 scalar :x是否是真实的,且是否与文字相符
。
其演算法如上。
Discriminator
如上,推荐使用下面的架构(性能不错)。下面的架构,将“是否为真”且“是否匹配”拆开,这样不会让神经网络“困惑”。
去年同学的作业效果如上。
Stack GAN
如上,两截的 Generator ,先产生小图,再产生大图。
Image-to-image
收集一些数据对(抽象数据,真实图片)
。如果用传统的监督学习,则生成图片较为模糊。因为训练时,仅仅是为了让各个像素最为接近。
如上,使用 GAN ,输入一个抽象图片+噪音;同时:
- 在 Discriminator 进行 Generator 生成图片与抽象图片是否匹配的判断;
- 此外,希望 Generator 生成的图片接近于真实数据。可以看出,GAN+close 效果较好。
Patch GAN
如上,上文中 Discriminator 经过特殊设计,防止一下检查大图片,导致结果坏掉。
Speech Enhancement
架构与 Image-to-image 很像:
- G 生成的 output 要尽量接近 clean 的数据;
- 同时,D 要求 G 的 output 与 noisy 要 match,防止信息变形。
Video Generation
如上,生成的片段与原有片段接在一起,让 D 判断是否片段的最新一帧是生成的。
【李宏毅2020 ML/DL】P75 Generative Adversarial Network | Conditional GAN相关推荐
- 2020李宏毅机器学习笔记-Generative Adversarial Network - Conditional GAN
目录 摘要 1. Text-to-Image 1.1 Traditional supervised approach 1.2 Conditional GAN 1.3 Conditional GAN - ...
- 【李宏毅2020 ML/DL】P1 introduction
[李宏毅2020 ML/DL]P1 introduction 本节主要介绍了 DL 的15个作业 英文大意 Regression: 回归分析 Classification: 分类 RNN: 循环神经网 ...
- 【李宏毅2020 ML/DL】P86-87 More about Domain Adaptation
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 本节内容综述 本节课由助教 Chao Brian 讲解. 首先讲解些领域适配的基础内容,包括名词.定义等. 接 ...
- 【李宏毅2020 ML/DL】P59 Unsupervised Learning - Auto-encoder
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...
- 【李宏毅2020 ML/DL】P14 Tips for training DNN | 激活函数、Maxout、正则、剪枝 Dropout
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐): https://github.com/Sakura-gh/ML-not ...
- 【李宏毅2020 ML/DL】P58 Unsupervised Learning - Neighbor Embedding | LLE, t-SNE
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...
- 【李宏毅2020 ML/DL】P15 Why Deep-
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐): https://github.com/Sakura-gh/ML-not ...
- 李宏毅svm_李宏毅2020 ML/DL补充Structured Learning Structured SVM
李宏毅2020 ML/DL补充Structured Learning Structured SVM [李宏毅2020 ML/DL]补充:Structured Learning: Structured ...
- GAN(Generative Adversarial Network,GAN)模型应用
GAN(Generative Adversarial Network,GAN)模型人脸应用 目录 GAN(Generative Adversarial Network,GAN)模型人脸应用 人脸重构: ...
最新文章
- Ocelot简易教程(一)之Ocelot是什么
- 神策数据简宁:如何更好地借助数据驱动产品价值提升?
- 算法导论第10章习题
- spring Beans初始化及配置
- javascript ajax 脚本跨域调用全解析
- Ubuntu系统设置截图快捷键
- PG in not in系列方案比较
- flask文件上传 flask-uploads
- Android 传感器概述
- [转]二十四式太极拳攻防含义拆解
- 绿色发展视域下都柳江流域水族传统生态文化研究
- Codeforces——C. Yet Another Walking Robot
- 微信订阅号和服务器,微信订阅号与服务号有什么不同?
- Shader Forge 入门学习(二) 实现发光、火焰燃烧、溶解、扭曲效果
- jmeter 5.5+influxdb 2.0+grafana v9.3.2 - 压测看板setup
- 如何在不同节之间设置页码
- python脚本一键抓考试资料网答案
- java 线程ping pong_面试题。线程pingpong的输出问题
- 容器化编排部署mall-swarm
- 《MFC编程》:MFC程序的分类
热门文章
- 【SQL】结构化查询语言
- 解决PRINT函数UTF-8问题
- Centos7安装完毕后无法联网的解决方法
- 【C语言】利用递归解决猴子吃桃问题
- 在Linux中使用cURL进行HTTP POST和GET [复制]
- Android Studio升级中的“未找到默认活动”
- 绝对位置,但相对于父位置
- 如何使用jQuery将事件附加到动态HTML元素? [重复]
- 在razor视图引擎中转义@字符
- 超级电容怎么才能把内阻做小_内置超级电容汽车熄火仍可工作,韩国AHL车载无线充内藏重器...