我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的、自己不知道的东西。

这是我的李宏毅老师 GAN 系列第7篇笔记,GAN 系列:

  • 1:Basic Idea
  • 2:Conditional GAN
  • 3:Unsupervised Conditional Generation
  • 4:Theory behind GAN
  • 5:fGAN: General Framework of GAN
  • 6:Tips for improving GAN

本节内容综述

  1. InfoGAN:我们本来期待,我们输入的向量空间,与GAN的特征是空间上对应的。但实际上可能向量空间很杂乱。因此引出 InfoGAN 。
  2. 另外,介绍了 VAE-GAN 。
  3. 此外,介绍了 BiGAN 。简单讲了一下 Triple GAN 。
  4. 简单讲了 Domain-adversarial training ,可以用于 Feature Disentangle 。

文章目录

  • 本节内容综述
  • 小细节
    • InfoGAN
      • What is InfoGAN?
    • VAE-GAN
      • Algorithm
    • BiGAN
      • Algorithm
      • 为何有效
      • Triple GAN
    • Domain-adversarial training
      • Feature Disentangle

小细节

InfoGAN


如上,我们本来期待,我们输入的向量空间,与GAN的特征是空间上对应的。但实际上可能向量空间很杂乱。

What is InfoGAN?


如上,我们把输入向量分为ccc与z′z'z′两部分。我们对 G 的生成加一个分类器,让其分析出生成图片对应的输入 c 向量是什么。

此外,我们设置了 Discriminator ,防止生成器把 c 的特征原封不动地保留在了 x 中。Classifier 与 Discriminator 是共享参数的。

我们希望 c 对 x 有清晰、明确的影响。Classifier 起到的作用就是,让 c 成为在 x 中明显的特征。

如上,原文的效果不错。

VAE-GAN


如上,VAE生成的东西可能会比较模糊,GAN可以弥补这个缺陷,同时VAE可以让Generator学习起来容易一些。

Algorithm


其算法如上。上面倒数第 7 行应该改为 x^i=De(zi)\hat{x}^i = De(z^i)x^i=De(zi)。此外,如上,还有一种 Discriminator 进行三分类。

BiGAN


如上,En与De是分开的,如何学En与De呢?

再加一个 Discriminator ,分辨是来自于 En 的,还是来自于 De 的。

Algorithm


其算法如上。

为何有效


如上,我们可以把 En 与 De 生成的数据对应于分布 P 与 Q 。我们的 Discriminator 就是起到了衡量二者区别的作用。我们在训练时,P与Q会越来越接近。

但是,为什么要用GAN呢?

如上,左侧使用两个反向的 En-De ,每个都正确让端的输出等于段的输入,也可起到同样效果。但是,在训练中,我们很那收敛到最优解。而GAN在这种情况下,更加占优。

Triple GAN

如上,Triple GAN 可视为 cGAN 加上 Classifier 。Triple GAN 主要是为了训练一个 Classifier ,可以理解为一个半监督学习的分类方法,用于少量标签的数据。

Domain-adversarial training


如上,训练集与测试集在不同的domains,我们希望其生成的 feature 在相同的分布中。

其做法如上。这么一个大网络,可以同时训练各部分(可能调不稳),也可以分部分训练。

Feature Disentangle


如上,可以进行声纹比对等等应用。

那么,如何从 input 中提取 Phonetic 与 Speaker 的特征呢?


可以分别训练 Speaker En 与 Phonetic En 。如上是训练 Speaker En 的思路。

但是 Phonetic En 训练时,该如何设置训练目标呢?

如上,收到 domain adversarial training 的启发,我们设置一个 Speaker 分类器,这样 Phonetic Encoder 就会想办法骗过 Speaker Classifier ,从而去掉其本身的 Speaker 特性

【李宏毅2020 ML/DL】P80 Generative Adversarial Network | Feature Extraction相关推荐

  1. 【李宏毅2020 ML/DL】P1 introduction

    [李宏毅2020 ML/DL]P1 introduction 本节主要介绍了 DL 的15个作业 英文大意 Regression: 回归分析 Classification: 分类 RNN: 循环神经网 ...

  2. 【李宏毅2020 ML/DL】P86-87 More about Domain Adaptation

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 本节内容综述 本节课由助教 Chao Brian 讲解. 首先讲解些领域适配的基础内容,包括名词.定义等. 接 ...

  3. 【李宏毅2020 ML/DL】P59 Unsupervised Learning - Auto-encoder

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...

  4. 【李宏毅2020 ML/DL】P14 Tips for training DNN | 激活函数、Maxout、正则、剪枝 Dropout

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐): https://github.com/Sakura-gh/ML-not ...

  5. 【李宏毅2020 ML/DL】P58 Unsupervised Learning - Neighbor Embedding | LLE, t-SNE

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...

  6. 【李宏毅2020 ML/DL】P15 Why Deep-

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐): https://github.com/Sakura-gh/ML-not ...

  7. 李宏毅svm_李宏毅2020 ML/DL补充Structured Learning Structured SVM

    李宏毅2020 ML/DL补充Structured Learning Structured SVM [李宏毅2020 ML/DL]补充:Structured Learning: Structured ...

  8. 【李宏毅2020 ML/DL】P60-61 Unsupervised Learning - Deep Generative Model

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...

  9. 【李宏毅2020 ML/DL】P83 Generative Adversarial Network | Evaluation

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 这是我的李宏毅老师 GAN 系列第10篇笔记,GAN 系列: 1:Basic Idea 2:Condition ...

最新文章

  1. 使用vb6绿色版做一个简易图片浏览器
  2. 从玉农业智能蔬菜技术 农业大健康·林裕豪:中国金控斥资打造
  3. 【CV】使用 scikit-image 进行图像处理
  4. Linux 基础——权限管理命令chmod
  5. 遥感图像增强方法应用
  6. Oracle入门(五D)之如何设置show parameter显示隐含参数
  7. 呼叫我,或异步REST
  8. Linux系统常用函数,浅谈linux下的一些常用函数的总结(必看篇)
  9. 【代码备份】ORACLE数据库表同步DBLINK
  10. linux快速mysql5.7_Linux下安装MySQL 5.7
  11. Hdu 1794 【二维成段更新】.cpp
  12. 如何使用Java开发QQ机器人 方法一
  13. 【MATLAB信号处理】信号波形的产生及系统时域分析
  14. jar命令 解压/压缩 war、jar文件
  15. 用 C 语言来刷 LeetCode,网友直呼:那是真的牛批...
  16. 小米4 miui专用 Xposed安装器86版
  17. 笔记本html外接显示器,笔记本怎么外接显示器 笔记本用外接显示器设置教程
  18. 今天吃什么 随机选择(抽奖,抽人适用)纯html、css静态页面
  19. 马尔代夫的华为“新4军”
  20. 从浪潮之巅到千里之行,区块链能否实现赢家通吃?

热门文章

  1. java中自定义异常类
  2. 处理quartz 异常 Couldn‘t retrieve trigger: No record found for selection of Trigger with key:
  3. 【IDEA】关于 IDEA 中新建 web 项目的 webapp 文件夹没有小蓝点 ,启动服务,访问不到解决方案
  4. 使用pip将Python软件包从本地文件系统文件夹安装到virtualenv
  5. HTML5 Canvas vs. SVG vs. div
  6. 用户输入和命令行参数
  7. Win10系统如何设置开机启动密码
  8. Spring的junit4测试集成
  9. android 面向对象 5,C++基础学习笔记(5)---面向对象(测试题)
  10. anaconda安装numpy_Windows安装cpu版pytorch和tensorflow