机器学习-40-GAN-07-Feature Extraction(InfoGAN,VAE-GAN,BiGAN,Feature Disentangle(Voice Conversion))
文章目录
- Feature Extraction
- InfoGAN
- 问题引出
- What is InfoGAN?
- 结果
- VAE-GAN
- VAE-GAN
- Algorithm
- BiGAN
- BiGAN
- Algorithm
- BiGAN架构设计解析
- Triple GAN
- Domain-adversarial training
- Voice Conversion(声音转换)
- Feature Disentangle(特征解耦)
Feature Extraction
本节主要介绍InfoGAN,VAE-GAN,BiGAN和Triple GAN,可以用于做feature extraction。还介绍了Domain-adversarial training,Voice Conversion(声音转换)以及Feature Disentangle(特征解耦)。
InfoGAN
问题引出
我们知道最基本的GAN就是输入一个随机的向量,输出一个图片。以手写数字为例,我们希望修改随机向量的某一维,能改变数字的特想,比如角度,粗细,数字等,但是实际上貌似没什么大的影响。下图就是个例子,每一行的每一列都是改变了某一个维度,然后得到的结果,貌似看不到某一维度的具体含义,比如我们并不知道为什么第三行第六列为什么会突然多一个小尾巴。如下图:
我们可能直观的会认为每个维度应该就是一个特征,分布可能是这样的:
不同颜色代表不同特征的分布,在蓝色块中的vector作为input的时候,我们希望会输出蓝色的特征;在绿色块中的vector作为input的时候,我们希望会输出绿色的特征。这里我们假设input的vector只有两维(x,y),我们期待某种特征的分布是有规律性的,当我们改变某一维度,我们希望它对应的某种特征会发生改变,比如图中的y的值,我们希望改变y的值,它output的特征会从蓝色变为绿色或者是其它颜色。
如果真这样话就方便了,但是实际上或许是这样的分布:
很蛋疼的分布,很难区分不同维度表示的特征。我们如果像上面一样单纯的改变某一个维度,它output的特征可能并不能达到我们想要的效果!
那怎么用他变成我们想象中的分布呢,可以使用InfoGAN。
What is InfoGAN?
下面是InfoGAN的架构:
上面与就是传统的GAN,差别是输入z可以视为两部分组成:c和z′c和z'c和z′
这里可以把Generator看做是encoder,分类器Classifier看做是decoder,两个组成一个“autoencoder”,这里的autoencoder是带引号的,因为原来我们学过的autoencoder是将图片经过encoder变成编码,然后再把编码经过decoder变回图片。这里是将编码经过encoder变成图片,然后再把图片经过decoder变回编码。
当然,模型中还要有Discriminator,不然就不叫GAN了。
如果没有Discriminator,Generator为了让Classifer辨识出c ,直接就可以把c 贴到x中,这样根本就没有训练到。所以加上Discriminator可以让输出的图片像真实图片。
在实作上由于Classifier和Discriminator都是吃同样的参数,除了最后一层不同
。所以,它们两个通常会share参数,只不过一个输出的是code,一个是scalar。
那么为什么加了Classifier可以work?为什么可以解决input features不明确的问题?
因为只有在训练Generator的过程中,学习到了c影响x的关系,Classifier才能正确的从x中分辨出c来。
在图中我们看到还有一个z′z'z′,这个东西代表一些随机的东西,就是我们也不知道这些东西影响输出的那些方面。
这里的c不是预先划分好的,而是应为我们设置了c,才训练出c影响了那些特征。这种思路就使得c与x的某些特征有了对应关系,并不是c本身就指定了x的某些特征,而是这种架构的设计,使得c与x的某些特征存在了关系。
结果
机器学习-40-GAN-07-Feature Extraction(InfoGAN,VAE-GAN,BiGAN,Feature Disentangle(Voice Conversion))相关推荐
- 【李宏毅2020 ML/DL】P80 Generative Adversarial Network | Feature Extraction
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 这是我的李宏毅老师 GAN 系列第7篇笔记,GAN 系列: 1:Basic Idea 2:Conditiona ...
- GaitGAN: Invariant Gait Feature Extraction Using Generative Adversarial Networks论文翻译以及理解
GaitGAN: Invariant Gait Feature Extraction Using Generative Adversarial Networks论文翻译以及理解 格式:一段英文,一段中 ...
- 翻译:An Introduction to Feature Extraction 特征提取导论。(如有不当欢迎评论区留言指正)
作者:Isabelle Guyon1 and Andr´e Elisseeff2 这一章向读者介绍了本书3中涵盖的特征提取( Feature Extraction)的各个方面.第1节 综述了定义和符号 ...
- 花书+吴恩达深度学习(二八)深度生成模型之有向生成网络(VAE, GAN, 自回归网络)
文章目录 0. 前言 1. sigmoid 信念网络 2. 生成器网络 3. 变分自编码器 VAE 4. 生成式对抗网络 GAN 5. 生成矩匹配网络 6. 自回归网络 6.1 线性自回归网络 6.2 ...
- Time Series FeatuRe Extraction on basis of Scalable Hypothesis tests (tsfresh –A Python package)
[目的]简单记录文献阅读过程,学习 tsfresh 库的相关SCI文章,希望可以减轻相关兴趣者的阅读与学习时间. [注意]翻译过程更多的为机器翻译和直译,有错误之处敬请斧正. Abstract: Ti ...
- A Survey of Shape Feature Extraction Techniques中文翻译
Yang, Mingqiang, Kidiyo Kpalma, and Joseph Ronsin. "A survey of shape feature extraction techni ...
- 一种基于协作表示的特征提取投影方法(A collaborative representation based projections method for feature extraction)
1.CRP简介 文章全称为"A collaborative representation based projections method for feature extraction&qu ...
- 论文笔记 ISCC 2019|BGP Dataset Generation and Feature Extraction for Anomaly Detection
文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 特征提取 3.2 数据集生成 3.3 流量行为趋势分析 3.3.1 Anomaly and regular traffi ...
- GAN(Generative Adversarial Network,GAN)模型之:InfoGAN、WGAN、DCGAN模型
GAN(Generative Adversarial Network,GAN)模型之:InfoGAN.WGAN.DCGAN模型 InfoGAN 为了解决定制化生成的问题,提出了InfoGAN模型.In ...
最新文章
- 【OpenCV 4开发详解】轮廓外接多边形
- 细嚼慢咽读论文:PointNet论文及代码详细解析
- 解决启动不了VMware虚拟机以及VM升级到新的版本后出现黑屏的问题
- VS2017离线包下载
- 字符编码的前世今生--转
- python numpy ones.like()(返回形状与类型与给定数组相同的数组)
- base64编码 springboot_Spring Boot 中如何实现 HTTP 认证?
- Winform中使用代码编写Button按钮的点击事件
- 数据库开发基本操作-SQL Server数据库基础知识
- php面向对象的概括图解,简单介绍PHP面向对象
- 盘点中国互联网行业10年2万多起投融资,17年投融资形势走向何处
- 使用加密工具类进行有效的字符串加密——CSDN博客
- 【转】1.3异步编程:线程同步基元对象
- 关于z-index的一些问题
- 测试工程师值得被尊重!是否有此共鸣!
- 中国矿业大学本科毕业设计Latex模板cumtthesis
- 龙卷风路径_龙卷风的目录
- r语言平均值显著性检验_5.3 两总体均值检验和方差分析的R语言操作(26页)-原创力文档...
- 三电极体系电化学传感器
- 把安卓手机屏幕投射到电脑上
热门文章
- 百度翻译post爬虫案例
- Arduino IDE下的stm32环境搭建、OLED液晶显示(U8g2lib库)、NUCLEO-F411测试、STM32F103C8T6在Arduino下的液晶显示、
- 软件开发生命周期中的设计阶段_软件的生命周期——测试人员必须了解的事
- Unable to load Maven meta-data from xxx com/github/chrisbanes/photoview/
- JAVA反射----->看这篇就够了
- 哪怕四处碰壁也要贯彻正道
- java面向对象-抽象类和接口
- geogebra与matlab,浅谈Geogebra在大学数学教学中的应用
- dbms_lob 方法总结
- Intellij IDEA 查看所有断点