1. 简介

在本教程[1]中,我们将讨论深度学习中的潜在空间。首先,我们将定义这个术语并讨论它对深度学习的重要性,然后我们将展示一些潜在空间的例子。

2. 定义

形式上,潜在空间被定义为抽象的多维空间,它编码外部观察事件的有意义的内部表示。在外部世界中相似的样本在潜在空间中彼此靠近。

为了更好地理解这个概念,让我们考虑一下人类如何感知世界。通过将每个观察到的事件编码为我们大脑中的压缩表示,我们能够理解广泛的主题。

例如,我们不会记住狗的每一个外观细节,以便能够在街上认出一只狗。正如我们在下图中所看到的,我们保留了狗的一般外观的内部表示:


以类似的方式,潜在空间试图通过空间表示向计算机提供对世界的压缩理解。

3. 深度学习的重要性

深度学习已经彻底改变了我们生活的许多方面,其应用范围从自动驾驶汽车到预测严重疾病。它的主要目标是将原始数据(例如图像的像素值)转换为合适的内部表示或特征向量,学习子系统(通常是分类器)可以从中检测或分类输入中的模式。因此,我们意识到深度学习和潜在空间是密切相关的概念,因为前者的内部表示构成了后者。

正如我们在下面看到的,深度学习模型将输入原始数据并输出位于称为潜在空间的低维空间中的判别特征。然后使用这些特征来解决各种任务,如分类、回归或重建:


为了更好地理解潜在空间在深度学习中的重要性,我们应该思考以下问题:为什么我们必须在分类、回归或重建之前在低维潜在空间中对原始数据进行编码?

答案是数据压缩。具体来说,在我们的输入数据是高维的情况下,不可能直接从原始数据中学习重要信息。

例如,在图像分类任务中,输入维度可能与输入像素相对应。系统似乎不可能通过查看如此多的值来学习有用的分类模式。解决方案是使用深度神经网络将高维输入空间编码为低维潜在空间。

4. 实例

现在,让我们讨论深度学习中的一些例子,其中潜在空间的存在对于捕获任务复杂性和实现高性能是必要的。

4.1. 图像特征空间

正如我们之前提到的,潜在空间是每个卷积神经网络不可或缺的一部分,它以图像的原始像素作为输入,并在最后一层对潜在空间中的一些高级特征进行编码。

这个潜在空间使模型能够使用低维判别特征而不是高维原始像素来执行任务(例如,分类)。在下图中,我们可以看到 CNN 的一般架构:


训练后,模型的最后一层捕获了图像分类任务所需的重要输入模式。在潜在空间中,描绘同一对象的图像具有非常接近的表示。通常,潜在空间中向量的距离对应于原始图像的语义相似性。

下面,我们可以看到动物分类模型的潜在空间是怎样的。绿色点对应于从模型的最后一层提取的每个图像的潜在向量。我们观察到相同动物的向量更接近潜在空间。因此,模型更容易使用这些特征向量而不是原始像素值对输入图像进行分类:


4.2. 词嵌入空间

在自然语言处理中,词嵌入是词的数字表示,因此相似的词具有接近的表示。因此,词嵌入位于一个潜在空间中,每个词都被编码成一个低维语义向量。

有许多学习词嵌入的算法,如 Word2Vec 或 GloVe。在下图中,我们可以看到潜在空间中词嵌入的拓扑图:


正如预期的那样,语义相似的词,如“toilet”和“bathroom”,在潜在空间中有紧密的词嵌入。

4.3. GANs

在之前的教程中,我们已经讨论了很多关于 GAN 及其应用的内容。简而言之,GAN 将来自某些先验分布和输出的随机向量作为输入和图像。该模型的目标是学习生成真实数据集的底层分布。例如,如果我们的数据集包含带椅子的图像,则 GAN 模型会学习生成带椅子的合成图像。

GAN 的输入充当潜在向量,因为它将输出图像编码为低维向量。为了验证这一点,我们可以看到插值在潜在空间中是如何工作的,因为我们可以通过线性修改潜在向量来处理图像的特定属性。

在下图中,我们可以看到如何通过改变生成人脸的 GAN 的潜在向量来处理人脸的姿势:


5. 总结

在本教程中,我们介绍了深度学习中的潜在空间。首先,我们讨论了该术语的定义及其与深度学习的密切关系,然后我们提供了一些说明性示例。

参考资料

[1]

Source: https://www.baeldung.com/cs/dl-latent-space

本文由 mdnice 多平台发布

深度学习中的潜在空间相关推荐

  1. 深度学习中的优化简介

    深度学习算法在许多情况下都涉及到优化. 1. 学习和纯优化有什么不同 在大多数机器学习问题中,我们关注某些性能度量P,其定义于测试集上并且可能是不可解的.因此,我们只是间接地优化P.我们系统通过降低代 ...

  2. nfa确定化 dfa最小化_深度学习中的优化:梯度下降,确定全局最优值或与之接近的局部最优值...

    深度学习中的优化是一项极度复杂的任务,本文是一份基础指南,旨在从数学的角度深入解读优化器. 一般而言,神经网络的整体性能取决于几个因素.通常最受关注的是网络架构,但这只是众多重要元素之一.还有一个常常 ...

  3. 总结 62 种在深度学习中的数据增强方式

    数据增强 数据增强通常是依赖从现有数据生成新的数据样本来人为地增加数据量的过程 这包括对数据进行不同方向的扰动处理 或使用深度学习模型在原始数据的潜在空间(latent space)中生成新数据点从而 ...

  4. (Latent Space)理解机器学习中的潜在空间

    原文链接:https://zhuanlan.zhihu.com/p/369946876 搬运自 https://towardsdatascience.com/understanding-latent- ...

  5. 深度学习中的生成对抗网络GAN

    转载:一文看尽深度学习中的生成对抗网络 | CVHub带你看一看GANs架构发展的8年 (qq.com) 导读 生成对抗网络 (Generative Adversarial Networks, GAN ...

  6. 一文看尽深度学习中的各种注意力机制(1998-2020年)

    导读 视觉注意力机制是人类视觉所特有的一种大脑信号处理机制,而深度学习中的注意力机制正是借鉴了人类视觉的注意力思维方式.一般来说,人类在观察外界环境时会迅速的扫描全景,然后根据大脑信号的处理快速的锁定 ...

  7. 深度学习中7种最优化算法的可视化与理解

    作者丨小小鱼@知乎 来源丨https://zhuanlan.zhihu.com/p/41799394 本文旨在优化一维函数,实际上模型参数有数百万维以上,差距很大,因此本文最好作为辅助法的理解,而非对 ...

  8. 一文读懂深度学习中的各种卷积

    来源|机器之心 我们都知道卷积的重要性,但你知道深度学习领域的卷积究竟是什么,又有多少种类吗?研究学者 Kunlun Bai 发布了一篇介绍深度学习的卷积文章,用浅显易懂的方式介绍了深度学习领域的各种 ...

  9. 卷积有多少种?一文读懂深度学习中的各种卷积

    点击上方"视学算法",选择"星标"公众号 精选作品,第一时间送达 本文选自towardsdatascience 作者:Kunlun Bai 公众号机器之心整理 ...

最新文章

  1. 什么是Linux的原生GUI API?
  2. 点云分割 PointCloudSegmentation测试笔记
  3. IP地址修改后ORACLE不能使用问题
  4. Cocos2d-x 截屏功能集成
  5. 《中国人工智能学会通讯》——11.65 双重代价敏感的属性分类模型
  6. [LeetCode] Binary Tree Level Order Traversal 二叉树层次遍历(DFS | BFS)
  7. firefox+android+平板,Firefox OS首款平板现身,“三头并进”追赶Android
  8. mysql select count 5万条数据很慢_mysql亿级数据数据库优化方案测试银行交易流水记录的查询...
  9. 3d打印光固化好还是热固化好_UV专利一览(71) —天啦噜!3D打印上太空!
  10. 为什么我认为现阶段HIDS处于攻防不对等的地位?(ids、nta、绕过)
  11. mysql 长度为1 的空字符串_MYSQL,如果定义了一个字符串的字段,长度为255,那么当我添加一个空字符串数据时占用空间吗?...
  12. 异常处理第一讲(SEH),筛选器异常,以及__asm的扩展,寄存器注入简介
  13. 【Linux】Linux设备驱动开发详解:基于最新的Linux 4.0内核
  14. 《刻意练习》学习总结
  15. 方寸间见万物灵机:我们在世界人工智能大会听到了哪些华为AI故事?
  16. 【3dmax千千问】初学3dmax插件神器第23课:3dmax自学渲染进阶提升教程|疯狂模渲大师排除了特殊的材质后,室内设计师还要去除VRAY的光线追踪,再设计3dmax效果图!
  17. 工业锅炉计算机控制系统框图,锅炉控制(汇总).ppt
  18. webim【LayIM】开发者文档
  19. Venmo、Bakkt、MoneyGram、Uphold的前高管加入Roxe全球支付网络
  20. 51系列单片机IO模试设置

热门文章

  1. 北京尚学堂视频系列(Oracle)
  2. python14基础末异常文件
  3. Zabbix监控实战-Tomcat监控
  4. 拥抱区块链和金融科技,开启新金融时代
  5. javascript面向对象的基本包装类型
  6. DevMind:构建效能提升的“导航仪”和“发动机”,实现从数据到价值的跃迁
  7. CAPL内置的时间函数
  8. windows下ios证书申请流程(在线傻瓜式)
  9. k3s单机环境搭建(飞腾+麒麟)
  10. C语言为什么经久不衰?最全入门笔记