原文链接

自动编码器(Auto-Encoder,AE)

自动编码器(Auto-Encoder,AE)自编码器(autoencoder)是神经网络的一种,经过训练后能尝试将输入复制到输出。自编码器内部有一个隐藏层 h,可以产生编码(code)表示输入。该网络可以看作由两部分组成:一个由函数 h = f(x) 表示的编码器和一个生成重构的解码器 r = g(h)。我们不应该将自编码器设计成输入到输出完全相等。这通常需要向自编码器强加一些约束,使它只能近似地复制,并只能复制与训练数据相似的输入。

自动编码机由三层网络组成,其中输入层神经元数量与输出层神经元数量相等,中间层神经元数量少于输入层和输出层。搭建一个自动编码器需要完成下面三样工作:搭建编码器,搭建解码器,设定一个损失函数,用以衡量由于压缩而损失掉的信息(自编码器是有损的)。编码器和解码器一般都是参数化的方程,并关于损失函数可导,典型情况是使用神经网络。编码器和解码器的参数可以通过最小化损失函数而优化。

自动编码机(Auto-encoder)是一个自监督的算法,并不是一个无监督算法,它不需要对训练样本进行标记,其标签产生自输入数据。因此自编码器很容易对指定类的输入训练出一种特定的编码器,而不需要完成任何新工作。自动编码器是数据相关的,只能压缩那些与训练数据类似的数据。比如,使用人脸训练出来的自动编码器在压缩别的图片,比如树木时性能很差,因为它学习到的特征是与人脸相关的。

自动编码器运算过程:原始input(设为x)经过加权(W、b)、映射(Sigmoid)之后得到y,再对y反向加权映射回来成为z。通过反复迭代训练两组(W、b),目的就是使输出信号与输入信号尽量相似。训练结束之后自动编码器可以由两部分组成:

1.输入层和中间层,可以用这个网络来对信号进行压缩

2.中间层和输出层,我们可以将压缩的信号进行还原

降噪自动编码器(Denoising Auto Encoder,DAE)

降噪自动编码器就是在自动编码器的基础之上,为了防止过拟合问题而对输入层的输入数据加入噪音,使学习得到的编码器具有鲁棒性而改进的,是Bengio在08年论文:Extracting and composing robust features with denoising autoencoders提出的。
论文中关于降噪自动编码器的示意图如下,类似于dropout,其中x是原始的输入数据,降噪自动编码器以一定概率(通常使用二项分布)把输入层节点的值置为0,从而得到含有噪音的模型输入xˆ。

这个破损的数据是很有用的,原因有二: 
1.通过与非破损数据训练的对比,破损数据训练出来的Weight噪声比较小。降噪因此得名。原因不难理解,因为擦除的时候不小心把输入噪声给×掉了。 
2.破损数据一定程度上减轻了训练数据与测试数据的代沟。由于数据的部分被×掉了,因而这破损数据一定程度上比较接近测试数据。训练、测试肯定有同有异,当然我们要求同舍异。

堆叠降噪自动编码器(Stacked Denoising Auto Encoder,SDAE)

SDAE的思想就是将多个DAE堆叠在一起形成一个深度的架构。只有在训练的时候才会对输入进行腐蚀(加噪),训练完成就不需要在进行腐蚀。结构如下图所示:

逐层贪婪训练:每层自编码层都单独进行非监督训练,以最小化输入(输入为前一层的隐层输出)与重构结果之间的误差为训练目标。前K层训练好了,就可以训练K+1层,因为已经前向传播求出K层的输出,再用K层的输出当作K+1的输入训练K+1层。

一旦SDAE训练完成, 其高层的特征就可以用做传统的监督算法的输入。当然,也可以在最顶层添加一层logistic regression layer(softmax层),然后使用带label的数据来进一步对网络进行微调(fine-tuning),即用样本进行有监督训练。

  1. 预测阶段:根据状态转移方程,每一个粒子得到一个预测粒子;

  2. 校正阶段:对预测粒子进行评价,越接近于真实状态的粒子,其权重越大;

  3. 重采样:根据粒子权重对粒子进行筛选,筛选过程中,既要大量保留权重大的粒子,又要有一小部分权重小的粒子;

  4. 滤波:将重采样后的粒子带入状态转移方程得到新的预测粒子,即步骤2。

学习更多编程知识,请关注我的公众号:

代码的路

堆叠降噪自动编码器 Stacked Denoising Auto Encoder(SDAE)相关推荐

  1. Auto Encoder(AE),Denoising Auto Encoder(DAE), Variational Auto Encoder(VAE) 区别

    文章主要内容参考李宏毅老师的机器学习课程:https://www.bilibili.com/video/BV1Wv411h7kN?p=70 Auto Encoder: 是什么?有什么用? Auto E ...

  2. 堆叠降噪自编码器SDAE

    https://blog.csdn.net/satlihui/article/details/81006906 https://blog.csdn.net/github_39611196/articl ...

  3. 【深度学习】李宏毅2021/2022春深度学习课程笔记 - Auto Encoder 自编码器 + PyTorch实战

    文章目录 一.Basic Idea of Auto Encoder 1.1 Auto Encoder 结构 1.2 Auto Encoder 降维 1.3 Why Auto Encoder 1.4 D ...

  4. 堆叠自动编码器(Stacked AutoEncoder)

    Deeplearning Algorithms tutorial 谷歌的人工智能位于全球前列,在图像识别.语音识别.无人驾驶等技术上都已经落地.而百度实质意义上扛起了国内的人工智能的大旗,覆盖无人驾驶 ...

  5. Stacked Denoising Autoencoders (SDAE)

    教程地址:http://www.deeplearning.net/tutorial/SdA.html The Stacked Denoising Autoencoder (SdA) is an ext ...

  6. 自编码器(Auto Encoder)原理及其python实现

    目录 一.原理 二.为什么要使用自编码器 三.代码实现 1.原始自编码器 2.多层(堆叠)自编码器 3.卷积自编码器 4.正则自编码器 4.1稀疏自编码器 四.降噪自编码器 五. 逐层贪婪训练堆叠自编 ...

  7. 论文阅读笔记-Gated relational stacked denoising autoencoder with localized author embedding for

    论文题目:Gated relational stacked denoising autoencoder with localized author  embedding for global cita ...

  8. 堆叠式降噪自动编码器(SDA)

    1.1 自动编码器(AutoEncoder,AE) 自动编码器(AutoEncoder,AE)就是一种尽可能复现输入信号的神经网络,其输出向量与输入向量同维,常按照输入向量的某种形式,通过隐层学习一个 ...

  9. python 降噪_使用降噪自动编码器重建损坏的数据(Python代码)

    python 降噪 Autoencoders aren't too useful in practice, but they can be used to denoise images quite s ...

最新文章

  1. IPinfoga查询地理位置
  2. 获取预测模型在测试集中预测错误的数据样本
  3. RMS 谈自由软件运动和后门
  4. 把磁盘崩溃了,总是进去维护模式,却删除不了fstab文件中的内容
  5. P2473 [SCOI2008]奖励关
  6. Python 中 pass的使用
  7. Silverlight中使用MIRIA进行触屏编程
  8. 读《系统虚拟化-原理与实现》-第三章
  9. 《java从入门到精通》pdf
  10. [html] html中p标签内为何不能嵌套div标签?
  11. 有关 给Layout设置监听事件后,与Layout子控件的响应关系
  12. Unicode-objects must be encoded before hashing
  13. scrapy使用pipeline保存不同的表单Item到数据库、本地文件
  14. 循环链表(约瑟夫环问题)
  15. 水晶报表10 开发和部署
  16. win10喇叭没声音,Realtek高清音频管理器 打不开问题解决
  17. 移动安全-IOS越狱
  18. layim手机版嵌入app
  19. 利用paddlepaddle爬取丁香园实时统计数据,并生成疫情地图!!
  20. LabVIEW32位和64位的兼容性

热门文章

  1. Jmeter分布式压力测试全过程(阿里云ECS)
  2. cf体验服老显示与服务器出现异常,穿越火线体验服出现网络异常
  3. Ps/2遇到KVM,这时候有一种情况需要注意
  4. 服务器查看账户被锁的信息吗,远程服务器帐户被锁定
  5. android+动态光圈效果,OpenGL Shader实例分析(8)彩色光圈效果
  6. 触觉是怎么产生的?清华大学破解诺奖成果未解之谜,登上Nature
  7. html5底部悬浮添加到桌面,桌面小程序 在弹出的界面点击“添加到桌面”
  8. 第一条台电子计算机,第一台计算机
  9. Ammeter 仪表板控件
  10. mysql导入文件出现Data truncated for column 'xxx' at row 1的原因