浅谈深度信念网络(Deep Belief Network)

一、受限玻尔兹曼机(Restricted Boltzmann Machines )

  • RBM简介
    如图所示,一个受限玻尔兹曼机由两层网络组成,分别为可见层(Visible layer)和隐藏层(Hidden layer)。其中,输入特征与可见层关联,特征检测器与隐藏层关联。两层之间为全连接,而层内无连接。
    考虑一个二维向量的训练集,出于目的的考虑,我们假设它是二维图片。训练集能被用到只有两层神经网络的受限玻尔兹曼机模型(Smolensky, 1986; Freund and Haussler, 1992; Hinton, 2002),在模型中,二维像素是随机的,二维特征检测器则对称加权连接。像素对应受限玻尔兹曼机的可见节点,因为它是可以被观测到的;特征检测器对应隐藏节点。
    定义可见单元(v)和隐藏单元(h)的一个联合能量为:
    E(v,h)=−∑i∈visibleaivi−∑j∈hiddenbjhj−∑i,jvihjwijE(v,h)=-\sum_{i\in visible}a_iv_i-\sum_{j\in hidden}b_jh_j-\sum_{i,j}v_ih_jw_{ij}E(v,h)=−i∈visible∑​ai​vi​−j∈hidden∑​bj​hj​−i,j∑​vi​hj​wij​
    其中,vi,hjv_i,h_jvi​,hj​是可见单元iii和隐藏单元jjj的两种状态(0或1),ai,bja_i,b_jai​,bj​是他们的偏差,wi,jw_{i,j}wi,j​是他们之间的权重值。
    通过能量函数,网络给每一个可能的可见和隐藏的向量对分配一个概率:
    p(v,h)=1Ze−E(v,h)p(v,h)={1\over Z}e^{-E(v,h)}p(v,h)=Z1​e−E(v,h)
    其中ZZZ是所有可能可见和隐藏向量对的求和:
    Z=∑v,he−E(v,h)Z=\sum_{v,h}e^{-E(v,h)}Z=v,h∑​e−E(v,h)
    网络分配给可见向量的概率通过将所有可能的隐藏向量相加求得:
    p(v)=1Z∑he−E(v,h)p(v)={1\over Z}\sum_he^{-E(v,h)}p(v)=Z1​h∑​e−E(v,h)
    可以通过调整权重和偏置来降低训练图像的能量并提高其他图像的能量(尤其是具有低能量,对分式贡献很大的图像),以此来提高网络分配给训练图像的概率。
    训练向量的对数概率对于权重的偏导数相当简单:
    ∂logp(v)∂wi,j=&lt;vihj&gt;data−&lt;vihj&gt;model{\partial logp(v)\over\partial w_{i,j}}=&lt;v_ih_j&gt;_{data}-&lt;v_ih_j&gt;_{model}∂wi,j​∂logp(v)​=<vi​hj​>data​−<vi​hj​>model​
    其中,<>表示下标对应的分布的期望,在训练数据的概率分布中,它为形成训练数据的对数概率的随机陡峭的上升曲线提提供了一个简单的学习规则(对比散度):
    Δwij=ϵ(&lt;vihj&gt;data−&lt;vihj&gt;model)\Delta w_{ij}=\epsilon(&lt;v_ih_j&gt;_{data}-&lt;v_ih_j&gt;_{model})Δwij​=ϵ(<vi​hj​>data​−<vi​hj​>model​)
    其中ϵ是学习率。
    在受限玻尔兹曼机的隐藏层之间的节点是没有连接的,所以得到一个没有偏差的分布⟨vihj⟩data⟨v_ih_j⟩_{data}⟨vi​hj​⟩data​便异常容易。给定一张随机选择的训练图片vvv,隐藏节点jjj,二维状态hj=1h_j=1hj​=1的概率为:
    p(hj=1∣v)=σ(bj+∑iviwij)p(h_j=1|v)=\sigma(b_j+\sum_iv_iw_{ij})p(hj​=1∣v)=σ(bj​+i∑​vi​wij​)
    σ(x)\sigma(x)σ(x)是sigmoid函数,vihjv_ih_jvi​hj​是无偏样本。
    在可见层的节点之间也没有连接,因而在可见节点中很容易得到没有偏差的概率分布,给定隐藏向量,有
    p(vi=1∣h)=σ(ai+∑jhjwij)p(v_i=1|h)=\sigma(a_i+\sum_jh_jw_{ij})p(vi​=1∣h)=σ(ai​+j∑​hj​wij​)
  • RBM训练过程
    重复以下三步:
    1.前向传播

    输入图像被转化为二进制的值,然后喂入网络,值被权重相乘,加上偏置,然后结果输入激励函数(例如sigmoid函数),代表了是否激活某个独立隐藏单元的概率,然后,从该概率分布中抽取样本,并找出哪些神经元可能会或者可能不会激活。 这意味着,它会做出是否传输隐藏数据的随机决策。
    前向传播将输入转化成一组在隐藏中表示的二进制数。
    2.反向传播

    隐藏层的激活神经元将结果反向传递给可见层,在可见层中,输入将被重构。在此过程中,数据在反向传播经过和正向传播相同的权重和偏置。所以,当信息到达可见层,在给定隐藏的情况下构成了输入值的概率分布。对该分布采样,输入就被重构了。
    反向传播就是猜测原始输入的概率分布。
    3.性能评估

    步骤3通过比较重构结果和原始数据来对重构性能进行评估。RBM计算误差并调整权重和偏置去最小化误差。在每一个周期(一个正向传播和反向传播),计算步骤1和步骤2的均方误差和作为误差。
    这三步一直重复直到误差足够的小。
  • 使用RBM的优点
    1.RBMs擅长处理无标签数据。
    2.RBMs可以从输入提取重要特征。
    3.RBMs在降维方面比PCA更有效。
    4.注意RBM是一种AUTOENCODER

二、深度信念网络(Deep Belief Networks )


深度信念网络(DBN)由多个DBM以及一个BP组成。
DBN 在训练模型的过程中主要分为两步:

第 1 步:分别单独无监督地训练每一层 RBM 网络,确保特征向量映射到不同特征空间时,都尽可能多地保留特征信息;

第 2 步:在 DBN 的最后一层设置 BP 网络,接收 RBM 的输出特征向量作为它的输入特征向量,有监督地训练实体关系分类器.而且每一层 RBM 网络只能确保自身层内的 权值对该层特征向量映射达到最优,并不是对整个 DBN 的特征向量映射达到最优,所以反向传播网络还将错误信息自顶向下传播至每一层 RBM,微调整个 DBN 网络.RBM 网络训练模型的过程可以看作对一个深层 BP 网络权值参数的初始化,使DBN 克服了 BP 网络因随机初始化权值参数而容易陷入局部最优和训练时间长的缺点.

上述训练模型中第一步在深度学习的术语叫做预训练,第二步叫做微调。最上面有监督学习的那一层,根据具体的应用领域可以换成任何分类器模型,而不必是BP网络。

【注】:参考Geoffrey Hinton A Practical Guide to Training Restricted Boltzmann Machines
               IBM Deep Learning with Tensorflow on edX

浅谈深度信念网络(Deep Belief Network)相关推荐

  1. 深度信念网络Deep Belief Networks资料汇总

    毕设做的是DBNs的相关研究,翻过一些资料,在此做个汇总. 可以通过谷歌学术搜索来下载这些论文. Arel, I., Rose, D. C. and K arnowski, T. P. Deep ma ...

  2. 贝叶斯信念网络Bayes Belief network

    贝叶斯信念网络Bayes Belief network 文章目录 贝叶斯信念网络Bayes Belief network 1. BBN 2. 两大成分 3. 先验概率 3.1.1 计算患心脏病的概率 ...

  3. 深度残差网络(Deep Residual Network)ResNet

    一说起"深度学习",自然就联想到它非常显著的特点"深.深.深",通过很深层次的网络实现准确率非常高的图像识别.语音识别等能力.因此,我们自然很容易就想到:深的网 ...

  4. 深度学习--深度信念网络(Deep Belief Network)

    本篇非常简要地介绍了深度信念网络的基本概念.文章先简要介绍了深度信念网络(包括其应用实例).接着分别讲述了:(1) 其基本组成结构--受限玻尔兹曼机的的基本情况,以及,(2) 这个基本结构如何组成深度 ...

  5. 深度信念网络研究现状与展望

    来源:专知 摘要: 深度信念网络(Deep belief network, DBN)是一种基于深度学习的生成模型, 克服了传统梯度类学习算法在处理深层结构所面临的梯度消失问题, 近几年来已成为深度学习 ...

  6. 基于深度信念网络的脑电图情感分类

    目录 导读 分类方法 特征提取 分类器 实验数据与结果 本教程为脑机学习者Rose发表于公众号:脑机接口社区 .QQ交流群:903290195 导读 近年来,在使用深度网络进行无监督的数据特征学习方面 ...

  7. 【theano-windows】学习笔记十六——深度信念网络DBN

    前言 前面学习了受限玻尔兹曼机(RBM)的理论和搭建方法, 如果稍微了解过的人, 肯定知道利用RBM可以堆叠构成深度信念网络(deep belief network, DBN)和深度玻尔兹曼机(dee ...

  8. 深度信念网络_【文章推荐】应用于油中溶解气体分析的深度信念网络与典型神经网络对比研究...

    文章推荐 应用于油中溶解气体分析的深度信念网络与典型神经网络对比研究 原文发表在<高压电器>2020年第9期. 请进<高压电器>网站(www.zgydq.com)下载全文. D ...

  9. 快速理解深度信念网络

    深度信念网络 (Deep Belief Network, DBN) 由 Geoffrey Hinton 在 2006 年提出.它是一种生成模型,通过训练其神经元间的权重,我们可以让整个神经网络按照最大 ...

  10. 机器学习笔记之深度信念网络(一)背景介绍与结构表示

    机器学习笔记之深度信念网络--背景介绍与结构表示 引言 深度信念网络 场景构建 深度信念网络的联合概率分布 引言 从本节开始,将介绍深度信念网络. 深度信念网络 深度信念网络(Deep Belief ...

最新文章

  1. python爬虫之微打赏(scrapy版)
  2. Python 列表 index( )方法
  3. 20181030-4 每周例行报告
  4. php裁剪图片白边,php生成缩略图填充白边(等比缩略图方案)_PHP
  5. db2 最大分区数_DB2分区数据库浅析
  6. ActiveMq的简介
  7. java获取上周一_java 如何获取 上周一日期,上周末日期,本周一日期。
  8. SmartNIC — Overview
  9. 人工神经网络课后题答案,人工神经网络原理答案
  10. 自然数因式分解最小和
  11. PCIE 3.0 4.0 GEN3 GEN4 速度如何
  12. 中英文在线语音转文字的方法
  13. Eolink 征文活动- -专为开发者设计的一款国产免费 API 协作平台
  14. 去除Pycharm中的波浪线
  15. Guitar Pro8吉他谱编写软件下载安装及使用教程
  16. 从零开始打造一款面向市场级产品
  17. golang 微信支付全解析
  18. java之文件上传后需要修复问题(Doc文档,Excel文档等)
  19. 如何看待双非院校本科生,十面字节跳动,最终pass
  20. 动物医学和计算机专业哪个好,本科动物医学专业排名,2020选择哪所大学好?

热门文章

  1. 寂寞沙洲冷c语言程序,周传雄《寂寞沙洲冷》吉他谱简单版 酷音小伟吉他弹唱教学吉他谱...
  2. DTMF双音多频信号仿真演示系统
  3. 6个免费音乐网站,随便听随便下,都是好干货
  4. python爬虫qq音乐歌词_10、 在QQ音乐中爬取某首歌曲的歌词
  5. [Alg]排序算法之插入排序
  6. C#实现远程关机与远程开机(唤醒)
  7. Jupyter Notebook 自动生成目录(超级实用)
  8. vant 调取上传照片
  9. 某代理网站免费IP地址抓取测试
  10. HTML为图片添加Alt描述,图片标签alt