在开始之前,首先区分下均命名为RNN,新手很容易混淆的两大神经网络:循环神经网络(Recurrent Neural Network,RNN)和递归神经网络(Recurssion Neural Network,RNN)。
递归神经网络(RNN)是空间上的展开,处理的是树状结构的信息,模型结构如下:

循环神经网络(RNN)是时间上的展开,擅长处理以时间序列数据作为输入的预测问题, 其原因在于 RNN 的网络结构可以处理时间序列数据之间的相关性。模型结构如图所示,包括输入层 x、隐藏层 h、输出层 o,在隐藏层 h 上有一个循环操作,同时 RNN 在所有时刻的线性关系参数 U、 W、 V 都是共享的, 极大地减少了参数训练量.。图 (b) 为 RNN 展开结构图, 可以看到 RNN 通过权值 W 实现隐藏层之间的依赖关系。

1、长短期记忆神经网络LSTM

长短期神经网络(long short term memory,LSTM)是循环神经网络(RNN)的一种。实际应用中发现RNN 存在诸如梯度消失、梯度爆炸以及长距离依赖信息能力差等问题,因此引入了 LSTM。LSTM 在主体结构上与 RNN 类似,其主要的改进是在隐藏层 h 中增加了3 个门控 (gates) 结构,分别是遗忘门 (forget gate)、输入门 (input gate)、输出门 (output gate),同时新增了一个隐藏状态 (cell state) 。LSTM 隐藏层结构原理如下图所示,f(t)、i(t)、 o(t) 分别表示 t 时刻遗忘门、输入门、输出门的值,a(t) 表示 t 时刻对 h(t–1) 和 x(t) 的初步特征提取。

具体的计算过程为:

其中,xt表示 t 时刻的输入, ht–1 表示 t–1 时刻的隐层状态值;
Wf、 Wi、 Wo 和 Wa 分别表示遗忘门、输入门、输出门和特征提取过程中 ht–1 的权重系数;
Uf、 Ui、Uo和 Ua 分别表示遗忘门、输入门、输出门和特征提取过程中 xt 的权重系数;
bf、 bi、 bo 和 ba 分别表示遗忘门、输入门、输出门和特征提取过程中的偏置值;
tanh 表示正切双曲函数,σ表示激活函数 Sigmoid。

遗忘门和输入门计算的结果作用于 c(t–1), 构成t 时刻的细胞状态 c(t),用公式表示为:

其中, ⊙为 Hadamard 积。最终,t 时刻的隐藏层状态 h(t) 由输出门 o(t) 和当前时刻的细胞状态 c(t) 求出:

2、双向长短期记忆神经网络Bi-LSTM

Bi-LSTM 神经网络结构模型分为 2 个独立的LSTM,输入序列分别以正序和逆序输入至 2 个LSTM 神经网络进行特征提取,将 2个输出向量(即提取后的特征向量)进行拼接后形成的词向量作为该词的最终特征表达。Bi-LSTM 的模型设计理念是使 t 时刻所获得特征数据同时拥有过去和将来之间的信息,实验证明,这种神经网络结构模型对文本特征提取效率和性能要优于单个 LSTM 结构模型。值得一提的是,Bi-LSTM 中的 2 个 LSTM 神经网络参数是相互独立的,它们只共享 word-embedding词向量列表。

双向长短期记忆网络(Bi-LSTM)相关推荐

  1. 基于注意力机制的双向长短期记忆网络的关系分类

    Attention-Based Bidirectional Long Short-Term Memory Networks forRelation Classification 论文来源:https: ...

  2. 双向长短期记忆网络模型_基于深度双向长短期记忆网络的空气质量预测方法与流程...

    [技术领域] 本发明涉及一种基于深度双向长短期记忆网络的空气质量预测方法,属于空气污染预测领域. 背景技术: 空气污染物浓度的预测拥有很强的学科交叉性,一直是环境.气象.数学.地理及计算机科学领域研究 ...

  3. 双向长短期记忆网络(BiLSTM)详解

    双向长短期记忆网络(BiLSTM)详解 一.前言 在学习BiLSTM之前,首先需要对RNN和LSTM有一定的了解,可以参考本人的博客:详细讲解RNN+LSTM+Tree_LSTM(Tree-Long ...

  4. 动手学深度学习(四十)——长短期记忆网络(LSTM)

    文章目录 一.长短期记忆网络(LSTM) 1.1 门控记忆单元 1.2 输入门.遗忘门与输出门 1.3候选记忆单元 1.4 记忆单元 1.5 隐藏状态 二.从零实现LSTM 2.1 初始化模型参数 2 ...

  5. 57 长短期记忆网络(LSTM)【动手学深度学习v2】

    57 长短期记忆网络(LSTM)[动手学深度学习v2] 深度学习学习笔记 学习视频:https://www.bilibili.com/video/BV1JU4y1H7PC/?spm_id_from=a ...

  6. 双向长短期记忆网络模型_一种基于双向长短期记忆网络的定位修正方法与流程...

    本发明属于行人导航定位修正领域,具体涉及一种基于双向长短期记忆网络的定位修正方法. 背景技术: 近些年来,随着室内定位技术的不断发展,很大程度弥补了类似gps等利用卫星信号进行定位而卫星信号穿透力较差 ...

  7. 09.2. 长短期记忆网络(LSTM)

    文章目录 9.2. 长短期记忆网络(LSTM) 9.2.1. 门控记忆元 9.2.1.1. 输入门.忘记门和输出门 9.2.1.2. 候选记忆元 9.2.1.3. 记忆元 9.2.1.4. 隐状态 9 ...

  8. 长短期记忆网络(LSTM)

    长短期记忆网络(LSTM) 1.LSTM介绍 LSTM 表示长短期记忆网络,当我们的神经网络需要在记忆最近的事物和很久以前的事情之间切换时,LSTM 是非常有用的. 2.RNN vs LSTM RNN ...

  9. GWO-BiLSTM 双向长短期记忆网络 基于灰狼优化双向长短期记忆网络(GWO-BiLSTM)的回归预测或时序预测

    GWO-BiLSTM 双向长短期记忆网络 基于灰狼优化双向长短期记忆网络(GWO-BiLSTM)的回归预测或时序预测 优化参数为学习率,隐藏层节点个数,正则化参数. matlab代码 ID:46496 ...

  10. 循环神经网络(RNN)与长短期记忆网络(LSTM)讲解

    循环神经网络(RNN) 对于典型的深度神经网络(DNN),就是通过在输入层与输出层之间增加隐藏层来构建网络,如下图所示. 与DNN不同的是,循环神经网络(RNN)赋予了网络对前面的内容的一种" ...

最新文章

  1. VS设置DLL所在的调试目录
  2. SAP BRF+ debugger工作原理
  3. 从条纹边框的实现谈盒子模型
  4. 简明的后台样式查询模板
  5. 对抗攻击之利用水印生成对抗样本
  6. bzoj1010[HNOI2008]玩具装箱toy 斜率优化dp
  7. 上周热点回顾(11.27-12.3)
  8. 【温度检测】基于matlab GUI热红外图像温度检测系统【含Matlab源码 1920期】
  9. 程序员英文简历范例(Java, Python)
  10. matlab线性平面映射求通项_MATLAB数学建模必备算法--层次分析法AHP
  11. 如何在云服务器上安装kali系统
  12. css实现实心三角箭头,兼容ie
  13. 2018中南大学 计算机考研分数,2018年中南大学考研复试分数线已公布
  14. 微信二次分享解决方案
  15. Numpy库的三种矩阵乘法
  16. Java第一次实习面试经历
  17. BOSS直聘上市背后:招聘新人与行业老炮的终极对决
  18. CompletableFuture教程
  19. Nacos学习笔记 (1)Nacos的简介与安装
  20. 汇编NEG(求补/即求相反数)指令

热门文章

  1. Javascript运算符知多少
  2. 利用js实现多彩输入框
  3. 电商API接口汇总,引领企业国际化
  4. 韩漫《绿色镌像》又名《绿色镌刻》
  5. 【安全牛学习笔记】Kali Linux安装-硬盘安装、虚拟机安装
  6. 学习CSS Scroll Snapping与scroll-snap-align
  7. ITK系列24_ 区域增长(孤立连接)算法对脑部PNG图像进行二维分割
  8. Termius常用快捷键
  9. [Kubernetes]PV,PVC,StorageClass实战----|||
  10. 视频教程-VC#.NET+GDI+开发交互式CAD系统-C#