1.lstm的结构图


LSTM主要由记忆单元C,遗忘门,输入门和输出门组成,门的取值范围都是(0,1),由sigmoid函数控制

  • 遗忘门f

    遗忘门以前一个时刻的隐层状态ht−1和该时刻输入xt的线性组合作为sigmoid函数的输入,用来控制
    遗忘多少*前一时刻记忆单元Ct-1的内容。
    那么经过遗忘门之后:Ct-1中的内容还剩多少呢:• 表示元素级的乘法
  • 输入门 i

    输入们也是以前一个时刻的隐层状态ht−1和该时刻输入xt的线性组合作为sigmoid函数的输入,用来控制输入多少当前输入进来的新信息
    输入们:
    那么经过输入门的控制,究竟有多少新信息是被保留的呢?我们用C_t~来表示:
  • 输出门

    输出们也是以前一个时刻的隐层状态ht−1和该时刻输入xt的线性组合作为sigmoid函数的输入,用来控制输出多少 当前记忆单元Ct 的信息
    输出门:
    那么当前记忆单元Ct的内容是什么呢??,观察下图:

    Ct 是由 Ct-1 经历乘法加法得到的,再来看乘法和加法到底是什么?

    由图中可以看到:
  • 乘法:由遗忘门控制的
  • 加法:由输入门控制的
  • 将两者想加就是当前的Ct
  • 最终的输出ht

对照这张图,整个过程整理一下


2.GRU结构图

GRU是LSTM网络的一种效果很好的变体,它较LSTM网络的结构更加简单,而且效果也很好,因此也是当前非常流形的一种网络。GRU既然是LSTM的变体,因此也是可以解决RNN网络中的长依赖问题。

GRU模型中只有两个门:分别是重置门更新门

  • 重置门所做的工作跟Lstm 的遗忘门类似,只不过它不是遗忘前一时刻记忆单元Ct-1的信息,而是前一时刻隐层单元的信息 ht-1

  • 重置门

  • 遗忘之后,ht-1 还剩多少信息??

  • 更新门作用与LSTM 不一样,它是控制前一时刻隐层状态 ht-1,和当前输入信息的平衡

  • 更新门:


  • 输入信息:注意这里输入的不是ht-1, 而是遗忘之后的 rt • ht-1

  • 平衡之后的ht

对照这张图,整理下整个过程


最后:[ ]表示cancat,• 表示元素级的乘法

lstm和GRU结构图相关推荐

  1. 【串讲总结】RNN、LSTM、GRU、ConvLSTM、ConvGRU、ST-LSTM

    前言 平时很少写总结性的文章,感觉还是需要阶段性总结一些可以串在一起的知识点,所以这次写了下.因为我写的内容主要在时序.时空预测这个方向,所以主要还是把rnn,lstm,gru,convlstm,co ...

  2. 【图文并茂】RNN、LSTM、GRU、ConvLSTM、ConvGRU、ST-LSTM的总结

    前言 平时很少写总结性的文章,感觉还是需要阶段性总结一些可以串在一起的知识点,所以这次写了下.因为我写的内容主要在时序.时空预测这个方向,所以主要还是把rnn,lstm,gru,convlstm,co ...

  3. 深度学习(三十九)LSTM、GRU网络入门学习-未完待续

    LSTM入门学习 原文地址:http://blog.csdn.net/hjimce/article/details/51234311 作者:hjimce 一.相关理论 本篇博文主要讲解LSTM.GRU ...

  4. RNN、LSTM、GRU的原理和实现

    个人博客:http://www.chenjianqu.com/ 原文链接:http://www.chenjianqu.com/show-41.html 用python实现了经典的RNN,LSTM和GR ...

  5. CS224N笔记(四) Lecture 7:循环神经网络RNN的进阶——LSTM与GRU

    本文将介绍两种比RNN更好地应对梯度消失问题的模型结构--LSTM和GRU,文章以CS224N的课件和材料为基础,重点分析他们的结构特点和梯度计算,在梯度消失的解决策略上进行了深入探究,并进一步分析它 ...

  6. 图解LSTM与GRU单元的各个公式和区别

    作者 | Che_Hongshu 来源 | AI蜗牛车 (ID: AI_For_Car) 因为自己LSTM和GRU学的时间相隔很远,并且当时学的也有点小小的蒙圈,也因为最近一直在用lstm,gru等等 ...

  7. 难以置信!LSTM和GRU的解析从未如此清晰(动图+视频)

    作者 | Michael Nguyen 编译 | 蔡志兴.费棋 编辑 | Jane 出品 | AI科技大本营 [导语]机器学习工程师 Michael Nguyen 在其博文中发布了关于 LSTM 和 ...

  8. 循环神经网络实现文本情感分类之Pytorch中LSTM和GRU模块使用

    循环神经网络实现文本情感分类之Pytorch中LSTM和GRU模块使用 1. Pytorch中LSTM和GRU模块使用 1.1 LSTM介绍 LSTM和GRU都是由torch.nn提供 通过观察文档, ...

  9. 从LSTM到GRU基于门控的循环神经网络总结

    1.概述 为了改善基本RNN的长期依赖问题,一种方法是引入门控机制来控制信息的累积速度,包括有选择性地加入新的信息,并有选择性遗忘之前累积的信息.下面主要介绍两种基于门控的循环神经网络:长短时记忆网络 ...

最新文章

  1. LinearAlgebra_3
  2. ajax 导致 css 延迟_AJAX远离404
  3. 数组字符串转化成数组与eval函数
  4. C++和C#相互调用COM组件的方法简介
  5. 面试题-- 什么是偏向锁
  6. oozie mysql_【oozie】将oozie的数据库配置为mysql | 学步园
  7. Android ActionBarSherlock使用教程
  8. 2016030208 - sql50题练习题
  9. ubantu的二三事
  10. 经典机器学习系列(六)【集成学习】之周志华西瓜书-AdaBoost算法证明解析
  11. lsi计算文档相似度
  12. 怎样看python源代码-如何查看python源代码
  13. Oracle VM VirtualBox Ubuntu1804虚拟机磁盘扩容
  14. W806/W801/W800多通道ADC同时使用
  15. 网页中滑动导航菜单制作
  16. MacPS安装服务器当前无响应,最新:M1芯片Mac安装Photoshop2021闪退/卡在启动屏页解决办法...
  17. 给一段下雪的代码。。。
  18. Flash鼠绘入门第八课:绘制脱俗荷花-Flash鼠绘脱俗荷花教程(6)
  19. Java程序员烂大街了?
  20. 雷军留名:不是因程序员成名

热门文章

  1. linux mysql stop 报错_mysql linux上安装使用
  2. oracle 伪列访问序列,Oracle同义词与序列基础教程
  3. java 手动触发gc_java触发full gc的几种情况整理
  4. Python性能分析入门——cProfile、可视化、逐行分析、内存分析
  5. word怎么取消目录
  6. 教你一招利用Python快速去除图片水印
  7. (13)web安全|渗透测试|网络安全 注入/跨库查询/文件读写/常见的防护原理 详细图解
  8. cron 每隔3天_crontab实现每隔多少天执行一次脚本的两种方法
  9. 除了SCI-HUB,还有那么多免费外文文献网站,资源速取。
  10. java中怎么创建表格_Java中的表格怎么利用表格模型进行创建