本篇文章主要介绍两种RNN的隐藏层信息计算方法GRU(Gated Recurrent Units)和LSTM(Long-Short-Term-Memories),这两种隐藏层的计算方法通过引入门(Gate) 的机制来解决RNN的梯度消失问题,从而学习到长距离依赖。

这里说的隐藏层计算方法指的是如何计算下个时刻的隐藏层信息,标准RNN中计算 方法是:

而LSTM和GRU可以理解为计算ht的另一种方法。

LSTM

这篇文章详细 地解释了LSTM各个门的物理含义, 以及LSTM计算隐藏层的方法,这里简要的进行总结, 下图是LSTM网络的示意图,图中各个符号的含义参考原文:

某个时刻LSTM计算隐藏层的方法参考下图:

GRU

GRU可以看成是LSTM的变种,GRU把LSTM中的forget gateinput gateupdate gate来替代。 把cell state和隐状态htht进行合并,在计算当前时刻新信息的方法和LSTM有所不同。 下图是GRU更新htht的过程:

具体更新过程如下

RNN隐藏层的两种计算方法GRU和LSTM相关推荐

  1. 置信区间(Confidence Intervals)是什么?如何计算置信区间?置信区间的两种计算方法是什么?二值样本置信区间如何计算?如何基于bootstrap抽样进行置信区间计算?

    置信区间(Confidence Intervals)是什么?如何计算置信区间?置信区间的两种计算方法是什么?二值样本置信区间如何计算?如何基于bootstrap抽样进行置信区间计算? 目录 置信区间( ...

  2. Model层的两种写法

    Model层的两种写法 第一种写法 namespace MyMVC.Models {public class Child{ //属性private int id;public int Id{get { ...

  3. javascript控制页面控件隐藏显示的两种方法

    javascript控制页面控件隐藏显示的两种方法,方法的不同之处在于控件隐藏后是否还在页面上占位 方法一: document.all<"PanelSMS">.styl ...

  4. linux HPA隐藏分区,删除HPA隐藏分区有两种方法

    删除HPA隐藏分区有两种方法: 1.是常规方法,利用品牌机自带卸载程序.这个不说了,卸载这个程序HPA就不在人间了. 2.是用MHDD命令释放分区. MHDD 是一款由俄罗斯人所开发的免费硬盘实体扫描 ...

  5. QTreeWidget隐藏节点的两种方式

    简述 关于QTreeWidget隐藏节点有两种方式,一种是直接隐藏,一种是间接隐藏,但是两种方式各有差异,下面请听具体解说. 方法一:直接隐藏式 Qt助手里面提供了QTreeWidgetItem::s ...

  6. TIA博途中累计流量的两种计算方法示例

    TIA博途中累计流量的两种计算方法示例 如下图所示,首先,我们要了解累计流量的含义: 即t1至t2时刻,对瞬时流量求定积分, 由上图可知,t1至t2的定积分,即蓝色部分的面积,那么直接求这个面积是有难 ...

  7. 四分位数的两种计算方法

    关于四分位数的两种求法 在数据导论课上,我们学习了如何求解四分位数的方法,其实操作起来也不难先用 (n+1) / 4 * i 计算出四分位数的位置,再求出该位置上的数的值即可.如一组数据 [1,3,6 ...

  8. UITabBar背景、icon图标颜色、被选中背景设置以及隐藏UITabBar的两种方式

    一.对UITabBar背景和icon图标的一些设置 (1)因为直接给UITabBar设置的背景颜色显示的不纯,半透明的感觉,所以,有时候我们可以直接利用纯色的图片作为背景达到想要的效果: (2)给ic ...

  9. java 隐藏标题栏_两种方法一句代码隐藏Activity的标题栏

    把Activity的标题栏隐藏有两种方法.一种是在在Activity里面设置javacode.还有一种是在项目的清单文件AndroidManifest.xml中设置模版样式. 一.在Activity中 ...

最新文章

  1. 10.02 T3 打表找递推式+十进制快速幂 九校联考凉心模拟DAY1T1
  2. Python爬虫学习获取腾讯新闻并存入Csv文件
  3. python封装举例_Python面向对象封装操作案例详解
  4. [USACO1.5]数字三角形 Number Triangles
  5. 如何快速开发一个 Dubbo 应用?(含沙龙报名)
  6. dot Net Frameworks中常见的设计模式
  7. cache 计算机系统实验报告,西安交通大学计算机系统结构实验报告CACHE.doc
  8. maven学习:jetty插件与Tomcat插件
  9. 黎明前的黑夜如此漫长
  10. Linux文件其他操作
  11. 【超详细】output level 和 pull up/ pull down 的真正区别
  12. 解决W5500,DHCP获取IP地址失败的问题,移植官方例程需要特别注意!!!
  13. postgresql 数据库表隐藏列 oid、tableoid、ctid、xmin、xmax、cmin、cmax
  14. 2020年抖音用户画像报告
  15. 应用集成——数据库集成与简单实现IoC容器
  16. 升级笔记本CPU的常见知识汇总
  17. JavaScript实现队列结构
  18. vue+百度地图实现搜索功能
  19. PLC转换32位IEEE 754格式modbus 值到浮点
  20. windows 10瘦身

热门文章

  1. Mysql for Linux安装配置之——二进制安装
  2. java webservice wsimport 无法将名称 'soapenc:Array' 解析为 'type definition' 组件 时对应的解决方法...
  3. Spring的事务机制
  4. php中的字符串常用函数(四) ord() 获得字符的ascii码 chr()获取ascii码对应的字符...
  5. 接口测试--apipost如何自定义header中的content-type
  6. 接口对前后端和测试的意义
  7. linux 进程 转存储,Linux memory management——(进程虚存空间的管理)(转)
  8. python批量运行cmd_python 批量ssh并执行命令
  9. jquery解析php json,使用jQuery解析PHP Json对象.
  10. python3发布时间_什么时候python 3 才能有更好的支持呢?