知乎视频​www.zhihu.com

简单循环神经网络的局限性

循环神经网络横向结构也是借助激活函数进行传递的:

上图是循环神经网络按时间步展开,而如果一次处理的时间步过长,即从左到右的层数很深,那么同样也会面临普通神经网络所遇到的梯度消失和梯度爆炸的问题

此外,还可能出现处理时序数据时特有的问题:无法长期记住当前的状态,例如词汇的单复数。

在句子”The person,who is reading this paper,__ a smart guy."中前面有the person,说明主语是单个人,那么后面自然是is,但是循环神经网络由于两个单词距离较远,无法进行单复数的判别。

为此,人们提出了GRU以及LSTM,虽然在深度学习历史上是先有LSTM,再有GRU,但GRU结构相对简单,而LSTM可以看作是GRU的推广。

GRU(门控循环单元)

循环神经网络按时间步展开时,从左到右传递的是

,而为了和LSTM联系起来,在表述GRU(门控循环单元)时用
代替

在循环神经网络中最主要的问题是没办法长期记住当前的状态,于是我们希望这个

能够记住当前的状态,即希望它能够与上一时刻的

有所关联,同时也应当与本身模型构建出来的

有关。

为此,将其表示为两者简单的线性加权组合形式:

其中,激活函数sigmoid曲线如下:

输出值在0-1之间,因此

也是一个在0-1之间的数,往往取到接近于0或接近于1。
  • 当其接近于1时,

    是当前模型构建出来的值
    ,进行更新
  • 当其接近于0时,
    是上一时刻的值

当训练参数得到的模型

使得
一直接近于0时,
值保持不变,也就起到了长期记忆的作用。

这是简化的的GRU模型,相应的还有完整的GRU模型:

添加了一个新的门,用以表述

的相关性,相比简化版的GRU,具有很强的健壮性和实用性。而从结构上来思考,就是特征之间有些是相互关联的(
取1),有些则不关联(
取0):
完全版GRU结构理解

LSTM(长短期记忆神经网络)

LSTM(长短期记忆神经网络),可以看作是GRU(门控循环单元)的推广,首先我们写出完全版GRU的模型如下:

其中最后一步更新时,采取的是

简单的线性加权组合形式,其加权系数和为1,如果我们做一下改进,取两个不相关的加权系数

同时将

提出来放到输出中 ,那些门函数中的原
也应当用
替换,这就是大名鼎鼎的LSTM:

其中

,update,用于表示模型构建的参数所占权重,
,forget,用于表示上一时刻的值所占权重,
,output,用于表示
的相关性。
用于短期记忆,
用于长期记忆,LSTM由此得名。

可以看到LSTM和GRU的对比如下:

可以看到,LSTM比起GRU结构复杂,所需的计算资源大,但是效果往往比GRU好。

循环神经网络_漫谈循环神经网络:LSTM、GRU相关推荐

  1. 多层感知机 深度神经网络_使用深度神经网络和合同感知损失的能源产量预测...

    多层感知机 深度神经网络 in collaboration with Hsu Chung Chuan, Lin Min Htoo, and Quah Jia Yong. 与许忠传,林敏涛和华佳勇合作. ...

  2. 循环训练_力量循环训练

    在很多先天训练环境不足的状况,经常有许多运动项目都采用所谓的循环训练法,而在特别注重专项运动成绩的运动项目,采用循环训练法的比例亦在所多有,循环训练可在不受场地和器材的限制下,发挥出良好的训练效果,更 ...

  3. 循环神经网络 递归神经网络_了解递归神经网络中的注意力

    循环神经网络 递归神经网络 I recently started a new newsletter focus on AI education. TheSequence is a no-BS( mea ...

  4. hopfileld神经网络_图卷积神经网络

    大概一个月前,老师给我分的方向是图神经网络.研一已经快过完了,我自己还没有确定好自己的研究方向.只知道自己想做技术,但是具体什么技术并没有想法,既然老师给分了这个方向,再加上自身也觉得图神经网络在推荐 ...

  5. rbf神经网络_基于RBF神经网络的监督控制(09)

    1.RBF监督控制 基于RBF神经网络的监督控制系统,其控制思想是:初始阶段采用PD反馈控制,然后过渡到神经网络控制.在控制过程中,如出现较大的误差,则PD控制起主导作用,神经网络控制起调节作用. 图 ...

  6. 神经网络 卷积神经网络_如何愚弄神经网络?

    神经网络 卷积神经网络 Imagine you're in the year 2050 and you're on your way to work in a self-driving car (pr ...

  7. 径向基函数神经网络_基于RBF神经网络的网络安全态势感知预测研究

    点击上方"网络空间安全学术期刊"关注我们 基于RBF神经网络的网络安全态势 感知预测研究 钱建, 李思宇 摘要 针对网络安全态势的感知问题,结合巨龙山和者磨山风电场的运行情况,文章 ...

  8. python循环队列_关于循环队列的一些讲解

    前面讲到了队列的"假溢出",解决假溢出的办法就是后面满了,就再从头开始,也就是头尾相接的循环.我们把队列的这种头尾相接的顺序存储结构称为循环队列. 比如昨天的例子,rear可以改为 ...

  9. 人工神经网络_用人工神经网络控制猴子大脑,MIT科学家做到了

    机器之心报道 机器之心编辑部 MIT 的三位科学家成功地用自己创建的人工神经网络控制了猴子大脑皮层的神经活动. 三位研究者分别是 MIT 大脑与行为科学系主任 James DiCarlo.MIT 博士 ...

最新文章

  1. skiller v3 beta2_S10全球总决赛:赛前叫嚣却遭打脸!V3被LGD踢出S10,日本撸友彻底炸锅:真是悲哀...
  2. oracle count null 0,oracle count()函数对null值的处理
  3. oracle游标错误,ORACLE游标与错误处理
  4. hive的lateral view行转列
  5. async与defer
  6. 防火墙审计策略和应用场景介绍(USG6307E)
  7. Atitit View事件分发机制
  8. vue项目实战中的笔记
  9. 删除svn中的文件方法
  10. Flash视频播放器 JW PLAYER怎么在网页中运用?
  11. linux 内核代码阅读工具,linux内核源码阅读工具
  12. 电脑数据误删除了怎么恢复?误删除数据恢复操作教程
  13. 朋友python多个逻辑条件判断_Python小课笔记--Python控制流:if逻辑判断
  14. 记第一次自己组装台式机
  15. [iOS]-weak底层原理(sidetable相关,附带引用计数原理)
  16. 又是一江春水自东流!
  17. linux按照目录大小降序排列,Linux du命令查看文件夹大小并按降序排列
  18. 手机wps怎么设置打印横竖_WPS表格打印预览在哪如何设置横向和纵向打印方式
  19. DNS_PROBE_FINISHED_NXDOMAIN错误的解决方法
  20. BNNVGG2-VGG Net

热门文章

  1. spring 整合struts
  2. HDU——T 1573 X问题
  3. HackPorts – Mac OS X 渗透测试框架与工具
  4. Apache与Subversion的简单配置(Apache SVN版本控制)
  5. Excel 【数据透视表】 -【动态表图】 之核心 -【切片器】
  6. 对于(不是特别不合理)的指摘、的对应方式(学会调整,不要一根筋)
  7. Excel 2007中,列标1234 修改为 ABCD
  8. 帮助你的上司达成目标
  9. HTML中,TextArea的换行问题(添加wrap属性)。
  10. zkfc 异常退出问题,报错Received stat error from Zookeeper. code:CONNECTIONLOSS