循环神经网络(RNNs)是基于序列的模型,对自然语言理解、语言生成、视频处理和其他许多任务至关重要。模型的输入是一个符号序列,在每个时间点一个简单的神经网络(RNN单元)应用于一个符号,以及此前时间点的网络输出。RNNs是强大的模型,在许多任务中表现出色,但会快速过拟合。RNN模型中缺少正则化使他难以处理小规模数据,为避免这种情况研究者经常使用提早停止,或者小规模的或未充分定义的模型。
Dropout是深度网络中常见的一种正则化技巧,在训练过程中网络单元随机的被隐藏/丢弃。但这种技巧在RNNs中一直未被成功应用。实证结果使很多人相信循环层(RNN单元之间的连接)中加入的噪音在长序列中会被放大,并淹没了信号。因此现存的研究认为这种技巧应仅用于RNN的输入和输出。但这种方式在研究中发现依然会导致过拟合。Dropout是一个同正则化完全不同的技术,与L1和L2范式正则化不同。dropout并不会修改代价函数而是修改深度网络本身。一个相关的早期使用这种技术的论文((**ImageNetClassification with Deep Convolutional Neural Networks, by AlexKrizhevsky, Ilya Sutskever, and Geoffrey Hinton (2012).))中启发性的dropout解释是:这种技术减少了神经元之间复杂的共适性。因为一个神经元不能依赖其他特定的神经元。因此,不得不去学习随机子集神经元间的鲁棒性的有用连接。换句话说。想象我们的神经元作为要给预测的模型,dropout是一种方式可以确保我们的模型在丢失一个个体线索的情况下保持健壮的模型。在这种情况下,可以说他的作用和L1和L2范式正则化是相同的。都是来减少权重连接,然后增加网络模型在缺失个体连接信息情况下的鲁棒性。
Dropout 方法的使用最常出现于卷积神经网络中,通过 Dropout 方法,卷积神经网络可以使鲁棒性更强。Dropout 方法不仅可以用在卷积神经网络中,在循环神经网络中使用 Dropout方法也能够得到良好的结果。在对循环神经网络使用 Dropout时,需要注意的是,一般Dropout只存在于相邻层的循环体结构之间,而同一层的循环体结构之间不会使用Dropout。循环神经网络使用 Dropout 的示意图如下图。以t-3时刻的输入x(t-3)得到t+1时刻的输出 o(t+I)为例,x(t-3)经过两层 LSTM 循环体结构 得到这一时刻的输出o(t-3)的过程需要用到 Dropout,但是这两层 LSTM 循环体结构在将状态传递到下一时刻相应的 LSTM 循环体结构时没有使用 Dropout。在这之后的时刻,循环体结构的执行以及是否使用 Dropout 也可以参考这一时刻的情况。

我们使用TensorFlow 提供的DropoutWrapper 类来实现 Dropout 功能。这个类使用起来比较简单,代码如下:

在使用 DropoutWrapper 时,要注意其构造函数有两个重要的参数——input_keep_prob 和 output_keep_prob, 其中 input_keep_prob用来控制对输入进行Dropout时的keep_prob,而参数 output_keep_prob 用来控制对输出进行 Dropout 时的 keep_prob。

关注小鲸融创,一起深度学习金融科技!

dropout层的作用_循环神经网络的 Dropout相关推荐

  1. 卷积层和全连接层的区别_卷积神经网络中全连接层作用理解总结

    前言 一般来说,卷积神经网络会有三种类型的隐藏层--卷积层.池化层.全连接层.卷积层和池化层比较好理解,主要很多教程也会解释. •  卷积层(Convolutional layer)主要是用一个采样器 ...

  2. 第六章_循环神经网络(RNN)

    文章目录 第六章 循环神经网络(RNN) CNN和RNN的对比 http://www.elecfans.com/d/775895.html 6.1 为什么需要RNN? 6.1 RNN种类? RNN t ...

  3. 外循环java作用_循环和外循环的区别和作用

    展开全部 这是关于for循环嵌62616964757a686964616fe4b893e5b19e31333365643033套的问题,下面解释供参考:首先内层循环属于外层循环循环体的一部分,当循环体 ...

  4. 中service层的作用_浅析Java中dto、dao、service、controller的四层结构

    目前我所在的项目组采用的是SpringBoot框架,前端使用BootStrap+jQuery. SpringBoot是BS开发框架之一,不用单独开启tomcat服务器,目前比较流行,一般开发大型项目时 ...

  5. 全连接层的作用_全连接层实现

    本文以<Tensorflow2.0深度学习算法实战教材>参考,代码部分全程手打. 图1 将图1 堆叠可以得到含有多个隐藏层的全连接层,如图2所示.因为当前层的输入要与前一层的输出相匹配:所 ...

  6. pdcp层的作用_【LTE基础知识】PDCP子层协议概述

    PDCP层功能 LTE系统PDCP协议层的主要目的是发送或接收对等PDCP实体的分组数据.该子层主要完成以下几方面的功能:IP包头压缩与解压缩.数据与信令的加密,以及信令的完整性保护.下图给出了PDC ...

  7. python输出一首诗_基于循环神经网络(RNN)的古诗生成器

    基于循环神经网络(RNN)的古诗生成器,具体内容如下 之前在手机百度上看到有个"为你写诗"功能,能够随机生成古诗,当时感觉很酷炫= = 在学习了深度学习后,了解了一下原理,打算自己 ...

  8. 深度学习之循环神经网络(4)RNN层使用方法

    深度学习之循环神经网络(4)RNN层使用方法 1. SimpleRNNCell 2. 多层SimpleRNNCell网络 3. SimpleRNN层  在介绍完循环神经网络的算法原理之后,我们来学习如 ...

  9. 深度学习 循环神经网络RNN

    循环神经网络简介: 循环神经网络(Recurrent Neural Networks)是一种特殊的神经网络结构, 它是根据"人的认知是基于过往的经验和记忆"这一观点提出的. 它与D ...

最新文章

  1. Web2.0时代,你得到什么?
  2. 获取某个输入框的字符长度_收藏,最全的字符串函数方法,总有你用到的~
  3. java 多线程跑数据_java——多线程的实现方式、三种办法解决线程赛跑、多线程数据同步(synchronized)、死锁...
  4. 世界上最难的视觉图_世界上最长的蛇有多长?四川惊现55米洪荒巨蟒(图)
  5. 在安全模式下激活xp
  6. 《Python编程从入门到实践》第9章类动手试一试答案(附代码)
  7. 毕业后想拿大厂offer?你得完整拥有这些计算机知识体系!
  8. Effective C++条款7:为多态基类声明virtual析构函数
  9. class括号里的object_使用es5和es6实现继承详解以及class的基本使用
  10. Linux电源管理-Linux Regulator Framework代码分析
  11. java自动发送qq消息
  12. 亲测有效,使用postman进行并发测试
  13. PAYPAL使用虚拟卡的会有优势吗?
  14. Android面试题之Activity篇
  15. 阿里天池金融数据分析赛题2:保险反欺诈预测baseline
  16. 869计算机难不难,北京科技大学
  17. joda-time 使用详解
  18. Word2vec代码实现
  19. ESPnet-SE 开源工具介绍
  20. 搭建CA认证中心及搭建https实战

热门文章

  1. 研究生走私实验材料被海关查获!为了毕业,真的太难了...
  2. AI语音独角兽思必驰完成数亿元Pre-IPO融资,冲刺苏州AI创业第一股
  3. 听声辨位过时了!这个AI系统仅凭光回声就能得到3D图像
  4. 最强骨干网 ResNeSt 助力语义分割,ADE20K 全新 SOTA 47.6%
  5. 推荐一位玩自动化的 Python 爱好者
  6. 【每日一算法】填充同一层的兄弟节点
  7. 规格选项表管理之查询获取规格选项表列表数据
  8. windows安装redis数据库
  9. 几句代码 修改 Kali 2020.3 - root 用户的密码
  10. 学习抖音上如何一下删除大型文件,源代码给出!