dropout 是 regularization 方法,在rnn中使用方法不同于cnn

对于rnn的部分不进行dropout,也就是说从t-1时候的状态传递到t时刻进行计算时,这个中间不进行memory的dropout;仅在同一个t时刻中,多层cell之间传递信息的时候进行dropout。

if is_training and config.keep_prob < 1:lstm_cell = tf.nn.rnn_cell.DropoutWrapper(lstm_cell, output_keep_prob=config.keep_prob)

因此,我们在代码中定义完cell之后,在cell外部包裹上dropout,这个类叫DropoutWrapper,这样我们的cell就有了dropout功能!

可以从官方文档中看到,它有input_keep_prob和output_keep_prob,也就是说裹上这个DropoutWrapper之 后,如果我希望是input传入这个cell时dropout掉一部分input信息的话,就设置input_keep_prob,那么传入到cell的 就是部分input;如果我希望这个cell的output只部分作为下一层cell的input的话,就定义output_keep_prob。不要太方便。

参考资料

recurrent neural network regularization

转载于:https://www.cnblogs.com/yanshw/p/10516384.html

循环神经网络-Dropout相关推荐

  1. dropout层的作用_循环神经网络的 Dropout

    循环神经网络(RNNs)是基于序列的模型,对自然语言理解.语言生成.视频处理和其他许多任务至关重要.模型的输入是一个符号序列,在每个时间点一个简单的神经网络(RNN单元)应用于一个符号,以及此前时间点 ...

  2. 一文详解循环神经网络的基本概念(代码版)

    作者 | 李理 目前就职于环信,即时通讯云平台和全媒体智能客服平台,在环信从事智能客服和智能机器人相关工作,致力于用深度学习来提高智能机器人的性能. 写在前面 由于工作太忙,这个系列文章有一年多没有更 ...

  3. 循环神经网络实现文本情感分类之使用LSTM完成文本情感分类

    循环神经网络实现文本情感分类之使用LSTM完成文本情感分类 1. 使用LSTM完成文本情感分类 在前面,使用了word embedding去实现了toy级别的文本情感分类,那么现在在这个模型中添加上L ...

  4. 循环神经网络实现文本情感分类之Pytorch中LSTM和GRU模块使用

    循环神经网络实现文本情感分类之Pytorch中LSTM和GRU模块使用 1. Pytorch中LSTM和GRU模块使用 1.1 LSTM介绍 LSTM和GRU都是由torch.nn提供 通过观察文档, ...

  5. 从LSTM到GRU基于门控的循环神经网络总结

    1.概述 为了改善基本RNN的长期依赖问题,一种方法是引入门控机制来控制信息的累积速度,包括有选择性地加入新的信息,并有选择性遗忘之前累积的信息.下面主要介绍两种基于门控的循环神经网络:长短时记忆网络 ...

  6. Pytorch实现基本循环神经网络RNN (3)

    1.47.Pytorch实现基本循环神经网络RNN (3) Recurrent Neural networks(Rumelhart, 1986)主要用来处理序列型数据,具有对以往数据的记忆功能.下图所 ...

  7. 循环神经网络基础介绍

    在应用循环神经网络的过程中,还是会有些地方疑惑,所以还是要回归下问题的本质. 学而不思则惘,思而不学则怠.. 1. 循环神经网路简介 首先循环神经网络的主要用途是处理和预测序列数据.在之前的全链接神经 ...

  8. 深度学习之循环神经网络(11-b)GRU情感分类问题代码

    深度学习之循环神经网络(11-b)GRU情感分类问题代码 1. Cell方式 代码 运行结果 2. 层方式 代码 运行结果 1. Cell方式 代码 import os import tensorfl ...

  9. 深度学习之循环神经网络(11-a)LSTM情感分类问题代码

    深度学习之循环神经网络(11-a)LSTM情感分类问题代码 1. Cell方式 代码 运行结果 2. 层方式 代码 运行结果 1. Cell方式 代码 import os import tensorf ...

最新文章

  1. linux shell 从变量中按指定字符切割字符串
  2. BugkuCTF-Crypto题告诉你个秘密
  3. python 操作oracle 执行脚本_CentOS 7定时执行python脚本
  4. MySQL的position值是什么_MySQL数据库中系统函数POSITION功能简介
  5. Vue传递方法给页面调用
  6. 1、matplotlib绘制一个简单的图形
  7. 苹果怎么加辅助功能的计算机,Mac辅助功能 - 基本操作以及设置 - Macbook Pro用户手册...
  8. JAVA后台权限管理系统
  9. Halcon教程十:把Halcon程序放入WPF程序里
  10. 大数据云端实验室项目实战-微博舆情大数据分析有感
  11. 基于微信小程序的便捷记账本家庭个人理财小程序#毕业设计
  12. 腾讯2021校园招聘全球启动
  13. 性能测试培训总结-spotlight on mysql
  14. 计算机找不到海信电视,如何设置海信电视投屏 海信电视投屏设置方法【详解】...
  15. 网易云音乐APP(基于APICloud平台)
  16. HTML简单表格的制作
  17. 学生成绩排名 (用结构体数组按成绩排名)
  18. Java实现3DES加密解密(DESede/ECB/PKCS5Padding使用)
  19. html.partial mvc5,.net mvc5的 完整源码(深入学习MVC非常有用)
  20. 数据结构与算法(1)--二叉树

热门文章

  1. (转)逻辑地址,线性地址,物理地址的差别
  2. 帮我看看这点破事 EVENT
  3. 容器(一)剖析面试最常见问题之 Java 集合框架
  4. 教育部最新通知,中高考又有大变化,学生欲哭无泪,家长炸锅了
  5. C#编程语言之Unix时间戳转换为本地时间的方法
  6. 实探全球第九大超算中心:温水冷却节能30% 正寻求新突破
  7. 因为你组织的安全策略阻止未经身份验证的来宾(试了很多种办法都不行)
  8. html输入框颜色属性,css 修改input输入框属性
  9. android 中edittext控件 输入错误后焦点不变_常用基本控件测试用例(二)
  10. 040_Unicode对照表六