model = Sequential()
model.add(LSTM(32, batch_input_shape=(None, 10, 64)))

以上LSTM的第一个参数units=32,指的并不是一层LSTM有32个LSTM单元。
在很多LSTM的框图中,我们都会将LSTM单元按照时间顺序排列开来,句子的长度是多少我们就会画出多少个LSTM单元。这也是给我们带来误解的地方。实际上一层LSTM的每个‘单元’是共享参数的,所以并没有所谓的那么多个LSTM单元,我们可以理解为它们其实是同一个LSTM单元,只有一个单元的参数量。

这里我们设置的units=32的大小,其实代表得是LSTM单元内的隐藏层的尺寸。

对于LSTM而言,每个单元有3个门,对应了4个激活函数(3个sigmoid,一个tanh)。也就是说有4个神经元数量为32的前馈网络层。

对于LSTM的计算过程,我们这里举一个简单的例子:

假如我们样本的每一句话包含5个单词,每个单词用16维的词向量表示。对于LSTM(units=32),我们可以把LSTM内部的计算过程计算过程简化为:

Y=X1×16W16×32,这里X为(1,16)的向量,W为(16,32)的矩阵,所以运用矩阵乘法,将16维的X转化为32维的向量。

如下图所示:

我们可以简单的将LSTM内部的各种计算想象成全连接的之间的矩阵计算。

所以units代表的不是一层单元的个数,而是单元内部隐藏层的大小。

对LSTM层的参数units 的理解相关推荐

  1. 从参数数量视角理解深度学习神经网络算法 DNN, CNN, RNN, LSTM 以python为工具

    从参数数量视角理解深度学习神经网络算法 DNN, CNN, RNN, LSTM 以python为工具 文章目录 1. 神经网络数据预处理 1.1 常规预测情景 1.2 文本预测场景 2.全连接神经网络 ...

  2. keras lstm 层理解

     最近一直在看 keras 的循环神经网络的lstm层.看了官方的document,和一些小伙伴的文章,一直都没有特别清楚.  今天看了这篇 文章,对RNN 有了一定的了解. 下面我以Nicholas ...

  3. Lesson 16.1016.1116.1216.13 卷积层的参数量计算,1x1卷积核分组卷积与深度可分离卷积全连接层 nn.Sequential全局平均池化,NiN网络复现

    二 架构对参数量/计算量的影响 在自建架构的时候,除了模型效果之外,我们还需要关注模型整体的计算效率.深度学习模型天生就需要大量数据进行训练,因此每次训练中的参数量和计算量就格外关键,因此在设计卷积网 ...

  4. Caffe中卷基层和全连接层训练参数个数如何确定

    今天来仔细讲一下卷基层和全连接层训练参数个数如何确定的问题.我们以Mnist为例,首先贴出网络配置文件: [python] view plain copy name: "LeNet" ...

  5. 卷积层和全连接层的区别_CNN卷积层、全连接层的参数量、计算量

    我们以VGG-16为例,来探讨一下如何计算卷积层.全连接层的参数量.计算量.为了简单.直观地理解,以下讨论中我们都会忽略偏置项,实践中必须考虑偏置项. [卷积层的参数量] 什么是卷积层的参数? 卷积层 ...

  6. 『PyTorch』第十一弹_torch.optim优化器 每层定制参数

    一.简化前馈网络LeNet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 im ...

  7. 深度学习 卷积层与全连接层权重参数个数的计算

    1.卷积网络实例分析 构建卷积网络如下: from tensorflow.python.keras import datasets, models, layers class CNN(object): ...

  8. Caffe学习系列(5):其它常用层及参数

    本文讲解一些其它的常用层,包括:softmax_loss层,Inner Product层,accuracy层,reshape层和dropout层及其它们的参数配置. 1.softmax-loss so ...

  9. dao传递类参数 mybatis_MyBatis DAO层传递参数到mapping.xml 几种方式

    Dao层传递参数到mapping.xml文件的几种方式:(Mybatis传值总结) 第一种:传递单个参数 Dao层Code片段: /** * 根据articleId查询XXXX详情. * * @par ...

最新文章

  1. IPv6时代的《TCP/IP详解》!
  2. linux c 按行读取文件
  3. BZOJ-2756 奇怪的游戏 黑白染色+最大流+当前弧优化+二分判断+分类讨论
  4. java代码编写出现的陷阱-1:警惕变长参数
  5. java gt_JAVA泛型知识--gt; lt;? extends Tgt;和lt;? super Tgt;
  6. linux打印软件,KX-MB2033CN Linux
  7. Spring Boot + Oracle 处理Blob/Clob类型字段实例
  8. postsql时间计算
  9. 【layUI时间控件使用】:按钮显示时间并放到输入框
  10. dsniff嗅探工具
  11. python找房源_python抓取链家房源信息(三)
  12. 搜索结果排列html模板,搜索结果页优化-城市模板
  13. 回望来时的路:构建之法东北师大站 2016春季学期
  14. HTML文本抖音李峋同款爱心代码超好看
  15. Android自定义View-简约风歌词控件
  16. Java WebSocket 基础 建立端点
  17. KONG网关 — KongA管理UI使用
  18. MT25QU128 (flash) 简介
  19. 1020 正负奇偶判断
  20. 这个神级编辑器给 Excel 加上了 Python 功能!

热门文章

  1. ubuntu16.04+gtx1080ti+cuda10.0+cudnn7.4.2/cudnn7.6.4 环境配置
  2. 汇编语言(王爽) 课程设计一
  3. JavaScript 错误监控Fundebug
  4. python 判断参数为Nonetype类型或空
  5. IT土鳖混外企(二)------ 语言障碍
  6. python time包中的time.time()和time.clock()区别和使用
  7. 基于Python实现的残缺图像检索SDK
  8. asp.net core 启动报错 Unable to configure HTTPS endpoint. No server certificate was specified
  9. QQ突然关停这项功能,网友:爷青结
  10. 导入财务数据,按月统计收款金额,按发票抬头统计收款金额。