参考博客:

(11条消息) 关于LSTM的units参数_LeoRainy的博客-CSDN博客_lstm units怎么设置

Keras LSTM的参数input_shape, units等的理解_ygfrancois的博客-CSDN博客_keras lstm units

见到过lstm(80)的用法

查到80对应的是units这个参数,由于关于lstm网上的图大多是来自Understanding LSTM Networks -- colah's blog的下面这张图

所以一开始会以为是这样多个矩阵的连接。注意,这样的理解是错误的。这张图只是为了便于理解lstm cell的工作原理绘制的不同状态cell的图,实际上只有一个cell在不停地更新状态。

对于units的理解,经过查阅博客还有吴恩达老师的讲解后,我认为可以理解为是hidden_state的维度,是lstm cell内部的隐向量的维度,是一个超参数。

还有关于输入维度的参数,官方文档LSTM layer (keras.io)描述如下

  • inputs: A 3D tensor with shape [batch, timesteps, feature]

timestep就是lstm考虑要考虑的时间步,拿前几个时间步的信息分析当下的数据。feature就是特征向量的维度,batch就是批次。在我的项目中,我是用前6个交通流数据预测当下的交通流量。我的timestep是6,feature是1,batch就是几千个由六个时间步信息构成的序列,这和我平时理解的32,64这样的批次不太一样,不知道batch是否可以直接当作样本数量。

看到传输入的方法有:

# 1
model = tf.keras.Sequential([LSTM(4),Dense(1)
])
#将输入x_train reshape成(sample_number, time_step, feature)的形式model.fit(x_train, y_train,epochs=100)# 2
# input_dim 是feature的维度
model_input = Input(shape=(time_steps, input_dim))
x = LSTM(64, return_sequences=True)(model_input)
x = Attention(units=32)(x)
x = Dense(1)(x)
model = Model(model_input, x)
model.compile(loss='mae', optimizer='adam')

batch_size可以不定义

tensorflow.keras lstm 部分参数整理units input_size相关推荐

  1. keras lstm参数 中_keras LSTM中参数问题:timesteps和units

    资料来自keras源码. 关于units的源码解释如下: units: Positive integer, dimensionality of the output space. self.outpu ...

  2. Tensorflow③ Keras的LSTM和TF的LSTM实现的源码剖析

    最近在做可以转成pb模型的RNN/LSTM层的实现细节分析.经过一些分析,发现了在Keras里面常见的keras.layers.LSTM和Tensorflow的tf.contrib.rnn.LSTMC ...

  3. tensorflow官方Blog-使用Keras Tuner超参数优化框架 进行超参数调整 ,具体实现版本

    文章目录 进入正题,keras tuner超参数优化框架 模型构建def build_model(hp): 实例化tuner 加载数据集,进行超参数搜索tuner.search() 找到最佳的模型tu ...

  4. TensorFlow搭建LSTM实现时间序列预测(负荷预测)

    目录 I. 前言 II. 数据处理 III. 模型 IV. 训练/测试 V. 源码及数据 I. 前言 前面已经写过不少时间序列预测的文章: 深入理解PyTorch中LSTM的输入和输出(从input输 ...

  5. Keras LSTM实现多维输入输出时序预测实践详解

    自古以来,我们就希望预知未来,现如今,随着大数据人工智能技术的发展,我们早已经不满足传统的同比.环比等数据分析方法,但是时间序列趋势预测的传统算法又很专业,很难用于日常生产经营中. 深度学习神经网络为 ...

  6. Keras LSTM教程

    **本文更完整的内容请参考极客教程的深度学习专栏:https://geek-docs.com/deep-learning/rnn/keras-lstm-tutorial.html,欢迎提出您的宝贵意见 ...

  7. TensorFlow搭建LSTM实现多变量时间序列预测(负荷预测)

    目录 I. 前言 II. 数据处理 III. LSTM模型 IV. 训练/测试 V. 源码及数据 I. 前言 在前面的一篇文章TensorFlow搭建LSTM实现时间序列预测(负荷预测)中,我们利用L ...

  8. 灰狼算法优化LSTM超参数-神经元个数-dropout-batch_size

    1.摘要 本文主要讲解:使用灰狼算法优化LSTM超参数-神经元个数-dropout-batch_size 主要思路: 灰狼算法 Parameters : 迭代次数.狼的寻值范围.狼的数量 LSTM P ...

  9. 常用深度学习框——Caffe/TensorFlow / Keras/ PyTorch/MXNet

    常用深度学习框--Caffe/TensorFlow / Keras/ PyTorch/MXNet 一.概述 近几年来,深度学习的研究和应用的热潮持续高涨,各种开源深度学习框架层出不穷,包括Tensor ...

最新文章

  1. Android内存管理之道
  2. 年后跳槽季,如何在编程面试中大获成功?
  3. idea没有错误出现红色波浪线怎么去掉?
  4. HDFS多用户管理ACL机制other权限访问控制的理解
  5. 新项目废弃oracle,oracle 12.2数据库新增参数和废弃参数
  6. 轻松搞定面试中的红黑树问题
  7. 【转载】 C++中回车换行(\n\r)和换行(\r)的区别
  8. schedule execution
  9. UWP开发---通过委托跨页面导航
  10. hive hql文档_Hive存储过程HQL/SQL(一)–hplsql命令行
  11. linux程序ctrl c无法退出原因_「Linux」20节-在后台运行任务
  12. Python动态创建变量的方法
  13. ue4账号注册不了_英雄联盟手游拳头账号注册
  14. pytorch-使用GPU加速模型训练
  15. 关于random的多种用法
  16. x11获得窗口名的代码
  17. Kongzue的App更新框架
  18. AD2017破解步骤
  19. Ubuntu系统上的ImageJ安装和卸载方法
  20. react项目中引入的组件在src外从而报错

热门文章

  1. mysql日期正则表达式_MySQL 正则表达式
  2. 《强化学习周刊》第39期:近似最优深度、多智能体广义、角色动画强化学习
  3. 国庆福利“CSS定位大礼包”
  4. 这项研究对慢波睡眠最能解释深度睡眠的理论提出了挑战
  5. 骁龙7gen1处理器怎么样 骁龙7gen1相当于什么处理器
  6. python获取服务器系统时间,Python datetime获取详细时间
  7. 透明度测试-AlphaTest
  8. css实现单行、多行超出显示省略号兼容火狐
  9. 大学课程及专业课搜集
  10. 零基础该如何学习CAD