LSTM(long short-term memory)长短期记忆

模型基础介绍

在标准LSTM体系结构中,有1个记忆单元状态和3个门,即更新门Γu、遗忘门Γf和输出门Γo,标准LSTM的体系结构如图2所示。采用X1
, X2 , …, XT 表示LSTM网络中的典型输入序列,则其中 X{t} 表示时间 t
时的输入特征。为了实现重要信息长时间存储,在LSTM的整个周期内设立并维护一个记忆单元c。根据前一时间的激活单元at–1和当前时间的输入
Xt ,通过3个门确定更新、维护或遗忘内部状态向量的具体元素。


标准LSTM网络采用编码器—解码器(encode-decode)结构,将输入序列编码成固定长度的向量表示。当输入序列长度较短时,有较好的学习效果,但当输入序列长度较长时,容易造成信息丢失,难以学到输入序列合理的向量表示。

优势

相较于传统的RNN,其克服了存在的梯度消失和梯度爆炸问题。

不足

LSTM网络的预测效果远优于RNN。然而LSTM网络是将所有输入特征编码成固定长度的向量表示,忽视了其与待预测负荷之间的关联性大小,因而无法有侧重地对历史数据加以利用。

改进

本文针对LSTM算法存在的不足,提出一种基于attention机制的LSTM神经网络。

实验过程

实验主要需确定网络的输入输出变量、数据预处理方法、网络结构、模型训练方法以及网络评价指标。

输入输出变量的确定

确定网络的输入输出变量是确定网络结构的基础。假定负荷采样频率为每小时1次,可获得的网络训练数据集为每天24h的历史负荷数据,为提高网络的预测效果及处理效率,需选择合理的阶数。因负荷值具有一定的随机性,可采用计算样本自相关系数的方法来确定输入变量时间序列的阶数。各阶自相关系数反映了各滞时状态间的相关关系,可反映序列的周期规律。时间序列h阶自相关系数的计 算公式为:


简要而言,即我们不能确定哪个时间段与我们当前时间的关系最为密切,故采用自相关系数计算来确定。

通过找到自相关系数衰减为0的阶数,可确定采用 特定时段的历史负荷数据,进行超短期负荷预测,实现
负荷历史数据的充分利用。绘制得到负荷历史数据集的 自相关系数如图3所示。由图可以看出,当阶数取168
时,自相关系数衰减为0,即预测点负荷值只与预测时 刻前168 h的负荷相关,因而输入变量选为预测时刻前 168 h的负荷数据。


此外,本文目的是预测未来某天某整点时刻的负荷值,则输出变量选为预测点的负荷预测结果。

输入数据预处理

数据采集过程中,存在设备故障、人为操作失误等情况,可能会得到偏差较大 的数据或空数据,因而可进行坏数据辨别及修正,降低个别偏差较大、分布稀疏的坏数据对预测准确度的影响。
那么主要便分为坏数据辨别,坏数据修正,归一化三个步骤

数据归一化。为方便后续处理,对完成修正的负荷数据进行归一化处理,将负荷数据集矩阵各元素取
值转换在[0,1]内。归一化公式为:

基于attention机制的LSTM网络结构设计

attention机制模拟人脑注意力模型,其主要思想是针对输入序列中影响输出结果的关键部分分配较多的注意力,以更好地学习输入序列中的信息。本文将attention机制作为2个LSTM网络的接口,首先通过一个LSTM网络处理输入序列,实现高层次的特征学习;随后通过合理分配注意力权重,实现记忆单元求解;最后通过再运行一个LSTM网络实现超短期负荷预测。

模型展示


这是一个Seq2Seq模型,即编码器-解码器模型。

模型训练方法

损失函数

均方误差(mean squared error,MSE)用于反映估计量与被估计量之间的差异程度,将其作为本网络的目标损失函数,其计算公式为:

优化器

选用Adam算法替代传统随机梯度下降过程,基于训练数据和损失函数计算各参数的一阶矩估计及二阶矩估计,并针对计算结果动态调整每个参数的学习速率,实现网络权重的迭代更新。训练过程采用学习速度(learning rate,Ir)呈指数规律下降的方式,实现训练后期最优解的确定。经多次训练后,选取最佳优化结果。

关于Adam

Adam 是一种可以替代传统随机梯度下降(SGD)过程的一阶优化算法,它能基于训练数据迭代地更新神经网络权重。
Adam介绍

网络评价指标

平均绝对百分误差(mean absolute percentage error,MAPE)是一种常用于衡量预测准确性的指标。本文通过该指标对网络的负荷预测结果做出评判,其计算公式为:

之后,该模型与标准BP网络相对比,在性能上有了明显提升。

基于 attention 机制的 LSTM 神经网络 超短期负荷预测方法学习记录相关推荐

  1. 基于注意力机制的循环神经网络对 金融时间序列的应用 学习记录

    摘要: 概况论文内容,包含解决的问题,解决的方法,成果 金融时间序列由于高噪声性以及序列间的相关性,导致传统模型的预测精度和泛化能力往往较低.为了克服这一问题,提出一种基于注意力机制的循环神经网络预测 ...

  2. 基于Adam算法优化GRU神经网络的短期负荷预测(Python代码实现)

    目录 1 Adam优化算法 2 Adam算法中的学习率衰减策略 3 GRU神经网络 4 运行结果 5 参考文献 6 Python代码实现 1 Adam优化算法 2 Adam算法中的学习率衰减策略 该文 ...

  3. 基于深度神经网络的风电场超短期功率预测系统【数据故事计划最佳学术奖】...

    摘要:细听学长学姐讲故事,或许在他们的路上也有你的身影! [第一届数据故事计划] "数据故事计划"旨在收集各类有关大数据的故事然后进行比赛及相关的宣传和推广.包括同学们接触大数据. ...

  4. [深度学习] 自然语言处理 --- 基于Attention机制的Bi-LSTM文本分类

    Peng Zhou等发表在ACL2016的一篇论文<Attention-Based Bidirectional Long Short-Term Memory Networks for Relat ...

  5. 基于attention机制的中英文机器翻译

    前言 为了准备3月中旬的复试,今天回顾整理一下大三下学期做的机器学习课程设计,当时做的是基于attention机制的中英文机器翻译.参考的资料是pytorch官网的英法文间的机器翻译.pytorch参 ...

  6. 第22章针对Cloze Tests基于Attention机制的的MRC

    第22章:揭秘针对Cloze Tests基于Attention机制的的MRC领域开山之作:Teaching Machines to Read and Comprehend架构设计及完整源码实现 1,对 ...

  7. 基于Attention机制的BiLSTM语音情感识别研究与系统实现

    1.摘要 以往的情感分类大多是基于粗粒度进行的,针对七分类情感语料进行的研究不多,且最终的情感分类结果只包含一种情感,很少对多情感共存现象进行研究,因此不能完全体现用户情感的丰富性. 针对这些不足,本 ...

  8. 基于注意力机制的 CNN-BiGRU 短期电力负荷预测方法

    提出了一种基于 Attention 机制的CNN-BiGRU(卷积神经网络+双向GRU+注意力机制)短期电力负荷预测方法,该方法将历史负荷数据作为输入,搭建由一维卷 积层和池化层等组成的 CNN 架构 ...

  9. 文献综述--------山东某地区基于深度学习神经网络的配电网负荷预测研究

    摘  要:地区电网负荷预测是供电企业在电网建设.运营过程中一项十分要的基础性的工作.小到一个企业的负荷预测,大到全国性电网的负荷预测研究,它的应用结果都会对适用范围内的企业经营管理.电力设施(电网)的 ...

  10. (文章复现)5.基于BP神经网络的风电功率预测方法(MATLAB程序)

    复现文章: 基于BP神经网络的风电功率预测方法--刘立群(2021年) 摘要: 风电功率预测结果的准确性,不仅关系到风力发电厂的综合运行效率,也与区域运行成本具备直接联系,为解决传统预测方法的不足,基 ...

最新文章

  1. Linux控制台打开显示字符画,Linux 命令行字符画工具
  2. 基于SIFT特征的全景图像拼接
  3. Centos7环境安装Kibana5.2.2
  4. Moderate Modular Mode %,取模运算性质,数轴,思维
  5. java 博客系统_讲解开源项目:5分钟搭建私人Java博客系统
  6. LeetCode题库第2题 两数相加
  7. XCTF-MISC-新手区-掀桌子
  8. SQL Server的镜像是基于物理块变化的复制 镜像Failover之后数据的预热问题
  9. C# 死锁的原理与排查方法详解
  10. 光动能表怎么维护_[腕表]西铁城CITIZEN AT814451E 光动能 电波表 开
  11. Grep与web漏洞挖掘转
  12. 怎么下载python的各种库_各种Python库安装包下载地址与安装过程详细介绍(Windows版)...
  13. win10系统如何启动sql服务器,win10系统打开SQL Server数据库服务的方法
  14. axure能做剪切蒙版吗_Axure图片裁切功能
  15. 如何在word编辑文本框,教程来啦,怎样在word编辑文本框
  16. HTML强制关机,如何强制关机【处置技巧】
  17. 手机实现远程桌面控制
  18. ABAP CDS VIEW WITH ASSOCIATION示例
  19. 火狐打不开12306购票网站解决办法
  20. 大数据平台接入API数据

热门文章

  1. 8乘8led点阵显示数字_光立方8乘8乘8立体点阵
  2. 字体arial不支持样式regular的解决方法
  3. 计算机操作系统第四版课后全部习题答案
  4. SpringBoot入门学习
  5. python如何操作oracle数据库_Python连接oracle数据库的基本操作
  6. Windows 之dos命令
  7. 介绍:native2ascii命令用法详解
  8. 校园表白墙网站源码 带网站后台
  9. 从SEO的角度,如何打造非专业领域内容?
  10. 教育OA系统该如何选择?