Multivariate workload prediction using Vector Autoregressive and Stacked LSTM models

1 摘要:

  • 向量自回归+堆叠LSTM

    • VAR用于过滤多元时间序列之间的线性相互依赖
    • 堆叠LSTM捕获非线性趋势(从VAR模型计算得到的残差)
    • 对比模型:AR-MPL,RNN-GRU、ARIMA-LSTM
  • 文章提出多变量负载预测模型,使用向量自回归模型分析多元时间序列并预测未来的值。
    根据VAR模型计算残差并将其作为下一个stacked LSTM模型的输入,同时预测未来的资源值

    • VAR预测多元时间序列,处理线性问题
    • Stacked LSTM捕获数据集中非线性趋势
    • 这两个模型被连续地组合以在模型中同时包含线性和非线性趋势。
  • 使用GWA-T-12 Bitbrains提供的真实负载

2 相关工作:

  • 【1】 解释Web和数据中心工作负载的行为可以通过时间序列模型来建模。
  • 【2】一种新的使用增强型模糊神经网络的预测方法
  • 【3】使用神经网络(NN)和线性回归(LR)算法以及滑动窗口技术来开发新的工作量预测策略。
  • 【4】提出了一种新颖的预测方法,该方法可以对工作量进行分类,
    并根据工作量特征在支持向量回归(SVR)模型和线性回归(LR)模型中选择一个预测模型
  • 【5】使用自动回归综合移动平均值(ARIMA)模型来预测软件即服务(SaaS)提供商的云工作负载。
  • 【6】提出了一种使用ARIMA和ANN模型进行时间序列预测的混合方法
  • 【7】提出混合模型,长期短期记忆神经网络(LSTM)和ARIMA模型[7]用于CPU工作量预测
  • 【8】指出LSTM模型可以解决云系统所面临的问题,,诸如资源动态扩展和能耗之类的问题。
    可以确定服务器未来精确的工作量,根据需求动态调整,继而保持服务器质量且降低能耗

时间序列分解:

,时间t时刻得线性数据+非线性数据+误差项

3 模型建立

  • 用两个量分别表示CPU和内存使用
  • 用赤池AIC准则来估计阶数  一般情况表示: AIC=2k-2In(L) k为参数数量,L是似然函数
  • 用最小二乘法估计参数

4 算法流程

  • 算法输入是CPU和内存使用率,
  • 用ADF方法检测时间序列平稳性,如果不平稳则差分处理得到平稳序列
  • 采用滞后最小的阶数来进行拟合
  • 计算残差

  • 第二部分包含四步骤

    • 数据预处理

      • 在输入进LSTM之前必须要进行归一化
    • 定义模型参数
    • 模型拟合与评价
    • LSTM预测

训练集测试集的划分方式没看懂

文章的数据集选择,大概是选择了一条曲线的2800个观察点,涵盖特征为CPU和内存

-----------------------------------------------------------------------------------------

补充知识:

VAR:  是由单变量AR模型推广到多变量组成的向量的自回归模型

  • 在平稳条件下,参数估计与最小二乘估计一致,并且在许多统计上性质优良,便于区间估计、误差分析和模型诊断。 VAR可以刻画变量之间相互影响的动态线性相关性。
  • 主要用于 预测和分析随机扰动对系统的动态冲击,冲击的大小、正负和持续时间。模型定义:设Yt=(y1t,y2t....ynt)^T是Nx1阶时序应变力列向量,则p阶VAR模型记为VAR(p)
  • 建模过程需要确定两件事:
    • 哪些变量应该进入模型(要求变量间具有相关关系--格兰因果关系)
    • 滞后阶数p的确定(保证残差刚好不存在自相关)
      • 用赤池信息准则AIC和施瓦茨准则SC--在增加p值得过程中,使得AIC和SC值同时最小
      • 用似然比统计量LR选择P
  • VEC:向量误差修正模型,是含有协整约束的VSAR模型,可应用于具有协整关系得非平稳时序建模

阅读--2020-7-19 CCFC2019 使用向量自回归和堆积LSTM模型进行多变量工作量预测相关推荐

  1. R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型

    介绍 最近我们被客户要求撰写关于向量自回归的研究报告,包括一些图形和统计输出.向量自回归(VAR)模型的一般缺点是,估计系数的数量与滞后的数量成比例地增加.因此,随着滞后次数的增加,每个参数可用的信息 ...

  2. 决策树模型回归可视化分析_【时间序列分析】在论文中用向量自回归(VAR)模型时应注意哪些问题?...

    在论文的写作中,向量自回归(VAR)模型是经常用的一个模型,同时它也是多维时间序列模型的最核心内容之一. 首先要清楚,VAR模型主要是考察多个变量之间的动态互动关系,从而解释各种经济冲击对经济变量形成 ...

  3. 多元时间序列回归模型_多元时间序列分析和预测:将向量自回归(VAR)模型应用于实际的多元数据集...

    多元时间序列回归模型 Multivariate Time Series Analysis 多元时间序列分析 A univariate time series data contains only on ...

  4. adf检验代码 python_第22期:向量自回归(VAR)模型预测——Python实现

    一.向量自回归模型简介 经典回归模型都存在一个强加单向关系的局限性,即被解释变量受到解释变量的影响,但反之不成立.然而,在许多情况下所有变量都相互影响.向量自回归(VAR)模型允许这类双向反馈关系,所 ...

  5. Matlab创建向量自回归(VAR)模型分析消费者价格指数 (CPI) 和失业率时间序列

    最近我们被客户要求撰写关于向量自回归的研究报告,包括一些图形和统计输出. 描述 var对象指定了p阶平稳的多变量向量自回归模型(VAR(p))模型的函数形式并存储了参数值. varm 对象的关键组成部 ...

  6. 自回归滞后模型进行多变量时间序列预测

    下图显示了关于不同类型葡萄酒销量的月度多元时间序列.每种葡萄酒类型都是时间序列中的一个变量. 假设要预测其中一个变量.比如,sparkling wine.如何建立一个模型来进行预测呢? 一种常见的方法 ...

  7. 【视频】向量自回归VAR数学原理及R软件经济数据脉冲响应分析实例

    最近我们被客户要求撰写关于向量自回归VAR的研究报告,包括一些图形和统计输出. 向量自回归 (VAR) 是一种用于多变量时间序列分析的统计模型,尤其是在变量具有相互影响关系的时间序列中,本视频中我们介 ...

  8. Stata广义矩量法GMM面板向量自回归PVAR模型选择、估计、Granger因果检验分析投资、收入和消费数据

    最近我们被客户要求撰写关于广义矩量法GMM的研究报告,包括一些图形和统计输出. 摘要 面板向量自回归(VAR)模型在应用研究中的应用越来越多.虽然专门用于估计时间序列VAR模型的程序通常作为标准功能包 ...

  9. Matlab用向量误差修正VECM模型蒙特卡洛Monte Carlo预测债券利率时间序列和MMSE 预测...

    原文链接:http://tecdat.cn/?p=27246  此示例说明如何从 VEC( q ) 模型生成 Monte Carlo 预测.该示例将生成的预测与最小均方误差 (MMSE) 预测和来自V ...

  10. 阅读文献:“Improving Language Understanding by Generative Pre-Training”(GPT模型)

    阅读文献:"Improving Language Understanding by Generative Pre-Training" Introduction 从原始文本中有效学习 ...

最新文章

  1. Android opencv cvCvtColor()的转换
  2. pytorch的一些函数
  3. WebAPi的可视化输出模式(RabbitMQ、消息补偿相关)——所有webapi似乎都缺失的一个功能...
  4. 糍粑大叔的独游之旅-战斗!之弹道实现(上)
  5. linux 下安装chrome的rpm包
  6. python 运行pyc_Pyc文件编译和运行
  7. linux中SPI相关API函数,linux spi驱动开发学习(一)-----spi子系统架构
  8. VR终极入门指南:设备,内容,手机...都在这里了|深扒
  9. 描写计算机教室的词语,形容教室环境布置的句子
  10. HTML 表单发送邮件
  11. 关于闲鱼测试数据构造,我有几条心得
  12. Lipschitz 条件
  13. 北京信息科技大学计算机科学,2020年北京信息科技大学计算机科学与技术考研经验分享...
  14. 聚合接口对接,加油卡,流量充值,话费充值
  15. Android Studio 3.0 正式版本 发行说明 (翻译)
  16. 文件操作eof()的问题
  17. 京东店铺的运营爆款打造
  18. [附源码]Python计算机毕业设计动物保护资讯推荐网站
  19. WTF是Docker吗?
  20. android按home键再启动程序camera黑屏屏蔽home键

热门文章

  1. cat6 万兆_超六类屏蔽网线CAT6AF/FTP10G万兆过测试工程网线益朗通信科技冀州
  2. matlab如何调用swmm,一套基于SWMM开放的城市管网系统控制设计
  3. Vue 实现电子签名
  4. mysql报表展示工具_Navicat for MySQL 设计报表版面教程
  5. jQuery API中文手册详解
  6. usb redirector linux,USB Redirector Client详细使用教程
  7. STC8A 进行USB直接ISP下载
  8. 计算机d盘无法格式化,四种方法解决D盘无法格式化问题
  9. Linux_版简易C语言IDE制作
  10. 6个裂变获客增长方法