下图显示了关于不同类型葡萄酒销量的月度多元时间序列。每种葡萄酒类型都是时间序列中的一个变量。

假设要预测其中一个变量。比如,sparkling wine。如何建立一个模型来进行预测呢?

一种常见的方法是将该变量其视为单变量时间序列。这样就有很多方法可以用来模拟这些系列。比如 ARIMA、指数平滑或 Facebook 的 Prophet,还有自回归的机器学习方法也可以使用。

但是其他变量可能包含sparkling wine未来销售的重要线索。看看下面的相关矩阵。

可以看到sparkling wine的销量(第二排)与其他葡萄酒的销量有相当的相关性。所以在模型中包含这些变量可能是一个好主意。

本文将介绍可以通过一种称为自回归分布滞后(ARDL)的方法来做到这一点。

Auto-Regressive Distributed Lag

ARDL模型采用自回归。自回归是大多数单变量时间序列模型的基础。它主要分为两个步骤。

首先将(单变量)时间序列从一个值序列转换为一个矩阵。可以用用延时嵌入法(time delay embedding)来做到这一点。尽管名字很花哨,但这种方法非常简单。它基于之前的最近值对每个值进行建模。然后建立一个回归模型。未来值表示目标变量。解释变量是过去最近的值。

多元时间序列的思路与此类似,我们可以将其他变量的过去值添加到解释变量中。这就是了被称为自回归分布式滞后方法。分布式滞后的意思指的是使用额外变量的滞后。

现在我们把他们进行整合,时间序列中一个变量的未来值取决于它自身的滞后值以及其他变量的滞后值。

代码实现

多变量时间序列通常是指许多相关产品的销售数据。我们这里以葡萄酒销售时间序列为例。当然ARDL方法也适用于零售以外的其他领域。

转换时间序列

首先使用下面的脚本转换时间序列。

 import pandas as pd# https://github.com/vcerqueira/blog/from src.tde import time_delay_embeddingwine = pd.read_csv('data/wine_sales.csv', parse_dates=['date'])# setting date as indexwine.set_index('date', inplace=True)# you can simulate some data with the following code# wine = pd.DataFrame(np.random.random((100, 6)),#            columns=['Fortified','Drywhite','Sweetwhite',#                      'Red','Rose','Sparkling'])# create data set with lagged features using time delay embeddingwine_ds = []for col in wine:col_df = time_delay_embedding(wine[col], n_lags=12, horizon=6)wine_ds.append(col_df)# concatenating all variableswine_df = pd.concat(wine_ds, axis=1).dropna()# defining target (Y) and explanatory variables (X)predictor_variables = wine_df.columns.str.contains('\(t\-')target_variables = wine_df.columns.str.contains('Sparkling\(t\+')X = wine_df.iloc[:, predictor_variables]Y = wine_df.iloc[:, target_variables]

将 time_delay_embedding 函数应用于时间序列中的每个变量(第 18-22 行)。第 23 行将结果与我们的数据集进行合并。

解释变量 (X) 是每个变量在每个时间步长的最后 12 个已知值(第 29 行)。以下是它们如何查找滞后 t-1(为简洁起见省略了其他滞后值):

目标变量在第30行中定义。这指的是未来销售的6个值:

建立模型

准备好数据之后,就可以构建模型了。使用随机森林进行一个简单的训练和测试循环。

 from sklearn.model_selection import train_test_splitfrom sklearn.metrics import mean_absolute_error as maefrom sklearn.ensemble import RandomForestRegressor# train/test splitX_tr, X_ts, Y_tr, Y_ts = train_test_split(X, Y, test_size=0.3, shuffle=False)# fitting a RF modelmodel = RandomForestRegressor()model.fit(X_tr, Y_tr)# getting forecasts for the test setpreds = model.predict(X_ts)# computing MAE errorprint(mae(Y_ts, preds))# 288.13

拟合模型之后(第11行),得到了测试集中的预测(第14行)。该模型的平均绝对误差为288.13。

滞后参数的选择

上面的基线使用每个变量的 12 个滞后作为解释变量。这是在函数 time_delay_embedding 的参数 n_lags 中定义的。那么应该如何设置这个参数的值呢?

很难先验地说应该包括多少值,因为 这取决于输入数据和特定变量。

解决这个问题的一种简单方法是使用特征选择。从相当数量的值开始,然后根据重要性评分或预测性能来修改这个数字,或者直接使用GridSearch进行超参数的搜索。

我们这里将简单的演示一个判断的过程:根据随机森林的重要性得分选择前 10 个特征。

 # getting importance scores from previous modelimportance_scores = pd.Series(dict(zip(X_tr.columns, model.feature_importances_)))# getting top 10 featurestop_10_features = importance_scores.sort_values(ascending=False)[:10]top_10_features_nm = top_10_features.indexX_tr_top = X_tr[top_10_features_nm]X_ts_top = X_ts[top_10_features_nm]# re-fitting the modelmodel_top_features = RandomForestRegressor()model_top_features.fit(X_tr_top, Y_tr)# getting forecasts for the test setpreds_topf = model_top_features.predict(X_ts_top)# computing MAE errorprint(mae(Y_ts, preds_topf))# 274.36

前10个特征比原始预测显示出更好的预测性能。以下是这些功能的重要性:

目标变量(Sparkling)的滞后是最重要的。但是其他变量的一些滞后也是相关的。

ARDL 的扩展

多个目标变量预测,目前为止,我们都在预测单个变量(sparkling wine)。如果我们想要同时预测几个变量呢?

这种方法被称为:向量自回归 (VAR)

就像在 ARDL 中一样,每个变量都是根据其滞后和其他变量的滞后建模的。当想要预测多个变量而不仅仅是一个变量时,将使用 VAR。

与全局预测模型的关系

值得注意的是,ARDL并不等同于全局预测模型(Global Forecasting Models)。

在ARDL的前提下,每个变量的信息被添加到解释变量中。变量的数量通常很少,且大小相同。

全局预测模型汇集了许多时间序列的历史观测结果。模型通过这些所有观察结果进行建模。每一个新的时间序列都是作为新的观察结果加入到数据中。全局预测模型通常涉及多达数千个时间序列量级也很大。

总结

本文的主要内容如下:多变量时间序列包含两个或多个变量;ARDL 方法可用于多变量时间序列的监督学习;使用特征选择策略优化滞后数。如果要预测多个变量,可以使用 VAR 方法。

最后本文的数据集在这里:

https://avoid.overfit.cn/post/ff41c484a5cc452cbf2caa3071d768c1

作者:Vitor Cerqueira

自回归滞后模型进行多变量时间序列预测相关推荐

  1. 深度学习多变量时间序列预测:LSTM算法构建时间序列多变量模型预测交通流量+代码实战

    深度学习多变量时间序列预测:LSTM算法构建时间序列多变量模型预测交通流量+代码实战 LSTM(Long Short Term Memory Network)长短时记忆网络,是一种改进之后的循环神经网 ...

  2. 深度学习多变量时间序列预测:Bi-LSTM算法构建时间序列多变量模型预测交通流量+代码实战

    深度学习多变量时间序列预测:Bi-LSTM算法构建时间序列多变量模型预测交通流量+代码实战 人类并不是每时每刻都从一片空白的大脑开始他们的思考.在你阅读这篇文章时候,你都是基于自己已经拥有的对先前所见 ...

  3. 深度学习多变量时间序列预测:Encoder-Decoder LSTM算法构建时间序列多变量模型预测交通流量+代码实战

    深度学习多变量时间序列预测:Encoder-Decoder LSTM算法构建时间序列多变量模型预测交通流量+代码实战 LSTM是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要 ...

  4. 深度学习多变量时间序列预测:卷积神经网络(CNN)算法构建时间序列多变量模型预测交通流量+代码实战

    深度学习多变量时间序列预测:卷积神经网络(CNN)算法构建时间序列多变量模型预测交通流量+代码实战 卷积神经网络,听起来像是计算机科学.生物学和数学的诡异组合,但它们已经成为计算机视觉领域中最具影响力 ...

  5. 深度学习多变量时间序列预测:GRU算法构建时间序列多变量模型预测交通流量+代码实战

    深度学习多变量时间序列预测:GRU算法构建时间序列多变量模型预测交通流量+代码实战 GRU是LSTM网络的一种效果很好的变体,它较LSTM网络的结构更加简单,而且效果也很好,因此也是当前非常流形的一种 ...

  6. 【深度学习 项目实战】Keras深度学习多变量时间序列预测的LSTM模型

    无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.点这里可以跳转到教程.人工智能教程 本篇文章将介绍基于 ...

  7. 基于Keras的LSTM多变量时间序列预测(北京PM2.5数据集pollution.csv)

                                 基于Keras的LSTM多变量时间序列预测 传统的线性模型难以解决多变量或多输入问题,而神经网络如LSTM则擅长于处理多个变量的问题,该特性使 ...

  8. arma自回归matlab,基于MATLAB的自回归移动平均模型_ARMA_在股票预测中的应用

    基于MAT L AB 的自回归移动平均模型(ARMA)在股票 预测中的应用 翟志荣,白艳萍 (中北大学理学院,山西太原030051) 摘要:利用时间序列在t 时刻的有效观测值去预测在某个未来时刻t+l ...

  9. 基于Keras的LSTM多变量时间序列预测

    LSTM是一种时间递归神经网络,它出现的原因是为了解决RNN的一个致命的缺陷.原生的RNN会遇到一个很大的问题,叫做The vanishing gradient problem for RNNs,也就 ...

最新文章

  1. 多核时代 .NET Framework 4 中的并行编程6---并行LINQ
  2. Java面试题!Java获取异常堆栈信息
  3. corosync+pacemaker+nfs提供mysql高可用
  4. SRM 533 DIV2
  5. SpringBoot项目redis的消息队列
  6. 使用Google GSON:额外的赠品:第二部分
  7. .NET 简单的smtp协议发邮件
  8. 《Python编程从入门到实践》记录之range、min、max、sum函数
  9. 程序员加班到凌晨,第二天却被开除,了解原因后大家都说大快人心
  10. 脚本都不写,不能算正式测试
  11. 最受Java程序员欢迎的大数据工具排名
  12. Universal Source_free Domain Adaption论文阅读笔记
  13. 定量/高光谱遥感之——光谱分析技术
  14. 职称计算机萧山考点地址,杭州各科目考点一览表(地址+考试时间+电话)
  15. 如何查询期刊的中科院分区
  16. 《计算机网络》笔记-第3章运输层
  17. 原来何恺明提出的MAE还是一种数据增强
  18. 基于大数据的高校英语现状分析
  19. EF的Include 在.NET Framework 和.net core 中进行多个表查询的时候不同的写法
  20. ELasticSearch——ElasticScarch 概述及安装(v7.8)

热门文章

  1. python中文字符截取乱码
  2. 牛津5000词汇表(The Oxford 5000™)
  3. 果蝇优化算法(FOA)
  4. Microsoft Office for Mac 报错
  5. 成熟FOC电机控制代码 大厂成熟FOC电机控制图。 可用于电动自行车,滑板 车,电机FOC控制等
  6. 现在的千兆光猫都自带路由功能,是否就不需要路由器了?
  7. java多态练习_Java多态练习
  8. 结合GUI和simulink的三相电路谐波的检测与建模
  9. nexus代理阿里云仓库gradle仓库
  10. DM单机包含集群搭建