时序数据预测:Holt-Winters
本文尝试应用三次指数平滑法(Holt-Winters)对同时含有趋势和季节规律的月度时序数据进行预测,样本时序数据时间跨度2017年1月至今。对时序数据进行异常值判别并修正处理后,应用Holt-Winters建模预测。比较懒(主要是学识浅薄),暂不做详尽的理论说明与代码解释,仅做个人积累记录使用,如有侵权或不合规请及时联系处理~
申明:本文代码参考过之前统计学背景的同事的思路,感谢靠谱的小伙伴们~
目录
1、样本数据获取
2、异常值判别与修正
3、模型构建与评估
1、样本数据获取
本例样本数据为单变量月度时序数据,读取该变量时序数据后将“年月”字段设置为索引。
import pandas as pd# 加载基础数据
data_dl = pd.read_excel("C:/Users/admin/Desktop/data.xlsx",sheet_name='时序数据')
data_dl['年月']=data_dl['年月'].astype(object)
data_dl['年月'] = pd.to_datetime(data_dl['年月'],format='%Y%m')
data_dl =data_dl.set_index('年月')
ts_data=data_dl['目标变量']
2、异常值判别与修正
将各变量时序数据进行周期性分解,提取变量residual残差部分,过滤Nan值后进行z-score标准化处理,根据3σ原则(三西格玛准则)判别异常值,本例取2.5σ;
对异常值进行修正,修正值取异常月份的其他年份同期平均值。
from statsmodels.tsa.seasonal import seasonal_decompose
import numpy as np#2.5倍西格玛获取异常值
decomposition = seasonal_decompose(ts_data, period=12, two_sided=False)
residual = pd.DataFrame(decomposition.resid)
residual.dropna(inplace=True)
residual['resid_zscore'] = (residual['resid'] -residual['resid'].mean()) / residual['resid'].std()
z_abnormal = residual[abs(residual['resid_zscore']) > 2.5]#异常值修正
ts_data_re=ts_data.copy()
ts_data_re.rename('修正',inplace=True)
ts_data_re.loc[z_abnormal.index]=np.nan
for indx in z_abnormal.index:ts_data_re.loc[indx]=ts_data_re[(ts_data_re.index.month == indx.month)&(ts_data_re.index.year != indx.year)].mean()z_abnor=pd.concat([ts_data, ts_data_re], axis=1)
z_abnor['修正'].loc[(z_abnor.index).difference(z_abnormal.index)]=np.nanprint(z_abnor.loc[z_abnormal.index])
结果预览。异常年月的实际值与修正值。
3、模型构建与评估
构建三次指数平滑模型,在训练集上完成模型训练,在测试集上验证模型效果,计算预测准确率(可分别基于实际值与修正值计算准确率)。
from statsmodels.tsa.holtwinters import ExponentialSmoothing#划分训练集与测试集
test_len=3
train = ts_data_re[:-test_len]
test = ts_data_re[-test_len:]result=pd.concat([ts_data[-test_len:], test], axis=1)#模型训练与评估
model = ExponentialSmoothing(np.asarray(train), seasonal_periods=12, trend='add',seasonal='mul', ).fit()
result['pred'] = model.forecast(test_len)
result['accr'] = round(100 - abs(result['pred'] - result['汇总']) * 100 / result['汇总'],2)print(result)
结果预览。本例基于实际值计算准确率。
时序数据预测:Holt-Winters相关推荐
- 基于机器学习的时序数据预测方法
预测模型建模 时序数据的预测通常建模为利用历史数据值预测未来的数据走势. 简单的数学表示: x => S => x^' 其中: x = {x_1,x_2,-,x_t} 表示历史数据, S ...
- MATLAB-基于长短期记忆网络(LSTM)的SP500的股票价格预测 股价预测 matlab实战 数据分析 数据可视化 时序数据预测 变种RNN 股票预测
MATLAB-基于长短期记忆网络(LSTM)的SP500的股票价格预测 股价预测 matlab实战 数据分析 数据可视化 时序数据预测 变种RNN 股票预测 摘要 近些年,随着计算机技术的不断发展,神 ...
- 时序数据预测:ROCKET vs Time Series Forest vs TCN vs XGBoost
机器学习小项目:从NIFTY指数的当日股价预测股票收盘价格,对比各种模型在时序数据预测的效果 如果你像我一样涉足股票交易,你可能想知道如何在收盘时判断股票的走势--它会在收盘价上方收盘,还是不会?因为 ...
- 时序数据预测:LSTM
本文尝试应用长短期记忆(LSTM,Long Short-Term Memory)神经网络模型对月度时序数据进行预测,样本时序数据时间跨度2017年1月至今,同时对多个目标变量时序数据进行预测.本文主要 ...
- 一种基于多维时序数据预测综合判定的方法(内存告警)
很多情境下,我们都会遇到收集的多维度的时序性的数据,比如运维中的主机各项指标数据,网页中的各项埋点数据等等.通常情况下通过某一指标上的时序预测结果与真实值的比较来判断这一指标是否稳定,这个常用方法的缺 ...
- 时序数据预测-Arima模型篇
ARIMA模型详解 基本概念 ARIMA(p, d, q)预测模型 ARIMA差分整合移动平均自回归模型,用于时间序列数据分析与预测,相比ARMA模型在AR和MA之间多了差分步骤,目的是把非平稳序列转 ...
- 时序数据预测-SARIMA篇
一.概念 1. 定义:SARIMA模型具有处理季节趋势的时间序列数据的特点. 2. 参数介绍:SARIMA(p, d, q) (P, D, Q)s ,分为两部分,非季节模型与参数p.d.q,季节性模型 ...
- 【SVM时序预测】基于matlab鲸鱼算法优化支持向量机SVM时序数据预测【含Matlab源码 2250期】
⛄一.鲸鱼算法优化支持向量机SVM 1 鲸鱼优化算法 WOA是由Mirjalili和Lewis在2016年提出的一种较为新颖的元启发式群体智能优化算法,该算法模仿座头鲸的"螺旋气泡网&quo ...
- 智能优化与机器学习结合算法实现时序数据预测matlab代码清单
✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信.
最新文章
- 关于运行ssm,web请求出现HTTP415错误
- 第三章| 3.1文件处理
- 《Lancet》发表全球学者联合声明!
- Flutter中关键字Const和Final之间的区别
- CVPR 2021 妆容迁移 CPM SCGAN
- Delphi中TFlowPanel实现滚动条效果
- 分享:When.js 2.0.0 发布,Promises/A 的实现
- KDE Applications 19.04 发布,包含大量更新
- Oracle 中国研发中心裁员已成定局,云时代下一个是谁?
- 面试中被问到HashMap的结构,1.7和1.8有哪些区别?这篇做深入分析!
- SAAS及PAAS的概念
- java基础:网络编程(三)UDP编程
- Android Contacts 联系人源码分析
- 计算机桌面个性化怎样设置方法,终于知晓如何设置个性化电脑桌面?
- 2021年全球与中国飞机导航镜行业市场规模现状及企业市场份额分析
- vs code快速复制一行代码 快捷键
- 浅谈XPS文件格式。
- vb.net 打印条形码code39、code128A、code128C、code128Auto(picturebox和打印机)封装类
- 简单的c#winform画图工具
- 分式相乘转换成分式加减的一般性方法的简单讨论