先看下图:

这是1986年到2006年的原油月度价格。可见在2001年之后,原油价格有一个显著的攀爬,这时再去假定均值是一个定值(常数)就不太合理了,也就是说,第二讲的平稳模型在这种情况下就太适用了。也因此有了今天这一讲。

要处理这种非平稳的数据(比如上图中的均值不是一个常数),需要用非平稳模型:求和自回归滑动平均(Autoregressive integrated moving average, ARIMA)。接下来,咱先看一个处理过的石油价格:

是不是似曾相识?! 对的,经过简单的处理,本来不平稳的数据,立即变成了平稳数据了。这样再用上一章的模型就可简单处理了。这种处理方式就叫做差分(马上会讲,别急)。 而ARIMA 模型可以简单的理解为:差分+平稳模型。你看,这下,这章的内容是不是简单多了,所谓非平稳模型不就是差分处理下数据,再变有平稳数据,然后再用平稳模型处理嘛~ 确实酱紫~。

那马上就产生一个问题(或者你早就有疑问了):什么叫做差分?差分是处理时间序列非常重要的工具,在计量经济学及金融数学中广泛应用。

3.1 差分运算

3.1.1 差分运算

还是用原油价格(月度数据)作为例子,所谓一阶差分就是两个相邻月度之间做差。(这么简单?!对,就是这样~)。

规范化些:设\(\{X_t,\ t= \pm1,\pm2,\dots\}\) 为一时间序列,则:

\[\Delta x_t = x_t - x_{t-1} \ t=\pm1,\pm2,\dots

\]

称为时间序\(\{X_t,\ t= \pm1,\pm2,\dots\}\) 的一阶差分运算。

比如 2005年原油价格为:46.84 ,48.15, 54.19, 52.98, 49.83, 56.35, 58.99, 64.98 ,65.59, 62.26, 58.32 ,59.41。那这组数据的一阶差分即为 1.31, 6.04, -1.21, -3.15, 6.52 , 2.64 , 5.99 , 0.61,-3.33, -3.94,也就是前一个数减去后一个数而已。

那如果我想去差分后的数据再做一次差分呢? 那就是二阶差分(就是这么easy~):上面的一阶差分数据为1.31, 6.04, -1.21, -3.15, 6.52 , 2.64 , 5.99 , 0.61,-3.33, -3.94,再经一次差分: 4.73 , -7.25, -1.94, 9.67, -3.88, 3.35 , -5.38 , -3.94, -0.61.

那如果想做p次呢(你够了~),那就叫做p阶差分了,定义为:

\[\Delta^p x_t = \Delta^{p-1}x_t - \Delta^{p-1} x_{t-1}

\]

是不是很简单?!

3.1.2 k步差分

如果不是相邻数据间做差呢,比如我想隔几个数据叫,比如我想用原油数据7月份数据与1月份做差呢? 没问题,你的需求我一定满足,这个就叫做k步差分了:

\[\Delta_k x_t = x_t - x_{t - k}

\]

比如2005年7月与1月的价格差值即为: 58.99 - 46.84 = 12.15.也即称为六步差分了。

3.1.3 差分的选择

划重点,划重点!!!

序列蕴含着显著的线性趋势,1 阶差分可以实现趋势平稳,比如上面的原油价格(不过,里面其实做了一个预处理,一会说~).

序列蕴含着曲线趋势的,通常低阶(2阶或3阶)差分就可以取提出曲线趋势的影响.

对于固定周期的序列,通常进行步长为周期长度的差分就可以较好的提取周期信息.

PS: 差分虽好,但也不要贪杯哦, 记住对信息的任何的加工都只会造成信息的损失.

3.1.3* 延迟算子

这一小节作为了解,不喜欢可以_跳过_,不影响理解滴~。

延迟算子,类似一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拔了一个时刻。(ps: 算子就是映射,就是关系,就是变换![3])

3.1.3.1定义与性质

记 B 为延迟算子,有:\(x_{t-1} = Bx_t, x_{t-2} = B^2x_t,\dots, x_{t-p} = B^p x_{t-p}\)

延迟算子具有如下性质:

\(B^0\) = 1

若 c 为常数, 则有 \(B(c\bullet x_t) = c B(x_t) = c\bullet x_{t-1}\)

对任意两个序列\(有\{x_t\},\{y_t\},有 B(x_t\pm y_t) = x_{t-1}\pm y_{t-1}\)

\(B^n x_t = x_{t-n}\)

\(其中(1-B)^n = \sum_{i = 0}^n(-1)^p C_{n}^i B^i,其中 C_n^i = \frac{n!}{i! (n-i)!}\)

3.1.3.2 差分的延迟算子表示

p阶差分

\[\Delta^p x_t = (1 - B)^p x_t = \sum_{i = 0}^p(-1)^p C_p^i x_{t-i} \quad t = \pm1,\pm2,\dots

\]

k步差分

\[\Delta_k x_t = x_t - x_{t-k} = (1-B^k)x_t \quad t = \pm1,\pm2,\dots

\]

3.2* 时间序列分解

这一小节作为了解,不喜欢可以_跳过_,不影响理解滴~

在第一节(时间序列介绍) 中,曾提到过时间序列分解,其实时间序列分解不是靠感觉给出的,它也是有强大理论依据的,这里就支持时间序列分解的两大定理作简单的介绍:

3.2.1 Wold 分解

Wold 分解: 对于任何一个离散平稳过程\(\{X_t,\ t= \pm1,\pm2,\dots\}\), 它都可以分解为两个不相关的平稳序列之和,其中一个分确定性的,另一个为随机性的 不妨记作:

\[X_t= V_t+ \xi_t \quad t = \pm1,\pm2,\dots

\]

其中 \(\{V_t\}\) 为确定性序列,而\(\{\xi_t\}\)为随机序列,且\(\xi_t = \sum_{j = 0}^\infty \phi_j\epsilon_{t -j}\). 满足:

\[\begin{array}

\\

\phi_0 = 1,\sum_{j = 0}^\infty \phi_j^2 < \infty\\

\\

\{\epsilon_t\} \sim WN(0,\sigma_t^2)\\

\\

E(V_t,\epsilon_s) = 0, \forall t \ne s\\

\end{array}

\]

其中的所谓的'确定性':

对任意的序列\(\{V_t\quad t = \pm1,\pm2,\dots\}\) 对\(V_t\)作 q 期之前的序列值\(\{V_{t-q},V_{t-q-1},\dots,V_{t-1}\}\) 作线性回归:

\[v_t = a_0 + a_1v_{t-q } + a_2 v_{t-q-1} + \dots+ a_q v_{t-1} + \eta_t

\]

其中\(\eta_t\) 为回归残差序列: \(Var(v_t) = \tau_q^2\). 如果:

$\lim_{ q \rightarrow\infty} \tau_q^2 = 0 $ ,则称 \(\{V_t\}\)为确定性序列;

\(\lim_{ q \rightarrow\infty} \tau_q^2 = Var(v_t)\), 则称\(\{V_t\}\) 为随机序列.

3.2.2 Cramer 分解

Wold分解是现代时间序列分析理论的灵魂. 1938 年 H. Wold 提出此理论时,只是为了分析平稳序列的构成, 不过另一位大牛Cramer于1961年证明此种分析思路同样适用于非平稳序列.

Crammer 分解: 任意时间序列\(\{X_t\}\) 都可分解成两部分的叠加:其中一部分是由多项式的确定性分析趋势成分,另一部分是平稳的零均值误差成分:

\[x_t = \mu_t + \epsilon_t = \sum_{j = 0}^d \beta_jt^j+ \Psi(B)a_t \quad t = \pm1,\pm2,\dots

\]

其中\(d < \infty,\beta_1,\beta_2,\dots,\beta_d\)为常数系数,\({a_t}\)为一个零均值白噪声序列; B 为延迟算子.

Cramer分解说明任何一具序列的波动都可以视为受到了确定性影响和随机性影响的综合作用.

3.3 ARIMA 模型

千呼万唤终于到了ARIMA.

有了上面的知识,就可以很容易推出自回归滑动平均求和(ARIMA)模型。

如果有一个时间序列\(\{X_t,\ t=\pm1,\pm2,\dots\}\) 的 d 次差分 \(W_t = \Delta X_t\) 是一个平稳的ARMA过程,则称时间序列\(\{X_t,\ t=\pm1,\pm2,\dots\}\) 为 ARIMA模型。如果\(W_t\)服从 ARMA(p,q) 模型,则称\(\{Y_t\}\) 是 ARIMA(p,d,q) 过程.

其中 d 通常为1,最多也不过2,3, 所以,不用太担心模型过于复杂.另外,如果 p = 0, 即不包含自回归项,称为IMA(d,q), 如果没有滑动平均项, 则称为ARI(p,d).

来来,给个'粟子',先看个简单的,下图(上)是某个商店某产品的两个月销量的时间序列图:

(上)图中 数据显然是不平稳的; (中)图是作了一步差分的结果,是不是平稳多了(什么?图怎么更难看了? 是的, 因为我这个过程是在剔除确定性信息啊~); (下)图是再一次作一步差分的(也即二阶差分), 你会发现这会是真的像白噪声了.

下面考虑ARIMA(p,1,d), 令\(W_t = Y_t - Y_{t-1}\):

\[W_t = \phi_1 W_{t-1}+\phi_2W_{t-2}+\dots +\phi_{t-p}W_{t-p} \\

\qquad + e_t + \theta_1e_{t-1} + \theta_2e_{t-2}+\dots+\theta_{t-q}e_{t-q}\qquad t= \pm1,\pm2,\dots

\]

即:

\[Y_t - Y_{t-1} = \phi_1 (Y_{t-1} - Y_{t-2})+\phi_2(Y_{t-2} - Y_{t-3})+\dots +\phi_{t-p}(Y_{t-p} - Y_{t-p-1}) \\

\qquad+ e_t + \theta_1e_{t-1} + \theta_2e_{t-2}+\dots+\theta_{t-q}e_{t-q}\qquad t= \pm1,\pm2,\dots

\]

整理:

\[Y_t = (1 + \phi_1)Y_{t-1}+(\phi_2 - \phi_1)Y_{t-2}+(\phi_2 - \phi_3)Y_{t-3}+\dots+(\phi_p - \phi_{p-1})Y_{t-p} - \phi_{p}Y_{t-p-1} \\

\qquad+ e_t + \theta_1e_{t-1} + \theta_2e_{t-2}+\dots+\theta_{t-q}e_{t-q}\qquad t= \pm1,\pm2,\dots

\]

上式即称为模型的差分方程形式, 看起来是不是像ARMA(p+1,q)过程? 不过, 其特征多项式(涉及延迟算子,不过只需要知道下面的公式是由上面推出即可,至于怎么推出,需了解上面的星号章节~[^4])满足:

\[1 - (1+\phi_1)x - (\phi_2 - \phi_1)x^2 -(\phi_2-\phi_3)x^3 -\dots - (\phi_p - \phi_{p-1})x^p + \phi_p x^{p+1} \\

= (1 -\phi_1x-\phi_2x^2-\dots- \phi_px^p)(1-x) \qquad t = \pm1,\pm2,\dots

\]

显然,x = 1 是 一个根, 意味着这个过程非平稳,而其余的根是平稳过程的\(W_t\)的根.

参考文献

如第一节参考文献中所述, 主要的参考文献都在第一节中列出来了, 下面所列为新加入或当节的参考文献,请知悉.

arima 公式_时间序列 ARIMA 模型 (三)相关推荐

  1. arima 公式_时间序列预测之--ARIMA模型

    什么是 ARIMA模型 ARIMA模型的全称叫做自回归移动平均模型,全称是(ARIMA, Autoregressive Integrated Moving Average Model).也记作ARIM ...

  2. arima 公式_R语言 arima函数

    arima(stats) arima()所属R语言包:stats ARIMA Modelling of Time Series 时间序列的ARIMA模型建模 描述----------Descripti ...

  3. lstm时间序列预测模型_时间序列-LSTM模型

    lstm时间序列预测模型 时间序列-LSTM模型 (Time Series - LSTM Model) Now, we are familiar with statistical modelling ...

  4. arima基本原理_时间序列 :ARIMA模型-原理

    时间序列是在时间点上形成的数值序列,时间序列预测是通过观察历史数据预测未来的值.ARIMA模型(Autoregressive Integrated Moving Average model)是时间序列 ...

  5. python分析每月销售数据_时间序列ARIMA模型详解:python实现店铺一周销售量预测...

    顾名思义,时间序列是时间间隔不变的情况下收集的时间点集合.这些集合被分析用来了解长期发展趋势,为了预测未来或者表现分析的其他形式.但是是什么令时间序列与常见的回归问题的不同? 有两个原因: 1.时间序 ...

  6. arch模型的思路_时间序列--ARCH模型

    对于金融时间序列,波动率往往具有以下特征:存在波动率聚集现象,也就是波动率一段时间上高,一段时间上低 波动率以连续时间变化,很少发生跳跃 波动率不会发散到无穷,波动率往往是平稳的 波动率对价格上升和大 ...

  7. ddm模型公式_用DDM模型来判断市场理论上的合理市盈率

    用 DDM 模型来判断市场理论上的合理市盈率 说明:该模型对价值投资应该来说没有太大的用处,但了解一下 还是有好处的,如果分析师.投资者太依赖该模型,这样可能会给我 们很好的机会,在他们犯错误时,我们 ...

  8. adc0808温度换算公式_温湿度传感器的三种模拟量换算关系

    气候的变化常常会导致空气当中的湿度以及温度随之而产生相应的变化,如果想及时感知空气中温湿度的变化,那就需要温湿度传感器.在日常生活中,温湿度传感器种类有很多,按照数据上传方式分有RS485型温湿度传感 ...

  9. arma模型平稳性和可逆性的条件_时间序列预测模型ARIMA实现

    前段时间整理了一个预测的基本思考框架和常见的方法,其中提到了ARIMA模型,在<大数据预测>那本书里,ARIMA是单独开辟一章讲的,比较复杂和难理解的一个模型,自己最近找了点资料粗浅学习了 ...

最新文章

  1. 微软解释Edge浏览器比Chrome更加安全的原因
  2. oracle12c默认字符集,修改Oracle【12C】字符集
  3. Hibernate上传数据到数据库,从数据库读取数据到本地模板代码
  4. python智慧树章节答案_Python程序设计_知到智慧树_章节答案
  5. 第十一篇 浅拷贝和深拷贝
  6. collections模块 :namedtuple、deque、defaultdict、OrderedDict、ChainMap、Counter
  7. 分红酒 - 蓝桥杯 - 已更新
  8. FeiQ(飞秋)更新用户列表的原理
  9. 网管员常用工具(一)
  10. SuperMap BIM+GIS技术白皮书
  11. Python+OpenCV摄像头人脸识别
  12. 关于苹果绕ID的一些注意事项,A6-A7 Sliver 6.2 小白少走弯路。
  13. 使用Python全栈打造淘宝客微信机器人(2)!功能太强大了
  14. GAN在SAR图像仿真中的应用
  15. 关于小米笔记本Pro内部风扇异响问题解决方法
  16. EOS区块链开发的第一步
  17. java_vinson_02:jdk下载安装
  18. MySQL安装+Navicat11注册机破解
  19. 水溶性富勒醇/羟基化富勒烯(Fullerenols)主要成分碳、氧、氢
  20. AI音箱的原理,小爱同学、天猫精灵、siri。

热门文章

  1. 博学谷学习记录之人工智能(python进阶编程)第五篇
  2. 博学谷学习记录】超强总结,用心分享 | 架构师 JVM内核调优学习总结
  3. 【算法】统计qq一天中每秒在线人数
  4. Windows下Redis集群搭建(超详细教程)
  5. Java:使用HttpURLConnection发送请求时报文体为什么会为空?
  6. java给英雄加血,王者荣耀里能给队友加血的英雄你能想到几个?
  7. Java程序员必备基础面试题
  8. android安全测试工具----busybox的下载和安装
  9. Uni-app 原生app 云打包(安卓篇)
  10. android 获取properties文件路径,读取local.properties文件