Refer:https://pengfoo.com/post/machine-learning/2017-01-24

Abstract

在ARMA/ARIMA这样的自回归模型中,模型对时间序列数据的平稳是有要求的,因此,需要对数据或者数据的n阶差分进行平稳检验,而一种常见的方法就是ADF检验,即单位根检验。

平稳随机过程

在数学中,平稳随机过程(Stationary random process)或者严平稳随机过程(Strictly-sense stationary random process),又称狭义平稳过程,是在固定时间和位置的概率分布与所有时间和位置的概率分布相同的随机过程:即随机过程的统计特性不随时间的推移而变化。这样,数学期望和方差这些参数也不随时间和位置变化。

平稳在理论上有严平稳和宽平稳两种,在实际应用上宽平稳使用较多。宽平稳的数学定义为:

对于时间序列 ytyt,若对任意的t,k,mt,k,m,满足:

$$E(y_t) = E(y_{t+m})\\

cov(y_t, y_{t+k}) = cov(y_{t+k}, y_{t+k+m})$$

则称时间序列 ytyt 是宽平稳的。

平稳是自回归模型ARMA的必要条件,因此对于时间序列,首先要保证应用自回归的n阶差分序列是平稳的。

肉眼检验

我们以某次天池比赛的数据集为例,如图,是店铺从2015-09到2016-10的销售额:

该数据显然是不平稳的,我们来看看一阶差分:

_series=pd.Series(data=data['cnt'])# 获取data过程省略diff1=dta=_series.diff(1)[1:]# dta[0] is nandiff1.plot()plt.savefig('./diff_1.jpg')

看起来似乎均值稳定在0左右,而且也具有一定周期性。

继续来看看二阶差分能否更平稳一些:

看起来二阶差分和一阶差分都比较稳定,肉眼难辨高下。

只用肉眼是分不清是否真的平稳的,因此,我们有必要引入数学方法对平稳进行形式化的检验。

单位根检验

单位根检验是指检验序列中是否存在单位根,因为存在单位根就是非平稳时间序列了。单位根就是指单位根过程,可以证明,序列中存在单位根过程就不平稳,会使回归分析中存在伪回归。

而迪基-福勒检验(Dickey-Fuller test)和扩展迪基-福勒检验(Augmented Dickey-Fuller test可以测试一个自回归模型是否存在单位根(unit root)。迪基-福勒检验模式是D. A迪基和W. A福勒建立的。

关于检验的详细内容,见[6],碍于公式实在太难打了,这里不再赘述。

ADF Test in Python

在python中对时间序列的建模通常使用statsmodel库,该库在我心中的科学计算库排名中长期处于垫底状态,因为早期文档实在匮乏,不过近来似有好转倾向。

在statsmodels.tsa.stattools.adfuller中可进行adf校验,一般传入一个1d 的 array like的data就行,包括list, numpy array 和 pandas series都可以作为输入,其他参数可以保留默认.

其返回值是一个tuple,格式如下:

对上面一阶差分的数据进行adf检验,可以得到如下结果:

printsm.tsa.stattools.adfuller(dta)

(-9.1916312162314355, 2.1156279593784273e-15, 12, 338, {'5%': -2.8701292813761641, '1%': -3.449846029628477, '10%': -2.5713460670144603}, 4542.1540700410897)

如何确定该序列能否平稳呢?主要看:

1%、%5、%10不同程度拒绝原假设的统计值和ADF Test result的比较,ADF Test result同时小于1%、5%、10%即说明非常好地拒绝该假设,本数据中,adf结果为-9, 小于三个level的统计值。

P-value是否非常接近0.本数据中,P-value 为 2e-15,接近0.

ADF检验的原假设是存在单位根,只要这个统计值是小于1%水平下的数字就可以极显著的拒绝原假设,认为数据平稳。注意,ADF值一般是负的,也有正的,但是它只有小于1%水平下的才能认为是及其显著的拒绝原假设。

对于ADF结果在1% 以上 5%以下的结果,也不能说不平稳,关键看检验要求是什么样子的。

但是对于本例,可以很自豪地说,数据是平稳的了。

就做了这么一点微小的工作,谢谢大家。

Reference

adf测试 python_Python时间序列平稳检验--ADF检验相关推荐

  1. 基于Python的ADF单位根检验方法——时间序列平稳检验

    目录 [隐藏] Abstract 平稳随机过程 肉眼检验 单位根检验 ADF Test in Python Reference Abstract 在ARMA/ARIMA这样的自回归模型中,模型对时间序 ...

  2. python单位根检验平稳性怎么看是否平稳_Python ADF 单位根检验 如何查看结果的实现...

    如下所示: from statsmodels.tsa.stattools import adfuller print(adfuller(data)) (-8.14089819118415, 1.028 ...

  3. R语言检验时间序列的平稳性:使用tseries包的adf.test函数实现增强的Dickey-Fuller(ADF)检验、检验时序数据是否具有均值回归特性(平稳性)、不具有均值回归特性的案例

    R语言检验时间序列的平稳性:使用tseries包的adf.test函数实现增强的Dickey-Fuller(ADF)检验.检验时序数据是否具有均值回归特性(平稳性).不具有均值回归特性的案例 目录

  4. R语言检验时间序列的平稳性:使用tseries包的adf.test函数实现增强的Dickey-Fuller(ADF)检验、检验时序数据是否具有均值回归特性(平稳性)、具有均值回归特性的案例

    R语言检验时间序列的平稳性:使用tseries包的adf.test函数实现增强的Dickey-Fuller(ADF)检验.检验时序数据是否具有均值回归特性(平稳性).具有均值回归特性的案例 目录

  5. Python进行时间序列平稳检验ADFtest(Augmented Dickey-Fuller Unit Root Test)

    Python进行时间序列平稳检验ADFtest(Augmented Dickey-Fuller Unit Root Test) ADF检验全名叫Augmented Dickey-Fuller Test ...

  6. Math之ARIMA:基于statsmodels库利用ARIMA算法对太阳黑子年数据(来自美国国家海洋和大气管理局)实现回归预测(ADF检验+LB检验+DW检验+ACF/PACF图)案例

    Math之ARIMA:基于statsmodels库利用ARIMA算法对太阳黑子年数据(来自美国国家海洋和大气管理局)实现回归预测(ADF检验+LB检验+DW检验+ACF/PACF图)案例 目录

  7. 时间序列研(part7)--单位根检验

    学习笔记,仅供参考,有错必纠 时间序列 单位根检验 单位根检验做得不好常常会把退势平稳过程误判为随机趋势非平稳过程(隐性趋势)和确定性趋势非平稳(显性趋势)过程.检验时间序列中是否含有单位根时常会碰到 ...

  8. 时间序列之协整检验(3)

    协整检验 1. 协整检验(cointegration test) 2. 常用的协整检验 3. 研究变量之间的协整关系,对研究经济问题的定量分析有着重要的意义: 5. 用Eviews代码进行协整检验 4 ...

  9. 时间序列的平稳性检验与随机性检验

    1. 时间序列的定义 1.1 什么是时间序列     在统计研究中,常用按时间顺序排列的一组随机变量X1,X2,⋯ ,Xt,⋯X _ { 1 } , X _ { 2 } , \cdots , X _ ...

最新文章

  1. 2019.04.07 装饰器介绍
  2. 《深入理解Android:卷III A》一一2.4本章小结
  3. 听说你想去大厂看妹子,带你看看字节跳动实习算法岗面试长啥样?
  4. 排序算法 | 直接选择排序,算法的图解、实现、复杂度和稳定性分析
  5. 全球 android手机排行 2013,全球Android手机性能排行 三星Note 3夺魁
  6. php检查运算是否错误,用PHP中的@运算符抑制错误
  7. 通信原理眼图画法_光纤通信链路入侵与检测技术研究综述
  8. 同济大学微型计算机原理实验报告,同济大学微机原理实验报告.doc
  9. ASP.NET开发51种常用代码
  10. 解决在IE下“JSON”未定义的有关问题
  11. WIFI密码破解技巧---简单之成功率极高
  12. warehouse提供的免费oracle学习视频
  13. 占优策略名词解释_占优策略
  14. Android USB 开发
  15. 使用 Jib 生成 Java Docker 镜像
  16. 兼容各操作系统平台的Anki选择题库模板
  17. 什么是平台架构?平台架构的用处有哪些?
  18. 2013硕士毕业生薪资待遇
  19. CAD怎么打印彩色图纸
  20. nginx重启(nginx -s reload 不建议使用,本人亲试,有时候无效)

热门文章

  1. 首届全球数字生态大会将于12月13日举办
  2. 【2517. 礼盒的最大甜蜜度】
  3. hadoop在章鱼大数据平台下的安装与配置
  4. 什么是 SSH ?你应该用过吧!
  5. C语言入门-科协招新特别版
  6. 铁轨问题(超详细讲解)
  7. 那些惊艳的算法们(三)—— 时间轮
  8. Adobe秀出十大PS新神技,个个惊艳炸裂!
  9. SPSS 方差分析 两因素 无交互项
  10. ansible剧本规范目录结构