《时间序列分析——基于R》王燕,读书笔记

笔记:

一、检验:
1、平稳性检验:
  • 图检验方法:

时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列
自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加,平稳序列的自相关系数ρ会很快地衰减向0(指数级衰减),反之非平稳序列衰减速度会比较慢
  • 构造检验统计量进行假设检验:单位根检验adfTest()——fUnitRoots包
2、纯随机性检验、白噪声检验(Box.test(data,type,lag=n)——lag表示输出滞后n阶的白噪声检验统计量,默认为滞后1阶的检验统计量结果)

1、Q统计量:type=“Box-Pierce”
2、LB统计量:type=“Ljung-Box”
二、模型
1、ARMA平稳序列模型

1.1平稳性检验
1.2ARMA的p、q定阶——acf(),pacf(),auto.arima()自动定阶
1.3建模arima()
1.4模型显著性检验:残差的白噪声检验Box.test();参数显著性检验t分布
2、非平稳确定性分析
2.1趋势拟合:直线、曲线(一般是多项式,还有其它函数)
2.2平滑法
  • 移动平均法:SMA()——TTR包
  • 指数平滑法:HoltWinters()
3、非平稳随机性分析
3.1ARIMA

1平稳性检验,差分运算
2拟合ARMA
3白噪声检验
3.2疏系数模型arima(p,d,f)
3.3季节模型
可以叠加的模型
4、残差自回归模型:

4.1建立线性模型
4.2对滞后的因变量间拟合线性模型,对模型做残差自相关DW检验。dwtest()——lmtest包,增加选项order.by指定延迟因变量
4.3对残差建立ARIMA模型
5、条件异方差模型:异方差检验:LM检验ArchTest()——FinTS包,用ARCH、GARCH模型建模

第一章 简介

  • 统计时序分析方法:
1、频域分析方法
2、时域分析方法
  • 步骤:
1、观察序列特征
2、根据序列特征选择模型
3、确定模型的口径
4、检验模型,优化模型
5、推断序列其它统计性质或预测序列将来的发展
  • 时域分析研究的发展方向:
1、AR,MA,ARMA,ARIMA(Box-Jenkins模型)
2、异方差场合:ARCH,GARCH等(计量经济学)
3、多变量场合:“变量是平稳”不再是必需条件,协整理论
3、非线性场合:门限自回归模型,马尔科夫转移模型

第二章 时间序列的预处理

预处理内容:对它的平稳性和纯随机性进行检验,最好是平稳非白噪声的序列
1、特征统计量
1.1概率分布分布函数或密度函数能够完整地描述一个随机变量的统计特征,同样一个随机变量族{Xt}的统计特性也完全由它们的联合分布函数或联合密度函数决定。
1.2特征统计量:
  • 均值Ex
  • 方差σ2
  • 自协方差函数(γ)和自相关系数(ρ):比较的是1个事件不同时期之间的相互影响程度
2、平稳的时间序列
2.1定义
  • 严平稳:随机变量族的统计性质完全有它们的联合概率分布族决定,若任意的t下的联合概率分布族相等,则认为该序列是严平稳的
  • 宽平稳:统计性质主要由它的低阶矩决定:
1)Ex2<无穷
2)均值为常数:Ex=μ(μ为常数)
3)自协方差和自相关系数只依赖于时间的平移长度而与时间的起止点无关
满足以上3点则称为宽平稳时间序列(弱平稳或者二阶平稳)
例子:正态分布
一般满足宽平稳就称作平稳序列,当宽平稳序列服从多元正态分布时,二阶平稳可以推出严平稳。
2.2性质
1)均值为常数:Ex=μ(μ为常数)
2)自协方差和自相关系数只依赖于时间的平移长度而与时间的起止点无关
自相关系数满足相关性系数的3性质:规范性、对称性和非负定性
一个平稳时间序列一定唯一决定它的自相关函数,一个自相关函数未必唯一对应一个平稳时间序列
3、时序图与自相关图
1)时序图:横轴为时间,纵轴为序列取值
2)自相关图:横轴为延期时期数,纵轴为自相关系数
4、平稳性检验
图检验方法
  • 时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列
  • 自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加,平稳序列的自相关系数ρ会很快地衰减向0,反之非平稳序列衰减速度会比较慢
构造检验统计量进行假设检验:单位根检验P205
5、纯随机序列——白噪声
5.1定义
1)Ex=μ(μ为常数)
2)自相关系数γ为0(t!=s),或为σ2(t=s)
在平稳序列中,如果序列值之间没有任何相关性,即一个没有记忆的序列满足以上2个条件,这种序列称为纯随机序列,也称为白噪声序列。记为X~WN(μ,σ2),这是一种最简单的平稳序列。:比如:标准正态分布
5.2性质
1)纯随机序列各项之间没有任何关联,γ=0,随机事件呈现出纯随机波动的特征,就认为该随机事件没有包含任何值得提取的有用信息。
2)方差齐性:序列中每个方差都相等为σ2
5.3纯随机性检验(Box.test(data,type,lag=n)——lag表示输出滞后n阶的白噪声检验统计量,默认为滞后1阶的检验统计量结果)
1、Q统计量:type=“Box-Pierce”
2、LB统计量:type=“Ljung-Box”
  • 平稳序列通常具有短期相关性,若序列之间存在显著的相关关系,通常只存在于延迟时期比较短的序列值之间,因此lag不用全部进行延迟检验。

第三章 平稳时间序列分析——ARMA

1、差分运算
1)p阶差分:p-1阶差分后序列再进行一次1阶差分运算成为p阶差分运算
2)k步差分:相距k期的两个序列值之间的减法运算称为k步差分运算
2、延迟算子:将当前序列值乘以一个延迟算子,即把当前序列值的时间向过去拨一个时刻,记B为延迟算子,则有:
xt-1=B*xt
xt-2=B2*xt
...
xt-p=Bp*xt
用延迟算子表示差分运算:
1)p阶差分:(1-B)pxt
2)k步差分:(1-Bk)xt
3、线性差分方程:zt+a1zt-1+a2zt-2+...+apzt-p=h(t)(p>=1)
  • 齐次线性差分方程:h(t)=0
  • 非齐次线性差分方程:
4、ARMA模型——自回归移动平均模型
1、AR模型
2、MA模型
3、ARMA模型:适用于平稳白噪声序列
平稳序列建模步骤:P72
1)求出该观察值序列的样本相关系数(ACF)和样本偏相关系数(PACF)
2)选择ARMA(p,q)的参数p和q,进行拟合:自动定阶参数auto.arima()——需要zoo包和forecast包P79
3)检验模型的有效性:模型显著性检验(残差序列应该为白噪声序列)和参数显著性检验
4)多建立几个拟合模型,选择最优模型
5)预测forecast()——需要forecast包P100
第四章 非平稳序列——确定性时序分析
4.1非平稳时序的分解:
1)Wold分解定理:对于任何一个离散平稳过程{xt},它都可以分解为两个不相关的平稳序列之和,其中一个为确定性的,另一个为随机性的。
2)Cramer分解定理:任何一个时间序列{xt}都可以分解为两部分的叠加,其中一部分是由多项式决定的确定性趋势成分,另一个是平稳的0均值误差成分
4.2确定性因素分解
  • 四大类因素:
1)长期趋势
2)循环波动
3)季节性变化
4)随机波动
  • 相互作用模式
1)加法模型
2)乘法模型
  • 目标
1)克服其它因素影响,单纯测度某一个确定性因素的(长期趋势或季节效应)
2)推断出各种确定性因素彼此之间的相互作用关系以及它们对序列的综合影响
  • 局限

1)确定性因素分解方法只能提取强劲的确定性信息,对随机性信息浪费严重

2)确定性因素分解方法把所有序列的变化都归结为四因素的综合影响,却始终无法提供明确、有效的方法判断各大因素之间确切的作用关系
4.3趋势分析
  • 趋势拟合法
线性拟合:lm()
曲线拟合:lm或nls,二次型,指数型。。。
  • 平滑法
移动平均法:SMA()——TTR包
指数平滑法:HoltWinters()
4.4季节效应分析:构造季节指数S=季节平均数/总平均数
4.5综合分析decompose()

第五章 非平稳序列——随机时序分析

5.1差分运算:确定信息提取:diff(x,lag,differences)——lag为差分的步长,默认1;differences为差分次数,默认为1
  • 线性趋势,1阶差分就可以实现趋势平稳
  • 曲线趋势,低阶(2阶或3阶)差分就可以提取曲线趋势的影响
  • 周期序列,步长为周期长度的差分运算
  • 综合:趋势+周期的序列——1阶差分去掉线性趋势,在1阶差分的基础上进行12步差分去掉年为单位的周期影响(季节波动)
过差分现象:过多次数的差分导致有效信息的无谓浪费而降低了估计的精度。检测方法是在计算方差,若高阶差分序列的方差大于低阶,则可能是过差分现象
5.2 ARIMA模型——差分运算与ARMA模型的组合
例子:随机游走模型(有效市场理论核心):从起始点找醉汉
性质:平稳性方差齐性
  • ARIMA模型
  • 梳系数模型:模型中有部分自相关系数或平滑系数为0(将自相关较小的阶数的系数设置为0,其它大于2D的系数为NA)
  • 季节模型(加法,乘积)
差分方法
  • 优点:对确定性信息的提取比较充分
  • 局限:很难对模型进行直观解释
自相关:
5.3残差自回归模型:用确定性因素提取序列中主要的确定性信息,检验残差序列的自相关性,若自相关性显著,可以考虑对残差序列拟合自回归模型P163(模型的残差再建模型!)
残差自相关检验:Durbin-Watson(DW)检验-->dwtest()——lmtest包
Durbin h检验:dwtest()——lmtest包,增加选项order.by指定延迟因变量
异方差:
5.4异方差情况:随机误差序列的方差不再是常数,它会随着时间的变化而变化
5.5方差齐性变换:对于标准差与水平成正比的异方差序列,对数变换可以有效地实现方差齐性。P174
5.6条件异方差模型(波动信息)
集群效应:在消除确定性平稳因素的影响之后,残差序列的波动在大部分时段是平稳的,但会在某些时段波动持续偏大,在某些时段波动持续偏小。
ARCH模型——自回归条件异方差模型:只适用于异方差短期自相关过程
ARCH检验P179
  • 拉格朗日乘子检验(LM检验)ArchTest()——FinTS包
  • PortmanteauQ检验:对残差平方序列进行纯随机性检验Box.test()
GARCH模型:在ARCH模型中增加考虑了异方差函数的p阶自相关性而形成的,可以有效地拟合据有长期记忆性的异方差函数

第六章 多元时间序列分析

6.3单位根检验P211:adfTest()——fUnitRoots包
DF检验
  • type=“nc”:无常数均值,无趋势类型
  • type=“c”:有常数均值,无趋势类型
  • type=“ct”:有常数均值,又有趋势类型
非平稳3大类型:
1、无漂移项自回归(不带漂移项的差分平稳序列,DS序列):均值序列非平稳,方差非齐(随机游走模型)
2、带漂移项自回归(带漂移项的差分平稳序列):有趋势且波动性不断增强的非平稳序列
3、带趋势回归(趋势平稳序列,TS):最好通过线性拟合提取序列相关关系,使残差序列平稳
ADF检验:
6.4协整:两个非平稳序列之间具有稳定的线性关系

转载于:https://www.cnblogs.com/wwwwwei/p/10921707.html

【转】时间序列分析——基于R,王燕相关推荐

  1. 时间序列分析——基于R 王燕 版本 复习整理

    目录 1.时间序列分析 时间序列的定义: 两种时间序列的分析方法: (1)描述性时序分析 (2)统计时序分析 2.时间序列的预处理 平稳性检验 纯随机性检验(白噪声检验) 3.平稳时间序列分析 方法性 ...

  2. 时间序列分析——基于R | 第2章 时间序列的预处理习题代码

    时间序列分析--基于R | 第2章 时间序列的预处理习题 1.考虑序列{1,2,3,4,5,-,20} 1.1判断该序列是否平稳 x <- seq(1,20);x ## [1] 1 2 3 4 ...

  3. 时间序列分析——基于R语言案例数据课后数据

    去这个www.crup.com.cn网址搜,里面全都有.免费的.

  4. 《应用时间序列分析:R软件陪同》——1.5 习题

    本节书摘来自华章计算机<应用时间序列分析:R软件陪同>一书中的第1章,第1.5节,作者:吴喜之,刘苗著, 更多章节内容可以访问云栖社区"华章计算机"公众号查看. 1.5 ...

  5. 《应用时间序列分析:R软件陪同》——2.3 随机游走

    本节书摘来自华章计算机<应用时间序列分析:R软件陪同>一书中的第2章,第2.3节,作者:吴喜之,刘苗著, 更多章节内容可以访问云栖社区"华章计算机"公众号查看.

  6. 《应用时间序列分析:R软件陪同》——导读

    ** 前言 ** 首先,一些教材偏重于数学理论和推导.作者多为数学出身,他们习惯于数学的严格性和导出精确而又漂亮的数学结论.这些书适用于那些愿意为时间序列的数学理论研究做出贡献的读者. 其次,国内教材 ...

  7. 时间序列分析之AR模型、MA模型和ARMA模型(二)

    此学习笔记来自于王燕老师编著的<时间序列分析-基于R> 对一个时间序列预处理后检验出该序列为平稳时间序列说明该模型有提取信息的价值,就要进行下一步的模型建立来拟合该模型然后做出预测.下面介 ...

  8. 时间序列分析基础总结

    文章目录 时序的一些基本定义 特征统计量 平稳序列 平稳时间序列的统计性质 平稳时间序列的检验 白噪声序列 白噪声序列的性质 白噪声检验(纯随机性检验) 时间序列预处理 平稳序列建模 计算样本自相关系 ...

  9. 机器学习(二十一)——Optimizer, 单分类SVM多分类SVM, 时间序列分析

    http://antkillerfarm.github.io/ Optimizer 在<机器学习(一)>中,我们已经指出梯度下降是解决凸优化问题的一般方法.而如何更有效率的梯度下降,就是本 ...

最新文章

  1. Qt Creator常问问题FAQ
  2. 使用HANA Web-based Development Workbench创建最简单的Server Side JavaScript
  3. 《认清C++语言》のrandom_shuffle()和transform()算法
  4. .NET Core下使用gRpc公开服务(SSL/TLS)
  5. python 货币合适_算法之Python实现 - 001 : 换钱的最少货币数
  6. 语料库语言学及python实现 李安 山东大学_语料库语言学
  7. 使用adb命令获取手机ip地址
  8. python连连看小游戏_python之自动化连连看脚本-第一关不动-小记
  9. 几款款UI在线设计软件,办公必备
  10. 【杂篇 · 虚拟机】win11安装虚拟机
  11. Kali安装谷歌拼音
  12. 2021辽宁省大学生程序设计竞赛 C D E F G I L
  13. 使用dom4j来解析xml文件或xml字符串
  14. nodejs前端+后端
  15. python画抛物线_在python中利用最小二乘拟合二次抛物线函数的方法
  16. WiFiAp探究实录--功能实现与源码分析
  17. python for循环与函数
  18. kafka+flume 实时数据处理
  19. PC 时代 Office 的仇,WPS 在 24 年后有机会报了
  20. 分类性能度量指标:ROC曲线、AUC值、正确率、召回率、敏感度、特异度

热门文章

  1. 教程:创建简单的 ETL 包
  2. 搜索引擎优化不是网页标签优化
  3. Maven项目依赖管理工具
  4. vue中render: h = h(App)的详细解释
  5. kafka入门之broker--日志存储设计
  6. git移除某文件夹的版本控制
  7. Android多线程源码学习笔记一:handler、looper、message、messageQueue
  8. Spring的HelloWorld
  9. 一个物理学家学习Windows编程的感受
  10. 论面向对象方法与软件复用关系-z