目录

  • 前言
  • 时间序列的概述
  • 时间序列里面的基本概念
    • 均值、方差、协方差
    • 随机游走
    • 弱平稳
    • 白噪声序列

前言

这一个系列应该是博主上时间序列课程时候的笔记。这门课程对未来的研究实际上十分重要, 所以, 我决定尽量每周上完时间序列课程之后能够好好记记笔记和思路。整体的写作风格应该是我假想我要讲给某个还不懂时间序列的同学听(据费曼学习法说,好像这样的效率是最高的), 虽然整个文风看起来有些weird, 但是还是决定就这样下去吧。之后也可能会放上一些上机作业R(maybe Python)的相关的代码。受水平限制, 欢迎大家来这里捉虫。其实自己很大程度上不算是统计专业的, 所以有些用词并不严谨, 大多还是根据自己的理解来的。以上。

时间序列的概述

在统计方法的研究中,我们一般研究的data有三种类型 :

  • Crossing Data
  • Time Series Data
  • Pannel Data

在时间序列这门课程中我们研究的便是Time Series Data, 此处对Time Series Data的定义为, 一个随机变量序列{Xt,t∈T}\left\{X_t, t \in T \right\}{Xt​,t∈T}, 将其成为一个随机过程; 此处 ttt 可以理解为一个观测值在不同的时间点的取值; 例如, 湖北省的2000年~2020年的GDP的数据便是一组时间序列数据。但是在此处需要注意的是时间序列数据是针对单个不变的个体的, 只在时间上具有延展性, 在空间上并不具有延展性; 也就是说如果一组数据中, 同样承接上面所给出的例子, 2000年~2020年的数据中包含了中国各个省份、直辖市以及港澳台的GDP数据的话, 则被称之为面板数据(Pannel Data)。而截面数据(Crossing Data)则完全不涉及时间的概念, 仅仅在空间上具有延展性, 也就是指在同一个时间节点, 从总体中进行抽样的所形成的样本的数据类型。

时间序列里面的基本概念

在我们给出了时间序列的基本的定义和概念之后, 要想对时间序列进行进一步的研究的, 则需要对时间序列的特征统计量进行描述。在对特征统计量进行了定义之后我们便可以开始讨论一些时间序列分析中特有的概念。

均值、方差、协方差

首先我们对其均值进行刻画 :
μt=E(Xt),t∈T(1)\mu_t=E(X_t), t\in T \tag{1}μt​=E(Xt​),t∈T(1)

也就是说 μt\mu_tμt​ 实际上是这一个随机过程在 ttt 时刻的期望值。

在对均值进行刻画之后, 我们可以对方差以及协方差进行定义。首先我们对方差进行相关的定义:
Var(Xt)=E(Xt2)−μt2(2)Var (X_t) = E(X_t^2)-\mu_t^2 \tag{2}Var(Xt​)=E(Xt2​)−μt2​(2)

对其自协方差函数进行相关的定义:
γt,k=Cov(Xt−k,Xt)=E(Xt−kXt)−μtμs,k=0,1,2,…(3)\gamma_{t,k} = Cov(X_{t-k}, X_t) = E(X_{t-k}X_t)-\mu_t\mu_s, k = 0,1,2,\ldots\tag{3}γt,k​=Cov(Xt−k​,Xt​)=E(Xt−k​Xt​)−μt​μs​,k=0,1,2,…(3)

当 k=0k=0k=0 时不难得知, 此时的自协方差与方差相等, 也就是说, 我们在给定方差的情况下, 无论 ttt 的取值是多少, 我们的自协方差 γt,0\gamma_{t,0}γt,0​ 始终是相等的。那么此时回想相关系数的含义, 当我们通过除以标准差来消除两个随机变量之间刻画变量趋势的量纲的时候, 我们便可以得到一个非常有用的定义。给出自相关系数函数 ρt,k\rho_{t,k}ρt,k​ 的定义:
ρt,k=γt,kγt,0(4)\rho_{t,k} = \frac{\gamma_{t,k}}{\gamma_{t,0}} \tag{4}ρt,k​=γt,0​γt,k​​(4)

此时根据以上的条件,我们便能推出 ρt,k\rho_{t,k}ρt,k​ 的大小可以只由 kkk 确定。

随机游走

在传统的回归分析中的均值回归现象

传统的回归分析(一般针对截面数据)一般都是条件均值模型, 使用矩阵形式进行表达 :

E(Y∣X)=X⋅β(5)E(Y\mid X) = X\cdot \beta \tag{5}E(Y∣X)=X⋅β(5)

其中经典假定主要包含三条 : 针对解释变量与被解释变量呈现线性关系, 误差项零均值, 同方差。在这种假定之下, 我们便能够写出式(5)给出的公式; 由于其解释变量与被解释变量是线性关系, 那么使用 y^\hat{y}y^​ 来表示我们最终拟合的数据, 则 y^\hat{y}y^​ 可以被理解为一个"中心"(均值), 好像对真实的数据有一种"吸引力"一般牵引着其回到 y^\hat{y}y^​ 的位置; 假设使用单变量回归作为实例,则可以得出以下的图形, 当然这部分更多的内容还需要参考计量经济学和回归分析部分的内容。

针对时间序列则会发现这种"牵引"现象失效

令e1,e2,…e_1,e_2,\ldotse1​,e2​,…为均值为0, 且方差是σs2\sigma_s^2σs2​的独立同分布的随机变量序列, 此时考虑以下时间序列{Xt,t∈T}\left\{X_t,t\in T\right\}{Xt​,t∈T}, 假设Xt=Xt−1+etX_t=X_{t-1}+e_tXt​=Xt−1​+et​; 则有以下推导, 此时不妨先假设X0=0X_0=0X0​=0 :

{X0=0X1=e1X2=X1+e2⋮Xt=Xt−1+et(6)\begin{cases} X_0=0\\ X_1 = e_1\\ X_2= X_1+e_2\\ \vdots\\ X_t=X_{t-1}+e_t \end{cases} \tag{6}⎩⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎧​X0​=0X1​=e1​X2​=X1​+e2​⋮Xt​=Xt−1​+et​​(6)

根据该式我们不难得到以下结论 :

E(Xt)=0(7)E(X_t)=0 \tag{7} E(Xt​)=0(7)Var(Xt)=∑iσs2=t⋅σs2(8)Var(X_t)=\sum_i \sigma_s^2 = t\cdot \sigma_s^2\tag{8} Var(Xt​)=i∑​σs2​=t⋅σs2​(8)

虽然均值仍然不发生改变, 但是随着时间的增加方差也不断增加, 最终变得越来越大, 也就是说, 此时均值的"牵引力"也会越来越弱, 此时如果使用图形来进行表示可以表示为下图, 通过分析下图可以发现下图的相关的内容呈现喇叭口状。


这个时候发现没有回归均值的趋势, 因为其方差在不断增大。也就是说方差的大小就像一条绳子的长短, 当方差大时,绳子便长, 则其可能偏离均值就越远; 当然从另外一个角度来理解, 方差大小代表了其偏离均值远近的可能性, 方差越小, 偏离越远的可能性越小, 当然也有可能偏离很远, 但是在统计中, 对于小概率事件通常认为是不可能发生的。那么既然方差越来越大, 则很多问题的不确定性将会越来越大, 这对于统计研究中将会成为一大难点。

谬误回归

此处采用古扎拉蒂版计量经济学中的例子, 考虑两个随机游走模型Xt,YtX_t, Y_tXt​,Yt​ :

Xt=Xt−1+et0(9)X_t= X_{t-1}+e_t^0 \tag{9}Xt​=Xt−1​+et0​(9)

Yt=Yt−1+et1(10)Y_t= Y_{t-1}+e_t^1\tag{10}Yt​=Yt−1​+et1​(10)

此时对这两段序列(具有500个样本)进行回归会得到如下的结果, 发现对系数进行t检验是显著的, 但是从实际意义上来看, 这两段序列不应该有任何关系, 所以从这个例子可以发现, 这样做容易产生谬误, 这种现象。

Dependent variable:
Yt
Xt -0.682***
(0.074)
Constant -13.272***
(0.416)
Observations 500
R2 0.144
Residual Std. Error 8.315 (df = 498)
F Statistic 83.813*** (df = 1; 498)
Note: *p<0.1; **p<0.05; ***p<0.01

弱平稳

从上面的讨论当中, 我们如果想要研究时间序列的话, 必须对序列的性质进行一些假定, 否则很容易出现所谓的谬误回归现象。在确定了我们能够研究什么样性质的序列之后, 我们即使在现实生活中没有找到这样的序列, 但是我们同样可以通过一些变换(很多时间序列的变换应该是差分)来达到我们研究某种现象的目的。

所以, 为了达到我们能够研究的目的, 我们对时间序列的性质作如下的规定:

  • 均值在时间上为常数
  • 对任意的t,k有γt,k=γ0,kt,k有\gamma_{t,k}=\gamma_{0,k}t,k有γt,k​=γ0,k​

第二条性质实际上是在说任意时刻的方差相等, 以及自相关系数的大小仅仅与滞后的阶数有关。

满足以上两条性质, 可以将该序列称之为弱平稳序列, 那么对于弱平稳序列, 可以将滞后k阶的自协方差以及自相关系数分别写作: γk,ρk\gamma_k,\rho_kγk​,ρk​。

白噪声序列

可以看出来, 弱平稳序列能够解决掉随机游走序列中的方差无限增大, 最后以至于出现伪回归现象的问题。白噪声序列则是可以看做是在弱平稳概念上的一个加强的版本; 在回归分析中, 方程所包含的误差项就算是一种白噪声, 这种噪声是可以看做是对研究时间序列的变化趋势时是无害或者是可控的, 所以出将白噪声定义为: 零均值独立同分布的随机变量序列, 亦即回归分析中的经典假设; 值得一提的是即便模型的方差很大(R方很小), 但在经典假设的体系中, 模型仍然对现象具有解释意义, 只是解释的程度有所区别罢了。在时间序列中,其实思路应该和回归分析很相近, 主要都是为了得到白噪声这样的误差序列, 这样便能够进行统计推断, 将误差把握住, 同时使最终的模型对现象具有解释意义。

时间序列分析系列(一) : 基本概念相关推荐

  1. spss入门——简单的数据预处理到时间序列分析系列(七)

    spss数据预处理到时间序列分析 (七)预测 呼~,终于到了我们的这个系列的结尾了,预测2016的数据!! 应用所建立的模型分析预测2016的数据(原因:数据为编撰的,只到2015年) 操作完以后到了 ...

  2. spss入门——简单的数据预处理到时间序列分析系列(四)

    简单的数据预处理到时间序列分析 spss数据预处理到时间序列分析 (四)曲线拟合 在数据插补之前一定要找找数据的变化趋势,通常数据拟合就是一个较好的方案. 散点进行曲线拟合的方法 根据前面所画散点图, ...

  3. spss入门——简单的数据预处理到时间序列分析系列(二)

    简单的数据预处理到时间序列分析 spss数据预处理到时间序列分析 (二)时间变量生成及绘制散点图 时隔这么久终于又和大家见面了( ̄▽ ̄)~*,咱们继续我们的内容 在完成数据导入后,就可以开始下一步的准 ...

  4. matlab估计arma残差,写给你的金融时间序列分析:补完篇

    摘要 本文介绍时间序列分析中的 GARCH 模型,阐述使用 mean model 和 volatility model 对收益率序列联合建模的方法. 1 引言 之前,我们推出了<写给你的时间序列 ...

  5. 时间序列分析|基本概念

    目录 时间序列与时间序列分析 时间序列分析基本概念 经典例子 参考文献 此乃时间序列分析专栏开篇之作,旨在介绍时间序列分析的现实背景和一些基本概念,并在最后看一个典型例子. 时间序列与时间序列分析 日 ...

  6. rocketmq同步发送超时时间_RocketMQ系列(一)基本概念

    RocketMQ系列(一)基本概念 RocketMQ是阿里出品的一款开源的消息中间件,让其声名大噪的就是它的事务消息的功能.在企业中,消息中间件选择使用RocketMQ的还是挺多的,这一系列的文章都是 ...

  7. 语言时间序列年月日_R语言系列 时间序列分析

    [免责声明:本文用于教学] 时间序列分析 基础操作 数据输入 d <- c(10,15,10,10,12,10,7,7,10,14,8,17,14,18,3,9,11,10,6,12,14,10 ...

  8. 时间序列分析中 5 个必须了解的术语和概念

    时间序列是按时间排序的一系列观察或测量. 在谈论时间序列时,首先想到通常是股票价格. 其实时间序列无处不在,一个地理位置的年降雨量.超市产品的日销售额.工厂的月耗电量.化学过程的每小时测量值都是时间序 ...

  9. 为什么印度盛产码农_印度农产品价格的时间序列分析

    为什么印度盛产码农 Agriculture is at the center of Indian economy and any major change in the sector leads to ...

  10. 浅尝辄止_数学建模(笔记_时间序列分析及其SPSS实现)

    本文多是广泛的概念和SPSS运用,没有具体的推导过程和深入的探究 文章目录 一.时间序列分析 1.具体步骤: 二.基本知识 1.时间序列数据 2.时间序列的基本概念 3.时间序列分解 4.叠加模型和乘 ...

最新文章

  1. np.trapz 生动的解释
  2. tar: bzip2:无法 exec: 没有那个文件或目录
  3. dlopen函数的用法
  4. 老赖名下无财产,可以执行老赖子女名下的财产吗?
  5. sip消息概念(一)
  6. Python极其简易音乐播放器
  7. 修改MYSQL数据库表的字符集
  8. 数据库中多表连接的左连接、右连接、内连接、全连接的使用场景
  9. 梶田秀司 仿人机器人学习笔记(一)书本第一章
  10. volume的含义_volume是什么意思
  11. qt安装报错:下载“http://download.qt.io/online/xxxxx/_meta.7z“server replied: Bad Gateway出现网络错误
  12. 帝国cms 留言反馈 问题
  13. Ubuntu18右上角输入法图标突然消失,而且无法输入中文
  14. OpenLayers风场图
  15. 【Ajax】form表单
  16. 黑客攻击的几种常用手法
  17. 数据分析 --- 五力模型 VS PEST(分析模型)VS SWOT分析法
  18. 为什么要降息--关于双降(转)
  19. hp服务器硬盘离线改在线,HP服务器硬盘不在线数据恢复案例分析
  20. 第一次链接出租房的宽带弹出上网公告

热门文章

  1. 电脑W7系统怎样安装鸿蒙系统,真正纯净版的win7系统
  2. java操作seaweedfs
  3. JAVA 异或校验byte数组
  4. C语言 编写加密程序,将用户输入的一个英文句子加密为加密字符串,然后输出加密字符串。
  5. 3DMAX导出网格顶点切向量
  6. 【重要】股票收益互换
  7. STM32--舵机(SG90)
  8. [附源码]java毕业设计卡通动漫商城系统
  9. 编写一个链表结构关于车的属性,读取任意多辆车的车型、车牌号、外形颜色、价钱输入。之后遍历链表,再将链表数据打印出来。
  10. matlab四大取整函数fix,floor,ceil,round