文章目录

  • 时间序列模型
    • 时间序列介绍
    • 模型设定
    • 模型假设
    • 趋势和季节性
      • 描述有趋势的时间序列
      • 含时间趋势的回归
      • 描述有季节性的时间序列
      • 含季节性的回归

时间序列模型

时间序列介绍

在介绍随机误差项的序列相关问题的时候,我们简单引入了时间序列的相关概念,但在本质上,序列相关问题仍然是基于计量经济学经典假设的条件下所展开的研究内容,并没有体现出时间序列数据所独有的一系列特征。从这一节开始,我们进入时间序列模型的讨论。

时间序列数据指的是一系列以时间为顺序的随机变量 { ⋯ , X 1 , X 2 , ⋯ , X t , ⋯ } \{\cdots,X_1,X_2,\cdots,X_t,\cdots\} {⋯,X1​,X2​,⋯,Xt​,⋯} ,即 { X t , t ∈ T } \{X_t,\,t\in T\} {Xt​,t∈T} 。这些随机变量可能是连续的,也可能是离散的。我们所观测到的只是这些随机变量在每一个时点的观测值。

任何时间序列经过合理的函数变换后都可以被认为是由三个部分叠加而成的:趋势项部分、周期项部分和随机噪声项部分。
X t = T t + S t + R t , t = 1 , 2 , ⋯ X_t=T_t+S_t+R_t \ , \ \ \ \ t=1,2,\cdots Xt​=Tt​+St​+Rt​ ,    t=1,2,⋯
时间序列在适当的去掉趋势项和季节项后,剩下的随机部分通常会有某种平稳性。带有平稳性的时间序列是时间序列分析研究的重点。

模型设定

我们先将截面数据模型“改造”为时间序列模型。在截面数据中,我们认为每一个下角标 i i i 都表示一次样本观测。事实上,只要我们按照时间的顺序观测得到样本,并用时间 t t t 代替下角标 i i i ,就可以建立一个时间序列模型。在这样的模型设定下,主要包括两种时间序列模型:

静态模型:
Y t = β 0 + β 1 X t 1 + . . . + β k X t k + u t , Y_t=\beta_0+\beta_1X_{t1}+...+\beta_kX_{tk}+u_t \ , Yt​=β0​+β1​Xt1​+...+βk​Xtk​+ut​ ,
有限分布滞后模型 (FDL) :

单个解释变量的情况
Y t = β 0 + δ 0 X t + δ 1 X t − 1 + . . . + δ k X t − k + u t , Y_t=\beta_0+\delta_0X_t+\delta_1X_{t-1}+...+\delta_kX_{t-k}+u_t \ , Yt​=β0​+δ0​Xt​+δ1​Xt−1​+...+δk​Xt−k​+ut​ ,
多个解释变量的情况(以二元为例)
Y t = β 0 + δ 0 X t , 1 + . . . + δ k X t − k , 1 + γ 0 X t 2 + . . . + γ k X t − k , 2 + u t . Y_t=\beta_0+\delta_0X_{t,1}+...+\delta_kX_{t-k,1}+\gamma_0X_{t2}+...+\gamma_kX_{t-k,2}+u_t \ . Yt​=β0​+δ0​Xt,1​+...+δk​Xt−k,1​+γ0​Xt2​+...+γk​Xt−k,2​+ut​ .

模型假设

由于时间序列数据在小样本下容易表现出一些和截面数据不同的特征,所以我们需要对截面分析中所做的假定加以修改。

TS.1 线性于参数

随机过程 { ( X t 1 , X t 2 , ⋯ , X t k , Y t ) : t = 1 , 2 , ⋯ , T } \{(X_{t1},X_{t2},\cdots,X_{tk},Y_t):t=1,2,\cdots,T\} {(Xt1​,Xt2​,⋯,Xtk​,Yt​):t=1,2,⋯,T} 服从线性模型
Y t = β 0 + β 1 X t 1 + β 2 X t 2 + . . . + β k X t k + u t , Y_t=\beta_0+\beta_1X_{t1}+\beta_2X_{t2}+...+\beta_kX_{tk}+u_t \ , Yt​=β0​+β1​Xt1​+β2​Xt2​+...+βk​Xtk​+ut​ ,

其中 { u t : t = 1 , 2 , ⋯ , T } \{u_t:t=1,2,\cdots,T\} {ut​:t=1,2,⋯,T} 是随机误差项, T T T 是观测次数(时期数)。

本质上,假定 TS.1 等同于假定 MLR.1 ,但是在时间序列数据中,我们可以将某个解释变量或被解释变量的滞后项作为模型的解释变量,例如: X t 1 = Z t , X t 2 = Z t − 1 , X t 3 = Z t − 2 X_{t1}=Z_t,\,X_{t2}=Z_{t-1},\,X_{t3}=Z_{t-2} Xt1​=Zt​,Xt2​=Zt−1​,Xt3​=Zt−2​ 等。

TS.2 不存在完全共线性

在样本中(时间序列过程中),没有任何自变量是恒定不变的,或者是其他自变量的一个完全线性组合。

不存在完全共线性的问题对时间序列数据而言在本质上和截面数据是一样的。事实上,时间序列的解释变量之间产生统计意义上的相关性是很常见的,但我们的底线是保证 OLS 能够正常估计,因此不容许样本中出现完全相关。

TS.3 零条件均值

对每一个 t t t ,给定所有时期的解释变量,误差项 u t u_t ut​ 的期望值为 0 0 0 。
E ( u t ∣ X ) = 0 , t = 1 , 2 , ⋯ , T , {\rm E}(u_t|\boldsymbol{X})=0 \ , \ \ \ \ t=1,2,\cdots,T \ , E(ut​∣X)=0 ,    t=1,2,⋯,T ,

X = ( X t 1 , X t 2 , . . . , X t k ) ∣ t = 1 T . \boldsymbol{X}=\left(X_{t1},X_{t2},...,X_{tk}\right)\big|_{\,t=1}^{\,T}\ . X=(Xt1​,Xt2​,...,Xtk​)∣∣​t=1T​ .

这里的 X \boldsymbol{X} X 是一个 T × k T\times k T×k 的矩阵。这是一个关键的假定,我们先解释两个概念:

  • 严格外生: t t t 时期的误差项 u t u_t ut​ 与每个时期的任何解释变量都无关。

  • 同期外生: E ( u t ∣ X t 1 , . . . , X t k ) = 0 {\rm E}(u_t|X_{t1},...,X_{tk})=0 E(ut​∣Xt1​,...,Xtk​)=0

假定 TS.3 不仅仅要求同期外生,解释变量必须是严格外生的。在统计性质上,同期外生条件下,OLS 估计量一致;严格外生条件下,OLS 估计量无偏。这一点我们不作证明。

TS.4 同方差性

以 X \boldsymbol{X} X 为条件,在所有时期 t t t , u t u_t ut​ 的方差都相等:
V a r ( u t ∣ X ) = V a r ( u t ) = σ 2 , t = 1 , 2 , ⋯ , T , {\rm Var}(u_t|\boldsymbol{X})={\rm Var}(u_t)=\sigma^2 \ , \ \ \ \ t=1,2,\cdots,T \ , Var(ut​∣X)=Var(ut​)=σ2 ,    t=1,2,⋯,T ,

X = ( X t 1 , X t 2 , . . . , X t k ) ∣ t = 1 T . \boldsymbol{X}=\left(X_{t1},X_{t2},...,X_{tk}\right)\big|_{\,t=1}^{\,T}\ . X=(Xt1​,Xt2​,...,Xtk​)∣∣​t=1T​ .

这个假定意味着 V a r ( u t ∣ X ) {\rm Var}(u_t|\boldsymbol{X}) Var(ut​∣X) 不能依赖于 X \boldsymbol{X} X ,而且 V a r ( u t ) {\rm Var}(u_t) Var(ut​) 在所有时期都保持不变。当假定 TS.4 不成立时,我们称误差是异方差的。

TS.5 无序列相关

以 X \boldsymbol{X} X 为条件,任意两个不同时期的误差都不相关:
C o r r ( u t , u s ∣ X ) = 0 , ∀ t ≠ s . {\rm Corr}(u_t,\,u_s|\boldsymbol{X})=0 \ , \ \ \ \ \forall t\neq s \ . Corr(ut​,us​∣X)=0 ,    ∀t​=s .

事实上,当这个假定不成立时的情况我们已经在上一节笔记中讨论过。但我们需要思考一个这样一个问题:为什么在截面数据中不假定随机误差项是序列无关的呢?答案在于随机抽样的假定:当抽样时随机的时候,对于任意两次观测 i i i 和 j j j , u i u_i ui​ 和 u j u_j uj​ 是相互独立的。但在时间序列的数据中,每一个时间节点的观测值只有一个,不能做到真正意义上的随机抽样,因此也无法保证误差项之间没有相关关系,所以在这里做出这个假定。

TS.6 正态性

误差 u t u_t ut​ 独立于 X \boldsymbol{X} X ,且具有独立同分布的
u t ∼ N ( 0 , σ 2 ) . u_t\sim N(0,\,\sigma^2) \ . ut​∼N(0,σ2) .

在正态性假定下,我们可以进行统计推断。

定理总结

在假定 TS.1 至 TS.3 下,以 X \boldsymbol{X} X 为条件,OLS 估计量是无偏的
E ( β ^ j ) = β j , j = 0 , 1 , 2 , ⋯ , k . {\rm E}(\hat\beta_j)=\beta_j \ , \ \ \ \ j=0,1,2,\cdots,k \ . E(β^​j​)=βj​ ,    j=0,1,2,⋯,k .
在时间序列高斯-马尔科夫假定 TS.1 至 TS.5 下,以 X \boldsymbol{X} X 为条件, β ^ j \hat\beta_j β^​j​ 的条件方差为
V a r ( β ^ j ∣ X ) = σ 2 S S T j ( 1 − R j 2 ) , {\rm Var}(\hat\beta_j|\boldsymbol{X})=\frac{\sigma^2}{{\rm SST}_j(1-R_j^2)} \ , Var(β^​j​∣X)=SSTj​(1−Rj2​)σ2​ ,

其中, S S T j {\rm SST}_j SSTj​ 是 X t j X_{tj} Xtj​ 的总平方和, R j 2 R_j^2 Rj2​ 是 X j X_j Xj​ 对其他所有解释变量回归得到的可决系数。

在时间序列高斯-马尔科夫假定 TS.1 至 TS.5 下,以 X \boldsymbol{X} X 为条件,OLS 估计量是最佳线性无偏估计量。另外,误差方差估计量也是无偏的估计量。

趋势和季节性

之前我们提到过,时间序列数据可以被认为是由趋势项部分、周期项部分和随机噪声项部分叠加而成。接下来我们讨论一下带有趋势项和季节项的时间序列如何处理。

描述有趋势的时间序列

很多经济时间序列都有随着时间而上升的共同趋势,为了能用时间序列数据做出正确的因果推断,我们必须将包含时间趋势的部分分离出来,从而避免认为一个变量的趋势性变化是由另一个变量的变化所致。以简单回归模型为例,我们常见的描述有趋势行为的统计模型如下所示:

线性时间趋势
Y t = α 0 + α 1 t + ε t , Y_t=\alpha_0+\alpha_1t+\varepsilon_t \ , Yt​=α0​+α1​t+εt​ ,
其中, ε t \varepsilon_t εt​ 是独立同分布序列且 E ( ε t ) = 0 , V a r ( ε t ) = σ 2 {\rm E}(\varepsilon_t)=0,\,{\rm Var}(\varepsilon_t)=\sigma^2 E(εt​)=0,Var(εt​)=σ2 。

二次时间趋势
Y t = α 0 + α 1 t + α 2 t 2 + ε t , Y_t=\alpha_0+\alpha_1t+\alpha_2t^2+\varepsilon_t \ , Yt​=α0​+α1​t+α2​t2+εt​ ,
指数时间趋势
log ⁡ ( Y t ) = β 0 + β 1 t + ε t . \log(Y_t)=\beta_0+\beta_1t+\varepsilon_t \ . log(Yt​)=β0​+β1​t+εt​ .

含时间趋势的回归

在回归分析中引入有趋势的解释变量并不困难,因为趋势变量并不一定违背经典假设。很多时候,某些无法观测的趋势因素有可能既影响被解释变量 Y t Y_t Yt​ ,又影响解释变量 X t X_t Xt​ ,此时引入趋势项就是十分必要的操作,其目的在于消除伪回归问题。关于伪回归问题我们下一节再讨论,这里我们有两种常用的含时间趋势的回归方式。

直接回归

第一种方法是直接将趋势项 t t t 作为解释变量引入回归模型,以二元模型为例:
Y t = β 0 + β 1 X t 1 + β 2 X t 2 + β 3 t + u t , Y_t=\beta_0+\beta_1X_{t1}+\beta_2X_{t2}+\beta_3t+u_t \ , Yt​=β0​+β1​Xt1​+β2​Xt2​+β3​t+ut​ ,
这里可以理解为解释变量 X t 3 = t X_{t3}=t Xt3​=t 的多元线性回归。这里的趋势项 t t t 的系数可以解释被解释变量 Y t Y_t Yt​ 中与 X t 1 X_{t1} Xt1​ 和 X t 2 X_{t2} Xt2​ 无关的造成增加或下降的因素。

除趋势 (detrending)

第二种方法是将被解释变量 Y t Y_t Yt​ 和解释变量 X t 1 , X t 2 X_{t1},\,X_{t2} Xt1​,Xt2​ 中与时间趋势有关的部分去除之后,利用剩余部分进行回归,步骤如下:

step.1 将 Y t , X t 1 , X t 2 Y_t,\,X_{t1},\,X_{t2} Yt​,Xt1​,Xt2​ 分别对常数项和时间趋势 t t t 回归,并记录残差为 Y ˙ t , X ˙ t 2 , X ˙ t 2 \dot{Y}_t,\,\dot{X}_{t2},\,\dot{X}_{t2} Y˙t​,X˙t2​,X˙t2​ :
Y t = α 0 + α 1 t + ε t , Y_t=\alpha_0+\alpha_1t+\varepsilon_t \ , Yt​=α0​+α1​t+εt​ ,

Y ^ t = α ^ 0 + α ^ 1 t , \hat{Y}_t=\hat\alpha_0+\hat\alpha_1t \ , Y^t​=α^0​+α^1​t ,

Y ˙ t = Y t − Y ^ t . \dot{Y}_t=Y_t-\hat{Y}_t \ . Y˙t​=Yt​−Y^t​ .

step.2 做 Y ˙ t \dot{Y}_t Y˙t​ 对 X ˙ t 1 , X ˙ t 2 \dot{X}_{t1},\,\dot{X}_{t2} X˙t1​,X˙t2​ 的回归:
Y ˙ t = β ^ 1 X ˙ t 1 + β ^ 2 X ˙ t 2 , \dot{Y}_t=\hat\beta_1\dot{X}_{t1}+\hat\beta_2\dot{X}_{t2} \ , Y˙t​=β^​1​X˙t1​+β^​2​X˙t2​ ,
估计结果 β ^ 1 \hat\beta_1 β^​1​ 和 β ^ 2 \hat\beta_2 β^​2​ 与直接回归得到的结果相同。在这里截距项不是必要的,即使在第二步的回归中保留了截距项,估计出来的结果也将是 0 0 0 。

描述有季节性的时间序列

如果一个时间序列是每月或者每季度(甚至每周或每天)观测得到的,它就有可能表现出季节性变化。一般地,处理回归模型中季节性的简单办法就是引入季节虚拟变量。

假设我们有 s s s 个季节的时间序列数据。为避免虚拟变量陷阱,我们在模型中加入一组季节虚拟变量,主要有两种形式:

无截距项的情况
Y t = ∑ i = 1 s γ i D i + ε t , Y_t=\sum_{i=1}^s\gamma_iD_i+\varepsilon_t \ , Yt​=i=1∑s​γi​Di​+εt​ ,
γ i \gamma_i γi​ 描述了第 i i i 个季节的季节性因素。

含截距项的情况
Y t = c + ∑ i = 1 s − 1 γ i D i + ε t , Y_t=c+\sum_{i=1}^{s-1}\gamma_iD_i+\varepsilon_t \ , Yt​=c+i=1∑s−1​γi​Di​+εt​ ,
γ i \gamma_i γi​ 描述了第 i i i 个季节相对于第 s s s 个季节的增加或减少。

含季节性的回归

直接回归

类似于含趋势项的回归,我们将解释变量 X t X_t Xt​ 和季节性的虚拟变量一起放入回归模型中:
Y t = ∑ i = 1 s γ i D i + β 1 X t + ε t , Y_t=\sum_{i=1}^s\gamma_iD_i+\beta_1X_t+\varepsilon_t \ , Yt​=i=1∑s​γi​Di​+β1​Xt​+εt​ ,

Y t = c + ∑ i = 1 s − 1 γ i D i + β 1 X t + ε t . Y_t=c+\sum_{i=1}^{s-1}\gamma_iD_i+\beta_1X_t+\varepsilon_t \ . Yt​=c+i=1∑s−1​γi​Di​+β1​Xt​+εt​ .

一般地,我们选择带有截距项的回归模型。

除季节性 (deseasonalizing)

我们以引入含截距项的季节虚拟变量为例,除季节性回归的步骤如下:

step.1 将 Y t , X t Y_t,\,X_{t} Yt​,Xt​ 分别对常数项和季节项回归,并记录残差为 Y ˙ t , X ˙ t \dot{Y}_t,\,\dot{X}_{t} Y˙t​,X˙t​ :
Y t = c + ∑ i = 1 s − 1 γ i D i + ε t , Y_t=c+\sum_{i=1}^{s-1}\gamma_iD_i+\varepsilon_t \ , Yt​=c+i=1∑s−1​γi​Di​+εt​ ,

Y ^ t = c ^ + ∑ i = 1 s − 1 γ ^ i D i , \hat{Y}_t=\hat{c}+\sum_{i=1}^{s-1}\hat\gamma_iD_i \ , Y^t​=c^+i=1∑s−1​γ^​i​Di​ ,

Y ˙ t = Y t − Y ^ t . \dot{Y}_t=Y_t-\hat{Y}_t \ . Y˙t​=Yt​−Y^t​ .

step.2 做 Y ˙ t \dot{Y}_t Y˙t​ 对 X ˙ t \dot{X}_{t} X˙t​ 的回归:
Y ˙ t = β 1 X ˙ t + ε t , \dot{Y}_t=\beta_1\dot{X}_{t}+\varepsilon_t \ , Y˙t​=β1​X˙t​+εt​ ,
估计结果 β ^ 1 \hat\beta_1 β^​1​ 与直接回归得到的结果相同。

【计量经济学导论】07. 时间序列模型相关推荐

  1. 【计量经济学导论】01. 简单回归模型

    文章目录 简单回归模型 相关程度的度量 简单线性回归模型 简单线性回归的基本假定 普通最小二乘法 OLS 估计的代数性质 总变差的分解 拟合优度检验 参数的统计分布 变量的显著性检验 对数函数形式 简 ...

  2. 【计量经济学导论】04. 多重共线性

    文章目录 多重共线性 多重共线性的含义 多重共线性的产生原因 多重共线性的后果 多重共线性的检验方法 多重共线性的修正措施 多重共线性 通过前面的三篇笔记,我们基本上搭建了一个计量经济学的分析框架,即 ...

  3. 伍德里奇《计量经济学导论》第5版笔记和课后答案

    完整版在线阅读:http://wwxx.100xuexi.com/Ebook/195574.html 本书是伍德里奇<计量经济学导论>(第5版)教材的学习辅导书,主要包括以下内容: (1) ...

  4. 伍德里奇《计量经济学导论》第4版笔记和课后答案

    完整版在线阅读>>> http://wwxx.100xuexi.com/Ebook/231042.html 本书是伍德里奇<计量经济学导论>教材的学习辅导书,主要包括以下 ...

  5. 数学建模传染病模型_数学建模| 时间序列模型

    1 数学建模 时间序列模型 1.与实践有关系的一组数据,叫做时间序列: 2.得到时间序列的数据后,要构建模型,其中平稳时间序列的模型,是本节课重点介绍的: 3.y=at+季节性+周期性 一.     ...

  6. r语言 面板数据回归_工具方法 | “名牌包”:面板、时间序列模型常用R语言包...

    计量经济学是数学.统计技术和经济分析的综合,即运用数学.统计方法和相关经济理论,通过计量模型来揭示经济数量关系和规律.R语言包,已经实现了现代计量经济学的很多统计分析功能,下面从面板数据模型和时间序列 ...

  7. WaveNet时间序列模型(基于GluonTs包)

    前言 在时间序列模型中WaveNet模型在某些数据集上的表现比LSTM要更好,经常打Kaggle比赛的算法训练师应该有所了解. 关于WaveNet模型的理论在这里就不讲了,如果大家感兴趣可以读一下Wa ...

  8. 时间序列模型 (七): 时间序列建模的基本步骤

    时间序列建模的基本步骤 时间序列建模的基本步骤 习题 时间序列经典教材推荐 时间序列模型 (一):模型概述 时间序列模型 (二):移动平均法 时间序列模型 (三):指数平滑法 时间序列模型 (四):差 ...

  9. Python使用numpy包编写自定义函数计算平均绝对误差(MAE、Mean Absolute Error)、评估回归模型和时间序列模型、解读MAE

    Python使用numpy包编写自定义函数计算平均绝对误差(MAE.Mean Absolute Error).评估回归模型和时间序列模型.解读MAE 目录

最新文章

  1. H3C Boot升级 Serial模式
  2. Spring_hibernate整合初步 based in annotation
  3. Activiti中具有单独数据库模式的多租户
  4. IntellijIDEA插件编写-删除/插入/替换文档内容
  5. 如何彻底关闭windows defender
  6. Python中变量的命名以及输入输出
  7. python网络爬虫学习笔记(九):Beautiful Soup的使用
  8. Pytorch实现Seq2Seq(Attention)字符级机器翻译
  9. NIS服务的基本配置----视频下载
  10. Building Web Parts for Microsoft SharePoint Products and Technologies
  11. ORA-28002 the password will expire
  12. java中ojb_该方法包含(obj o)在Java中做什么?
  13. 淘宝京东拼多多淘客源码,三合一淘客php源码cms搭建教程
  14. 简历模板80套.zip
  15. linux 命令无法Tab补全,命令参数无法补全
  16. 一点点读懂cpufreq(二)
  17. c语言 proteus 延迟2秒_几种延时的汇编执行代码对比与总结
  18. JAVA基础学习(二)
  19. centos7 如何取消自动锁屏
  20. mysql中in条件使用字符串

热门文章

  1. linux中.sh脚本的编写
  2. 小i机器人悄无声息美股IPO:募资3876万美元 蹭ChatGPT热度
  3. nodejs部署到iis,详解iis如何部署运行nodejs
  4. 定时器计时不准问题 #Maximum Allowed Timestep
  5. aws SQS 使用步骤
  6. Python 重命名文件或目录(os.rename)
  7. Oracle LiveLabs实验:DB Security - Native Network Encryption (NNE)
  8. Excel 2010 SQL应用032 字符范围的模糊匹配查询
  9. IT创业----张瑞敏的忧思
  10. 学习笔记:c语言词汇