【中级计量经济学】Lecture 5 自相关

文章目录

Lecture 5 自相关
- 5.1 自相关定义
- 5.2 自相关的产生原因
- 5.3 自相关的后果
- 5.4 自相关的检验
- - 图示检验法√
  - 回归检验法
  - 杜宾-瓦森（DW）检验法√
  - Ljung-Box检验法√
  - 拉格朗日乘子检验（BG检验）
- 5.5 自相关的补救办法
- - 广义最小二乘GLS
  - 广义差分法√
  - DW推算和OLS估计
  - 杜宾两步法√
  - 科克伦-奥克特迭代法√
  - 序列相关稳健标准误法

Lecture 5 自相关

更详细的时间序列的自相关放在7.2 单变量均值回归模型

5.1 自相关定义

总体回归模型的随机误差项之间存在相关关系，即不同观测点（不同的样本个体或者不同的时间点）上的误差项彼此相关。

如果存在E(μiμj)≠0\mathrm{E}(\mu_i\mu_j)\ne 0E(μiμj)=0，就说明存在序列相关性；如果仅有E(μiμi+1)≠0\mathrm{E}(\mu_i\mu_{i+1})\ne 0E(μiμi+1)=0，就说明存在一阶序列相关/自相关。
自相关可以写成如下形式：
μt=ρμt−1+ϵt\mu_t=\rho\mu_{t-1}+\epsilon_t μt=ρμt−1+ϵt
ρ\rhoρ被成为一阶自相关系数/自协方差系数，−1<ρ<1-1<\rho<1−1<ρ<1;
ϵt\epsilon_tϵt是满足标准最小二乘回归假定的随机干扰项（经典误差项），即零均值、同方差、序列不相关

5.2 自相关的产生原因

经济变量固有的惯性

例如消费习惯的影响经常被包含在随机误差项中，随机误差项可能出现序列正相关。
模型的设定偏误

遗漏了重要解释变量或函数形式设定偏误

内生性问题也可能来源于重要解释变量的遗漏，内生性是随机误差项与解释变量相关
数据处理造成的相关

例如将月度数据调整为季度数据，由于采用了加合处理，修匀了月度数据的波动，使季度数据具有平滑性，这种平滑性产生自相关。

5.3 自相关的后果

本质后果：存在自相关的情况下，OLS低估了参数估计量的方差，随机干扰项的方差也被低估；

在一阶自相关Xt=ρXt−1+μtX_{t}=\rho X_{t-1}+\mu_tXt=ρXt−1+μt假定下，参数估计量实际的方差是大于估计结果的：
Var(β^1)=σ2∑xt2+2σ2∑xt2[ρ∑t=1T−1xtxt+1∑xt2+ρ2∑t=2T−2xtxt+2∑xt2+⋯+ρT−1x1xT∑xt2]>σ2∑xt2（忽略异方差问题，计算出的参数的方差）.\mathrm{Var}(\hat\beta_1)=\frac{\sigma^2}{\sum x_t^2}+\frac{2\sigma^2}{\sum x_t^2}\left[\rho\frac{\sum\limits_{t=1}^{T-1}x_tx_{t+1}}{\sum x_t^2}+\rho^2\frac{\sum\limits_{t=2}^{T-2}x_tx_{t+2}}{\sum x_t^2}+\cdots+\rho_{T-1}\frac{x_1x_{T}}{\sum x_t^2} \right]>\frac{\sigma^2}{\sum x_t^2}（忽略异方差问题，计算出的参数的方差）. Var(β^1)=∑xt2σ2+∑xt22σ2⎣⎢⎢⎡ρ∑xt2t=1∑T−1xtxt+1+ρ2∑xt2t=2∑T−2xtxt+2+⋯+ρT−1∑xt2x1xT⎦⎥⎥⎤>∑xt2σ2（忽略异方差问题，计算出的参数的方差）.

参数估计量仍未无偏估计，但非有效估计，因为方差扩大了。而 OLS 在计算参数方差时假设无自相关，即认为ρ=0\rho=0ρ=0，此时实际方差被低估。
对模型的检验失去意义。由于 OLS 低估了真实方差，因此，t值被高估（更容易通过显著性检验），t检验、F检验和拟合优度检验都失效。
t=β^j−βjSβ^jt=\frac{\hat\beta_j-\beta_j}{S_{\hat\beta_j}} t=Sβ^jβ^j−βj
预测功能失效。随机扰动项的误差不可靠、随机抽样误差不可靠，故预测区间不可靠。
YF=Y^F±tα/2(σ^1n+(XF−Xˉ)2∑xi2)Y_F=\hat Y_F\pm t_{\alpha/2}\Bigg(\hat\sigma\sqrt{\frac{1}{n}+\frac{(X_F-\bar{X})^2}{\sum{x_i^2}}}\Bigg) YF=Y^F±tα/2(σ^n1+∑xi2(XF−Xˉ)2)

5.4 自相关的检验

图示检验法√

作et−te_t-tet−t图或者et−et−1e_t-e_{t-1}et−et−1图辅助判断。

回归检验法

对
et=ρet−1+εtet=ρ1et−1+ρ2et−2+εt…e_t=\rho e_{t-1}+\varepsilon_t\\ e_t=\rho_1e_{t-1}+\rho_2e_{t-2}+\varepsilon_t\\ \dots et=ρet−1+εtet=ρ1et−1+ρ2et−2+εt…
等回归方程逐一检验。如果存在某一种形式，方程显著成立（F检验），则说明原模型存在自相关。

杜宾-瓦森（DW）检验法√

DW检验法局限性和缺点：

解释变量XXX非随机
μt\mu_tμt为一阶自相关形式，不适用于高阶序列相关的检验
回归模型的解释变量中不能含滞后应变量Yt−1Y_{t-1}Yt−1
回归模型必须含有截距项
DW统计量上下界临界值dL,dUd_L,d_UdL,dU表，要求样本数T≥15T\geq15T≥15
若DW统计量落在dL<D.W.<dUd_L<D.W.<d_UdL<D.W.<dU或4−dU<D.W.<4−dL4-d_U<D.W.<4-d_L4−dU<D.W.<4−dL，则不能判断相关性

对μt=ρμt−1+ε\mu_t=\rho\mu_{t-1}+\varepsilonμt=ρμt−1+ε构造假设检验H0:ρ=0H_0:\rho=0H0:ρ=0，并构造DW统计量为
D.W.=∑t=2n(et−et−1)2∑t=1net2∈[0,4].\mathrm{D.W.}=\frac{\sum\limits_{t=2}^{n}(e_t-e_{t-1})^2}{\sum\limits_{t=1}^{n}e_t^2}\in[0,4]. D.W.=t=1∑net2t=2∑n(et−et−1)2∈[0,4].
需根据样本容量TTT和解释变量数目kkk查D.W.\mathrm{D.W.}D.W.分布表，得到临界值dLd_{L}dL和dUd_{U}dU，看DW统计量落在哪个范围，判断自相关状态：（0<dL<dU<4−dU<4−dL<40<d_L<d_U<4-d_U<4-d_L<40<dL<dU<4−dU<4−dL<4）

0<D.W.<dL0<\mathrm{D.W.}<d_{L}0<D.W.<dL，存在正自相关。
dU<D.W.<4−dUd_{U}<\mathrm{D.W.}<4-d_{U}dU<D.W.<4−dU，无自相关。
4−dL<D.W.<44-d_{L}<\mathrm{D.W.}<44−dL<D.W.<4，存在负自相关。
其他情况下不能确定。

事实上，D.W.≈2(1−ρ)\mathrm{D.W.}\approx 2(1-\rho)D.W.≈2(1−ρ)。

Ljung-Box检验法√

Q统计量

原假设为残差序列为白噪声，不存在序列相关性，所有ρ=0\rho=0ρ=0；拒绝原假设意味着，认为序列不是白噪声，序列存在相关性。

模拟AR(m)模型，m的选择影响检验效果，取m=ln⁡(T)m=\ln(T)m=ln(T)效果较好。

拉格朗日乘子检验（BG检验）

考虑一般的ppp阶序列相关μt=ρ1μt−1+ρ2μt−2+⋯+ρpμt−p+εt\mu_t=\rho_1\mu_{t-1}+\rho_2\mu_{t-2}+\cdots+\rho_p\mu_{t-p}+\varepsilon_tμt=ρ1μt−1+ρ2μt−2+⋯+ρpμt−p+εt，检验受约束回归方程：
Yt=β0+β1Xt1+⋯+βkXtk+ρ1μt−1+⋯ρpμ~t−p+εt,H0:ρ1=⋯=ρp=0,Y_t=\beta_0+\beta_1X_{t1}+\cdots+\beta_kX_{tk}+\rho_1\mu_{t-1}+\cdots\rho_p\tilde \mu_{t-p}+\varepsilon_t,\\ H_0:\rho_1=\cdots=\rho_p=0, Yt=β0+β1Xt1+⋯+βkXtk+ρ1μt−1+⋯ρpμ~t−p+εt,H0:ρ1=⋯=ρp=0,
对此方程常使用拉格朗日乘数检验，但是μ\muμ是不可观测的，只能对原模型构造回归，使用残差序列：e~t=Yt−Y^t\tilde e_t=Y_t-\hat Y_te~t=Yt−Y^t代替μt\mu_tμt，从而对此辅助回归有
Yt=β0+β1Xt1+⋯+βkXtk+ρ1e~t−1+⋯+ρpe~t−p+εt,Y_t=\beta_0+\beta_1X_{t1}+\cdots+\beta_kX_{tk}+\rho_1\tilde e_{t-1}+\cdots+\rho_p\tilde e_{t-p}+\varepsilon_t, Yt=β0+β1Xt1+⋯+βkXtk+ρ1e~t−1+⋯+ρpe~t−p+εt,
计算其可决系数R2R^2R2，有LM=nR2∼χ2(p)\mathrm{LM}=nR^2\sim \chi^2(p)LM=nR2∼χ2(p)。临界值：χα2(p)\chi_{\alpha}^2(p)χα2(p)

5.5 自相关的补救办法

若ρ\rhoρ已知

广义最小二乘GLS

广义差分法√

若原模型存在
μt=ρ1μt−1+μ2ρt−2+⋯+ρpμt−p+εt,\mu_t=\rho_1\mu_{t-1}+\mu_2\rho_{t-2}+\cdots+\rho_p\mu_{t-p}+\varepsilon_t, μt=ρ1μt−1+μ2ρt−2+⋯+ρpμt−p+εt,
作广义差分变换
Yt−ρ1Yt−1−⋯−ρpYt−p=β0(1−ρ1−⋯−ρp)+β1(Xt1−ρ1Xt−1,1−⋯−ρpXt−p,1)+⋯+βk(Xtk−ρ1Xt−1,k−⋯−ρpXt−p,k)+εt.\begin{aligned} &\quad Y_t-\rho_1Y_{t-1}-\cdots-\rho_pY_{t-p}\\ &=\beta_0(1-\rho_1-\cdots-\rho_p)+\beta_1(X_{t1}-\rho_1X_{t-1,1}-\cdots-\rho_pX_{t-p,1})\\ &\quad +\cdots+\beta_k(X_{tk}-\rho_1X_{t-1,k}-\cdots-\rho_pX_{t-p,k})+\varepsilon_t. \end{aligned} Yt−ρ1Yt−1−⋯−ρpYt−p=β0(1−ρ1−⋯−ρp)+β1(Xt1−ρ1Xt−1,1−⋯−ρpXt−p,1)+⋯+βk(Xtk−ρ1Xt−1,k−⋯−ρpXt−p,k)+εt.
当一阶自相关，p=1p=1p=1：
Yt−ρYt−1=β0(1−ρ)+β1(Xt,1−ρXt−1,1)+⋯+βk(Xt,k−ρXt−1,k)+ϵtY_t-\rho Y_{t-1}=\beta_0(1-\rho)+\beta_1(X_{t,1}-\rho X_{t-1,1})+\dots+\beta_k(X_{t,k}-\rho X_{t-1,k})+\epsilon_t Yt−ρYt−1=β0(1−ρ)+β1(Xt,1−ρXt−1,1)+⋯+βk(Xt,k−ρXt−1,k)+ϵt

广义差分法损失了一定的样本数，在一阶序列相关情况下，对损失的第一次观测值可进行如下的普莱斯-温斯特变换：
Y1∗=1−ρ2Y1,X1j∗=1−ρ2X1j.Y_1^*=\sqrt{1-\rho^2}Y_1,\quad X_{1j}^*=\sqrt{1-\rho^2}X_{1j}. Y1∗=1−ρ2Y1,X1j∗=1−ρ2X1j.
补充到差分序列中。

若ρ\rhoρ未知，要对其进行估计

DW推算和OLS估计

DW：
ρ^=1−DW2\hat \rho =1-\frac{DW}{2} ρ^=1−2DW
OLS:
et=ρ^et−1+ϵte_t=\hat \rho e_{t-1}+\epsilon_t et=ρ^et−1+ϵt
粗略的估计，精确度不高。

杜宾两步法√

科克伦-奥克特迭代法√

序列相关稳健标准误法

用参数估计量的正确标准差进行替换，即使用
Var(β^1)=σ2∑xt2+2σ2∑xt2[ρ∑t=1T−1xtxt+1∑xt2+ρ2∑t=2T−2xtxt+2∑xt2+⋯+ρT−1x1xT∑xt2].\mathrm{Var}(\hat\beta_1)=\frac{\sigma^2}{\sum x_t^2}+\frac{2\sigma^2}{\sum x_t^2}\left[\rho\frac{\sum\limits_{t=1}^{T-1}x_tx_{t+1}}{\sum x_t^2}+\rho^2\frac{\sum\limits_{t=2}^{T-2}x_tx_{t+2}}{\sum x_t^2}+\cdots+\rho_{T-1}\frac{x_1x_{T}}{\sum x_t^2} \right]. Var(β^1)=∑xt2σ2+∑xt22σ2⎣⎢⎢⎡ρ∑xt2t=1∑T−1xtxt+1+ρ2∑xt2t=2∑T−2xtxt+2+⋯+ρT−1∑xt2x1xT⎦⎥⎥⎤.
进行计算。