【中级计量经济学】Lecture 5 自相关
文章目录
- Lecture 5 自相关
- 5.1 自相关定义
- 5.2 自相关的产生原因
- 5.3 自相关的后果
- 5.4 自相关的检验
- 图示检验法√
- 回归检验法
- 杜宾-瓦森(DW)检验法√
- Ljung-Box检验法√
- 拉格朗日乘子检验(BG检验)
- 5.5 自相关的补救办法
- 广义最小二乘GLS
- 广义差分法√
- DW推算和OLS估计
- 杜宾两步法√
- 科克伦-奥克特迭代法√
- 序列相关稳健标准误法
Lecture 5 自相关
更详细的时间序列的自相关放在7.2 单变量均值回归模型
5.1 自相关定义
总体回归模型的随机误差项之间存在相关关系,即不同观测点(不同的样本个体或者不同的时间点)上的误差项彼此相关。
如果存在E(μiμj)≠0\mathrm{E}(\mu_i\mu_j)\ne 0E(μiμj)=0,就说明存在序列相关性;如果仅有E(μiμi+1)≠0\mathrm{E}(\mu_i\mu_{i+1})\ne 0E(μiμi+1)=0,就说明存在一阶序列相关/自相关。
自相关可以写成如下形式:
μt=ρμt−1+ϵt\mu_t=\rho\mu_{t-1}+\epsilon_t μt=ρμt−1+ϵt
ρ\rhoρ被成为一阶自相关系数/自协方差系数,−1<ρ<1-1<\rho<1−1<ρ<1;
ϵt\epsilon_tϵt是满足标准最小二乘回归假定的随机干扰项(经典误差项),即零均值、同方差、序列不相关
5.2 自相关的产生原因
经济变量固有的惯性
例如消费习惯的影响经常被包含在随机误差项中,随机误差项可能出现序列正相关。
模型的设定偏误
遗漏了重要解释变量或函数形式设定偏误
内生性问题也可能来源于重要解释变量的遗漏,内生性是随机误差项与解释变量相关
数据处理造成的相关
例如将月度数据调整为季度数据,由于采用了加合处理,修匀了月度数据的波动, 使季度数据具有平滑性,这种平滑性产生自相关。
5.3 自相关的后果
本质后果:存在自相关的情况下,OLS低估了参数估计量的方差,随机干扰项的方差也被低估;
在一阶自相关Xt=ρXt−1+μtX_{t}=\rho X_{t-1}+\mu_tXt=ρXt−1+μt假定下,参数估计量实际的方差是大于估计结果的:
Var(β^1)=σ2∑xt2+2σ2∑xt2[ρ∑t=1T−1xtxt+1∑xt2+ρ2∑t=2T−2xtxt+2∑xt2+⋯+ρT−1x1xT∑xt2]>σ2∑xt2(忽略异方差问题,计算出的参数的方差).\mathrm{Var}(\hat\beta_1)=\frac{\sigma^2}{\sum x_t^2}+\frac{2\sigma^2}{\sum x_t^2}\left[\rho\frac{\sum\limits_{t=1}^{T-1}x_tx_{t+1}}{\sum x_t^2}+\rho^2\frac{\sum\limits_{t=2}^{T-2}x_tx_{t+2}}{\sum x_t^2}+\cdots+\rho_{T-1}\frac{x_1x_{T}}{\sum x_t^2} \right]>\frac{\sigma^2}{\sum x_t^2}(忽略异方差问题,计算出的参数的方差). Var(β^1)=∑xt2σ2+∑xt22σ2⎣⎢⎢⎡ρ∑xt2t=1∑T−1xtxt+1+ρ2∑xt2t=2∑T−2xtxt+2+⋯+ρT−1∑xt2x1xT⎦⎥⎥⎤>∑xt2σ2(忽略异方差问题,计算出的参数的方差).
参数估计量仍未无偏估计,但非有效估计,因为方差扩大了。而 OLS 在计算参数方差时假设无自相关,即 认为ρ=0\rho=0ρ=0,此时实际方差被低估。
对模型的检验失去意义。由于 OLS 低估了真实方差,因此,t值被高估(更容易通过显著性检验),t检验、F检验和拟合优度检验都失效。
t=β^j−βjSβ^jt=\frac{\hat\beta_j-\beta_j}{S_{\hat\beta_j}} t=Sβ^jβ^j−βj预测功能失效。随机扰动项的误差不可靠、随机抽样误差不可靠,故预测区间不可靠。
YF=Y^F±tα/2(σ^1n+(XF−Xˉ)2∑xi2)Y_F=\hat Y_F\pm t_{\alpha/2}\Bigg(\hat\sigma\sqrt{\frac{1}{n}+\frac{(X_F-\bar{X})^2}{\sum{x_i^2}}}\Bigg) YF=Y^F±tα/2(σ^n1+∑xi2(XF−Xˉ)2)
5.4 自相关的检验
图示检验法√
作et−te_t-tet−t图或者et−et−1e_t-e_{t-1}et−et−1图辅助判断。
回归检验法
对
et=ρet−1+εtet=ρ1et−1+ρ2et−2+εt…e_t=\rho e_{t-1}+\varepsilon_t\\ e_t=\rho_1e_{t-1}+\rho_2e_{t-2}+\varepsilon_t\\ \dots et=ρet−1+εtet=ρ1et−1+ρ2et−2+εt…
等回归方程逐一检验。如果存在某一种形式,方程显著成立(F检验),则说明原模型存在自相关。
杜宾-瓦森(DW)检验法√
DW检验法局限性和缺点:
- 解释变量XXX非随机
- μt\mu_tμt为一阶自相关形式,不适用于高阶序列相关的检验
- 回归模型的解释变量中不能含滞后应变量Yt−1Y_{t-1}Yt−1
- 回归模型必须含有截距项
- DW统计量上下界临界值dL,dUd_L,d_UdL,dU表,要求样本数T≥15T\geq15T≥15
- 若DW统计量落在dL<D.W.<dUd_L<D.W.<d_UdL<D.W.<dU或4−dU<D.W.<4−dL4-d_U<D.W.<4-d_L4−dU<D.W.<4−dL,则不能判断相关性
对μt=ρμt−1+ε\mu_t=\rho\mu_{t-1}+\varepsilonμt=ρμt−1+ε构造假设检验H0:ρ=0H_0:\rho=0H0:ρ=0,并构造DW统计量为
D.W.=∑t=2n(et−et−1)2∑t=1net2∈[0,4].\mathrm{D.W.}=\frac{\sum\limits_{t=2}^{n}(e_t-e_{t-1})^2}{\sum\limits_{t=1}^{n}e_t^2}\in[0,4]. D.W.=t=1∑net2t=2∑n(et−et−1)2∈[0,4].
需根据样本容量TTT和解释变量数目kkk查D.W.\mathrm{D.W.}D.W.分布表,得到临界值dLd_{L}dL和dUd_{U}dU,看DW统计量落在哪个范围,判断自相关状态:(0<dL<dU<4−dU<4−dL<40<d_L<d_U<4-d_U<4-d_L<40<dL<dU<4−dU<4−dL<4)
- 0<D.W.<dL0<\mathrm{D.W.}<d_{L}0<D.W.<dL,存在正自相关。
- dU<D.W.<4−dUd_{U}<\mathrm{D.W.}<4-d_{U}dU<D.W.<4−dU,无自相关。
- 4−dL<D.W.<44-d_{L}<\mathrm{D.W.}<44−dL<D.W.<4,存在负自相关。
- 其他情况下不能确定。
事实上,D.W.≈2(1−ρ)\mathrm{D.W.}\approx 2(1-\rho)D.W.≈2(1−ρ)。
Ljung-Box检验法√
Q统计量
原假设为残差序列为白噪声,不存在序列相关性,所有ρ=0\rho=0ρ=0;拒绝原假设意味着,认为序列不是白噪声,序列存在相关性。
模拟AR(m)模型,m的选择影响检验效果,取m=ln(T)m=\ln(T)m=ln(T)效果较好。
拉格朗日乘子检验(BG检验)
考虑一般的ppp阶序列相关μt=ρ1μt−1+ρ2μt−2+⋯+ρpμt−p+εt\mu_t=\rho_1\mu_{t-1}+\rho_2\mu_{t-2}+\cdots+\rho_p\mu_{t-p}+\varepsilon_tμt=ρ1μt−1+ρ2μt−2+⋯+ρpμt−p+εt,检验受约束回归方程:
Yt=β0+β1Xt1+⋯+βkXtk+ρ1μt−1+⋯ρpμ~t−p+εt,H0:ρ1=⋯=ρp=0,Y_t=\beta_0+\beta_1X_{t1}+\cdots+\beta_kX_{tk}+\rho_1\mu_{t-1}+\cdots\rho_p\tilde \mu_{t-p}+\varepsilon_t,\\ H_0:\rho_1=\cdots=\rho_p=0, Yt=β0+β1Xt1+⋯+βkXtk+ρ1μt−1+⋯ρpμ~t−p+εt,H0:ρ1=⋯=ρp=0,
对此方程常使用拉格朗日乘数检验,但是μ\muμ是不可观测的,只能对原模型构造回归,使用残差序列:e~t=Yt−Y^t\tilde e_t=Y_t-\hat Y_te~t=Yt−Y^t代替μt\mu_tμt,从而对此辅助回归有
Yt=β0+β1Xt1+⋯+βkXtk+ρ1e~t−1+⋯+ρpe~t−p+εt,Y_t=\beta_0+\beta_1X_{t1}+\cdots+\beta_kX_{tk}+\rho_1\tilde e_{t-1}+\cdots+\rho_p\tilde e_{t-p}+\varepsilon_t, Yt=β0+β1Xt1+⋯+βkXtk+ρ1e~t−1+⋯+ρpe~t−p+εt,
计算其可决系数R2R^2R2,有LM=nR2∼χ2(p)\mathrm{LM}=nR^2\sim \chi^2(p)LM=nR2∼χ2(p)。临界值:χα2(p)\chi_{\alpha}^2(p)χα2(p)
5.5 自相关的补救办法
若ρ\rhoρ已知
广义最小二乘GLS
广义差分法√
若原模型存在
μt=ρ1μt−1+μ2ρt−2+⋯+ρpμt−p+εt,\mu_t=\rho_1\mu_{t-1}+\mu_2\rho_{t-2}+\cdots+\rho_p\mu_{t-p}+\varepsilon_t, μt=ρ1μt−1+μ2ρt−2+⋯+ρpμt−p+εt,
作广义差分变换
Yt−ρ1Yt−1−⋯−ρpYt−p=β0(1−ρ1−⋯−ρp)+β1(Xt1−ρ1Xt−1,1−⋯−ρpXt−p,1)+⋯+βk(Xtk−ρ1Xt−1,k−⋯−ρpXt−p,k)+εt.\begin{aligned} &\quad Y_t-\rho_1Y_{t-1}-\cdots-\rho_pY_{t-p}\\ &=\beta_0(1-\rho_1-\cdots-\rho_p)+\beta_1(X_{t1}-\rho_1X_{t-1,1}-\cdots-\rho_pX_{t-p,1})\\ &\quad +\cdots+\beta_k(X_{tk}-\rho_1X_{t-1,k}-\cdots-\rho_pX_{t-p,k})+\varepsilon_t. \end{aligned} Yt−ρ1Yt−1−⋯−ρpYt−p=β0(1−ρ1−⋯−ρp)+β1(Xt1−ρ1Xt−1,1−⋯−ρpXt−p,1)+⋯+βk(Xtk−ρ1Xt−1,k−⋯−ρpXt−p,k)+εt.
当一阶自相关,p=1p=1p=1:
Yt−ρYt−1=β0(1−ρ)+β1(Xt,1−ρXt−1,1)+⋯+βk(Xt,k−ρXt−1,k)+ϵtY_t-\rho Y_{t-1}=\beta_0(1-\rho)+\beta_1(X_{t,1}-\rho X_{t-1,1})+\dots+\beta_k(X_{t,k}-\rho X_{t-1,k})+\epsilon_t Yt−ρYt−1=β0(1−ρ)+β1(Xt,1−ρXt−1,1)+⋯+βk(Xt,k−ρXt−1,k)+ϵt
广义差分法损失了一定的样本数,在一阶序列相关情况下,对损失的第一次观测值可进行如下的普莱斯-温斯特变换:
Y1∗=1−ρ2Y1,X1j∗=1−ρ2X1j.Y_1^*=\sqrt{1-\rho^2}Y_1,\quad X_{1j}^*=\sqrt{1-\rho^2}X_{1j}. Y1∗=1−ρ2Y1,X1j∗=1−ρ2X1j.
补充到差分序列中。
若ρ\rhoρ未知,要对其进行估计
DW推算和OLS估计
DW:
ρ^=1−DW2\hat \rho =1-\frac{DW}{2} ρ^=1−2DW
OLS:
et=ρ^et−1+ϵte_t=\hat \rho e_{t-1}+\epsilon_t et=ρ^et−1+ϵt
粗略的估计,精确度不高。
杜宾两步法√
科克伦-奥克特迭代法√
序列相关稳健标准误法
用参数估计量的正确标准差进行替换,即使用
Var(β^1)=σ2∑xt2+2σ2∑xt2[ρ∑t=1T−1xtxt+1∑xt2+ρ2∑t=2T−2xtxt+2∑xt2+⋯+ρT−1x1xT∑xt2].\mathrm{Var}(\hat\beta_1)=\frac{\sigma^2}{\sum x_t^2}+\frac{2\sigma^2}{\sum x_t^2}\left[\rho\frac{\sum\limits_{t=1}^{T-1}x_tx_{t+1}}{\sum x_t^2}+\rho^2\frac{\sum\limits_{t=2}^{T-2}x_tx_{t+2}}{\sum x_t^2}+\cdots+\rho_{T-1}\frac{x_1x_{T}}{\sum x_t^2} \right]. Var(β^1)=∑xt2σ2+∑xt22σ2⎣⎢⎢⎡ρ∑xt2t=1∑T−1xtxt+1+ρ2∑xt2t=2∑T−2xtxt+2+⋯+ρT−1∑xt2x1xT⎦⎥⎥⎤.
进行计算。
【中级计量经济学】Lecture 5 自相关相关推荐
- 【中级计量经济学】Lecture 3 非球形扰动
文章目录 Lecture 3 非球形扰动 3.1 非球形扰动的含义 广义回归模型 非球形扰动的两个特例 3.2 普通最小二乘估计的特性 估计参数的统计特性 3.3 广义最小二乘估计(当Ω\OmegaΩ ...
- 【中级计量经济学】Lecture 10 内生性和工具变量法
文章目录 Lecture 10 内生性和工具变量法 10.1 内生性问题 内生性的产生原因 内生性的后果 10.2 内生性问题的处理 寻找代理变量(IQ) 工具变量法(IV)估计 工具变量的选取 工具 ...
- 【中级计量经济学】Lecture 2 多重共线性
文章目录 Lecture 2 多重共线性 2.1 多重共线性的含义 完全共线性 多重共线性 2.2 解释变量关系与相关指标 2.3 多重共线性产生的后果 正交的后果 完全共线性的后果 多重共线性产的后 ...
- 【中级计量经济学】Lecture 6 异方差
文章目录 Lecture 6 异方差 6.1 异方差的实质 6.2 异方差类型 6.3 异方差产生原因 6.4 异方差的后果 6.5 异方差的检验 图示检验法 White检验 B-P检验 Glejse ...
- 多元分析(Multivariate Analysis)
多元分析 简介 多元回归分析 一元线性回归 聚类分析 K-means聚类算法 K-means++算法 系统(层次聚类) 典型相关分析 主成分分析 简介 多元分析(Multivariate Analys ...
- 处理效应模型stata实例_【更新通知】手把手教你Stata软件操作与案例分析更新,速来!...
继3大政策效应评价方法.面板微观计量模型.空间计量模型.应用面板数据模型四大主题套餐后,手把手教你Stata系列课程推出多期DID.平行趋势检验系列专题. 该专题包含多期DID及平行趋势检验:双重差分 ...
- 论文笔记|固定效应的解释和使用
DeHaan E. Using and interpreting fixed effects models[J]. Available at SSRN 3699777, 2021. 虽然固定效应在金融 ...
- 金融数学全套课程 转
统计教材和金融数学的基础课程 金融数学基础书籍系列介绍 金融数学(Financial Mathematics),又称数理金融学.数学金融学.分析金融学,是利用数 学工具研究金融,进行数学建模.理论分析 ...
- 【数学建模笔记】【第七讲】多元线性回归分析(一): 回归分析的定义、对于线性的理解以及内生性问题的探究
多元线性回归分析 回归分析是数据分析中最基础也是最重要的分析工具,绝大多数的数据分析问题,都可以使用回归的思想来解决.回归分析的任务就是,通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制, ...
最新文章
- php 二维数组排序,多维数组排序
- android透明activity,Android 简单实现透明Activity
- 新书发布:时隔一年,我的第二本书终于来了
- android 字体描边实现,android文字描边功能的实现
- C++异常 调用abort()
- ClientScript.RegisterStartupScript 不起作用
- pytorch搭建LSTM神经网络预测电力负荷
- 计算机网络技术发展四个阶段,计算机网络的发展分哪四个阶段,特点?
- win7系统如何开启打印服务器配置,win7系统怎么添加打印服务器端口
- 常见容错机制:failfast、failsafe、failover、failback
- 关于移动端H5获取微信非静默授权被拦截进入【微信快照页】问题及解决方案
- IDEA全局替换快捷键
- 电脑C盘满了如何扩充C盘内存?
- 浏览器0x80004005 无法上网
- 像素 厘米 英寸 换算
- 【科普】苹果ARM版Mac发布会——大人,时代变了
- Edge/IE浏览器主页被篡改为360导航的快捷解决方法
- OCJP 1Z0-808考题全解析(含题目下载,持续更新中(60/236))
- 使用Tensorflow训练LSTM+Attention中文标题党分类
- 使用veil进行木马生成