【中级计量经济学】Lecture 9 面板数据模型
文章目录
- Lecture 9 面板数据模型
- 9.1 经济数据结构的分类
- 9.2 三大面板数据模型
- 固定效应模型(The Fixed Effect Model)
- 假设
- 固定效应模型估计方法
- 一阶差分法估计(FD)
- 固定效应组内变换法(FE)
- 最小二乘虚拟变量法(LSDV)
- 三种方法比较
- 随机效应模型(The Random Effect Model)
- 假设
- 随机效应模型估计方法
- 广义最小二乘估计法(GLS)
- 混合回归模型(Pooled Regression Model)
- 假设
- 9.3 模型的选择
- 固定效应模型(FE)or混合回归模型(PLS)——F检验(个体效应的显著性检验)
- 随机效应模型(RE)or固定效应模型(FE)——Hausman检验(个体效应是否与解释变量相关的检验)
- 混合回归模型(PLS)or随机效应模型(RE)——LM个体效应检验
- 双重差分(DID)模型
- 模型形式一(不含固定效应)
- 模型形式二(含固定效应)
Lecture 9 面板数据模型
9.1 经济数据结构的分类
截面数据(Cross-sectional data)
时间序列数据(Time-series data)
混合截面数据(Pooled cross sections)
- 不同时期的组间样本个体不同
面板数据(Panel data)
- 不同时期的组间样本个体相同(对相同样本个体跟踪调查)
- 面板数据优点:
- 可以解决样本容量不足的问题,改进模型估计的有效性;
- 有助于更好地分析经济变量之间的关系;
- 可以估计某些难以度量的因素对解释变量的影响。
9.2 三大面板数据模型
One-way(单向效应):只考虑个体效应(individual effect),不考虑时间效应(time effect)。
yit=β0+β1x1it+β2x2it+⋯+βkxkit+ϵitϵit=λi+uity_{it}=\beta_0+\beta_1x_{1it}+\beta_2x_{2it}+\dots+\beta_kx_{kit}+\epsilon_{it}\\ \epsilon_{it}=\lambda_i+u_{it} yit=β0+β1x1it+β2x2it+⋯+βkxkit+ϵitϵit=λi+uit
λi\lambda_iλi是不可观测的个体效应。固定效应模型和随机效应模型都是非观测效应模型(unobserved effects model)。
固定效应模型(The Fixed Effect Model)
假设
- λi\lambda_iλi对个体iii来说是常数,不随时间变化,但随不同的个体变化
- λi\lambda_iλi与某个解释变量有关,即允许Cov(λi,xkit)≠0Cov(\lambda_i,x_{kit})\neq0Cov(λi,xkit)=0
结果:每一个横截面的不同个体具有固定的不同的截距项(因为λ\lambdaλ与解释变量相关,每个个体的解释变量观察值不同,所以不同个体的λ\lambdaλ不同)
固定效应模型估计方法
一阶差分法估计(FD)
固定效应组内变换法(FE)
yit=β0+β1x1it+β2x2it+⋯+βkxkit+λi+uity_{it}=\beta_0+\beta_1x_{1it}+\beta_2x_{2it}+\dots+\beta_kx_{kit}+\lambda_i+u_{it} yit=β0+β1x1it+β2x2it+⋯+βkxkit+λi+uit
给定一个个体iii,将上式两边对时间取平均:
y‾it=β0+β1x‾1i+β2x‾2i+⋯+βkx‾ki+λi+u‾i\overline y_{it}=\beta_0+\beta_1\overline x_{1i}+\beta_2\overline x_{2i}+\dots+\beta_k\overline x_{ki}+\lambda_i+\overline u_i yit=β0+β1x1i+β2x2i+⋯+βkxki+λi+ui
两式相减:
yit−y‾it=β1(x1it−x‾1i)+β2(x2it−x‾2i)+⋯+βk(xkit−x‾ki)+(uit−u‾i)y~it=β1x~1it+β2x~2it+⋯+βkx~kit+u~ity_{it}-\overline y_{it}=\beta_1(x_{1it}-\overline x_{1i})+\beta_2(x_{2it}-\overline x_{2i})+\dots+\beta_k(x_{kit}-\overline x_{ki})+(u_{it}-\overline u_i)\\ \tilde y_{it}=\beta_1\tilde x_{1it}+\beta_2\tilde x_{2it}+\dots+\beta_k\tilde x_{kit}+\tilde u_{it} yit−yit=β1(x1it−x1i)+β2(x2it−x2i)+⋯+βk(xkit−xki)+(uit−ui)y~it=β1x~1it+β2x~2it+⋯+βkx~kit+u~it
用OLS估计β\betaβ,称为固定效应估计量(Fixed Effects Estimator),记为β^FE\hat \beta_{FE}β^FE。
β^FE\hat \beta_{FE}β^FE主要使用了每个个体的组内离差信息,故也称为组内估计量(within estimator)
优势:即使个体效应与解释变量相关,也可得一致估计。
劣势:无法估计不随时间而变的变量之影响(如教育、性别、少数民族),即time invariant的变量没有得到估计
因为time invariant的变量,取时间平均前后的值相同,在第二步相减的过程中消去,所以这个变量没有得到估计。
最小二乘虚拟变量法(LSDV)
将不可观测的个体效应λi\lambda_iλi看做待估计的参数,β0+λi\beta_0+\lambda_iβ0+λi就是个体iii的截距。估计nnn个截距的方法就是引入n−1n−1n−1个虚拟变量(如果省略常数项β0\beta_0β0,则引入n个虚拟变量)。
yit=λ1D1+⋯+λn−1Dn−1+β0+β1x1it+⋯+βkitxkit+uity_{it}=\lambda_1D_1+\dots+\lambda_{n-1}D_{n-1}+\beta_0+\beta_1x_{1it}+\dots+\beta_{kit}x_{kit}+u_{it} yit=λ1D1+⋯+λn−1Dn−1+β0+β1x1it+⋯+βkitxkit+uit
对于个体iii,Di=1D_i=1Di=1,否则取0。
再进行OLS估计
- 优势:可以估计每个个体的异质性;可以估计不随时间变化变量的影响,可以得到组间估计量(between estimator)
- 劣势:对LSDV直接估计,由于LSDV中估计的变量太多,导致自由度下降很多(对拟合优度也可能产生影响),系数估计值会有细微差别。
- 对LSDV估计后发现某些个体的虚拟变量不显著而将其删去,那么LSDV的结果也不会与FE相同。
三种方法比较
随机效应模型(The Random Effect Model)
假设
- λi\lambda_iλi对个体iii来说是随机变量,不随时间变化。
- λi\lambda_iλi与所有解释变量都不相关,即对所有kkk,Cov(λi,xkit)=0Cov(\lambda_i,x_{kit})=0Cov(λi,xkit)=0
结果:每个截面的每个个体的截距项都是一个随机变量
随机效应模型估计方法
广义最小二乘估计法(GLS)
(复杂,不太会考,略)
混合回归模型(Pooled Regression Model)
假设
- 对所有个体来说,λi=0\lambda_i=0λi=0,即不存在个体效应
结果:设所有的横截面个体在不同时期的截距和斜率都是相同的
9.3 模型的选择
固定效应模型(FE)or混合回归模型(PLS)——F检验(个体效应的显著性检验)
H0:λ1=λ2=⋯=λn−1=0H_0:\lambda_1=\lambda_2=\dots=\lambda_{n-1}=0H0:λ1=λ2=⋯=λn−1=0,即λi=0(i=1,2…,n−1)\lambda_i=0(i=1,2\dots,n-1)λi=0(i=1,2…,n−1),所有的个体效应都为0,即不存在个体效应。
有一个独立的常数项β0\beta_0β0,所以对于有nnn个个体,引入n−1n-1n−1个虚拟变量。
未受约束模型(Unrestricted Model):固定效应模型(引入虚拟变量DiD_iDi)
yit=λ1D1+⋯+λn−1Dn−1+β0+β1x1it+⋯+βkitxkit+uity_{it}=\lambda_1D_1+\dots+\lambda_{n-1}D_{n-1}+\beta_0+\beta_1x_{1it}+\dots+\beta_{kit}x_{kit}+u_{it} yit=λ1D1+⋯+λn−1Dn−1+β0+β1x1it+⋯+βkitxkit+uit
受约束的模型(Restricted Model):混合回归模型
yit=β0+β1x1it+⋯+βkitxkit+uity_{it}=\beta_0+\beta_1x_{1it}+\dots+\beta_{kit}x_{kit}+u_{it} yit=β0+β1x1it+⋯+βkitxkit+uit
FFF统计量大于临界值,拒绝原假设,则通过F检验,个体效应显著,应该选用固定效应模型;否则个体效应不显著,选用混合回归模型。
随机效应模型(RE)or固定效应模型(FE)——Hausman检验(个体效应是否与解释变量相关的检验)
H0:Cov(λi,xkit)=0H_0:Cov(\lambda_i,x_{kit})=0H0:Cov(λi,xkit)=0,模型误差项与解释变量之间正交,即个体效应(异质性)与解释变量不相关
H1:Cov(λi,xkit)≠0H_1:Cov(\lambda_i,x_{kit})\neq0H1:Cov(λi,xkit)=0,即个体效应(异质性)与解释变量相关
拒绝原假设,选择固定效应模型;接受原假设,选择随机效应模型。(可以根据固定效应和随机效应模型的假设定义来记忆)
如果Cov(λi,xkit)=0Cov(\lambda_i,x_{kit})=0Cov(λi,xkit)=0,FE 和 RE 都是一致的,但RE更有效;则FE与RE估计量将共同收敛于真实的参数值,但选择效率更高的RE;
如果Cov(λi,xkit)≠0Cov(\lambda_i,x_{kit})\neq0Cov(λi,xkit)=0,FE仍然一致,但RE是有偏的;两者的差距过大,选择FE。
该检验的缺点:不适用于异方差情形,若随机误差项存在异方差,RE不是最有效的。
混合回归模型(PLS)or随机效应模型(RE)——LM个体效应检验
H0:σu2=0H_0:\sigma_u^2=0H0:σu2=0
H1:σu2≠0H_1:\sigma_u^2\neq0H1:σu2=0
Two-way(双向效应):同时考虑个体效应和时间效应
双重差分(DID)模型
通过该模型可以比较某一政策对不同组别的样本的影响。双重差分用于检验某一外生事件产生的影响,如:金融危机、政策变化等。
模型形式一(不含固定效应)
Yit=β0+β1Treati+β2Aftert+β3Treati×Aftert+eitY_{it}=\beta_0+\beta_1Treat_i+\beta_2After_t+\beta_3Treat_i\times After_t+e_{it} Yit=β0+β1Treati+β2Aftert+β3Treati×Aftert+eit
TreatiTreat_iTreati:处理组(受到事件影响的样本)=1,控制组(不受事件影响的样本)=0;
AftertAfter_tAftert:事件发生后=1,事件发生前=0.
事件发生前After=0 | 事件发生后After=1 | Difference | |
---|---|---|---|
处理组Treat=1 | β0+β1\beta_0+\beta_1β0+β1 | β0+β1+β2+β3\beta_0+\beta_1+\beta_2+\beta_3β0+β1+β2+β3 | ⇒ΔYTreat=β2+β3\Rightarrow\Delta Y_{Treat}=\beta_2+\beta_3⇒ΔYTreat=β2+β3 |
控制组Treat=0 | β0\beta_0β0 | β0+β2\beta_0+\beta_2β0+β2 | ⇒ΔYControl=β2\Rightarrow\Delta Y_{Control}=\beta_2⇒ΔYControl=β2 |
Difference |
Dif-In-Dif ⇓ΔΔY=β3\Downarrow\\\Delta\Delta Y=\beta_3⇓ΔΔY=β3 |
要检验的是β3\beta_3β3是否显著。
模型形式二(含固定效应)
Yit=β0+β3Treati×Aftert+λi+μt+uitY_{it}=\beta_0+\beta_3Treat_i\times After_t+\lambda_i+\mu_t+u_{it} Yit=β0+β3Treati×Aftert+λi+μt+uit
【中级计量经济学】Lecture 9 面板数据模型相关推荐
- 空间计量模型_Stata空间面板数据模型专题直播丨Stata空间计量3月远程直播
2月28日19:00-21:00Stata空间计量直播专题课(空间面板数据模型)提供全套资料及课后Q&A 空间面板数据模型的前生今世:静态.动态和具有共同因子约束的空间面板数据模型. 模型选择 ...
- STATA面板数据模型进行Hausman检验
STATA面板数据模型进行Hausman检验 1.导入数据 可以通过如下多种方式导入 1.1 可以通过点击stata软件的图标,输入数据 1.2 通过点击文件->导入 可以导入各种文本格式的数据 ...
- 1.面板数据模型理论--变截距面板数据模型
变截距面板数据模型 变截距面板数据模型理论介绍 混合效应模型 背景思想 回归公式可以忽略个体与时间变化的差异,因此所有的数据特征可以通过一个公式进行刻画.进行数据的大杂烩.乱炖.为什么采取这么直接粗暴 ...
- Stata:动态面板数据模型与xtabond2应用
全文阅读:Stata:动态面板数据模型与xtabond2应用| 连享会主页 目录 1. Nickell 偏差 2. 动态面板估计方法 3. 实证案例 4. 参考资料 5. 相关推文 为了处理内生性 ...
- 【中级计量经济学】Lecture 5 自相关
文章目录 Lecture 5 自相关 5.1 自相关定义 5.2 自相关的产生原因 5.3 自相关的后果 5.4 自相关的检验 图示检验法√ 回归检验法 杜宾-瓦森(DW)检验法√ Ljung-Box ...
- 【中级计量经济学】Lecture 2 多重共线性
文章目录 Lecture 2 多重共线性 2.1 多重共线性的含义 完全共线性 多重共线性 2.2 解释变量关系与相关指标 2.3 多重共线性产生的后果 正交的后果 完全共线性的后果 多重共线性产的后 ...
- 【中级计量经济学】Lecture 3 非球形扰动
文章目录 Lecture 3 非球形扰动 3.1 非球形扰动的含义 广义回归模型 非球形扰动的两个特例 3.2 普通最小二乘估计的特性 估计参数的统计特性 3.3 广义最小二乘估计(当Ω\OmegaΩ ...
- 【中级计量经济学】Lecture 10 内生性和工具变量法
文章目录 Lecture 10 内生性和工具变量法 10.1 内生性问题 内生性的产生原因 内生性的后果 10.2 内生性问题的处理 寻找代理变量(IQ) 工具变量法(IV)估计 工具变量的选取 工具 ...
- 【中级计量经济学】Lecture 6 异方差
文章目录 Lecture 6 异方差 6.1 异方差的实质 6.2 异方差类型 6.3 异方差产生原因 6.4 异方差的后果 6.5 异方差的检验 图示检验法 White检验 B-P检验 Glejse ...
- python面板数据模型操作步骤_任何有效的方法来建立面板数据的回归模型?
我有二维数据,包括某些地区的频繁犯罪类型以及一年中的相应房价.我想了解某些地区的犯罪频率与房价波动之间的可能联系.最初,我尝试使用线性回归来做到这一点,但是效果并不理想.现在,我想对数据进行PCA分析 ...
最新文章
- 看上华科,这家公司与其成立联合AI实验室
- php curl 携带session,PHP curl session 使用
- Vista OS 中添加网络中的非Vista OS共享的打印机
- MAX Script 脚本语言
- ftp 上传文件夹_ftp工具哪个好?Viper FTP for Mac激活版带给大家
- vue - blog开发学习6
- SAP UI5 应用开发教程之二十一 - SAP UI5 的自定义格式器(Custom Formatter)
- anaconda配置虚拟环境
- c ++向量库_在C ++中对2D向量进行排序
- Django项目调用外部程序soffice报错subprocess.CalledProcessError: Command 'soffice --headless --convert-to pdf
- Oracle 存储过程+JOB初学
- 【项目经验】之线程基本知识
- 奇异值分解(SVD)详解
- 读iOS开发进阶有感
- 【Web前端HTML5CSS3】12-字体
- 马云的蚂蚁金服为何如此看重区块链?如何发挥区块链商业优势?
- Python 矩阵顺时针逆时针旋转90度
- layui表格table固定表头第一行固定显示
- (前端)HTML之CSS(选择器字体排版背景)
- DCG【Dual Conversion Gain】是什么?