这期推送简单谈一下我本人对固定效应与交互固定效应一些或许不太成熟的理解。

Note:Note:Note: 1、该文首发于微信公众号DMETP,欢迎关注;2、需要本次推送所使用的数据和代码的朋友,可以在公众号后台对话框内回复关键词fe

LSDV法下,FE本质就是控制变量,所以在经济含义上,FE(包括交互FE)与一般意义上的控制变量并无二致。

那么,回归方程中为什么要加入控制变量?为了剥离其他因素的影响。设想一种极端情况,被解释变量yyy只对核心解释变量xxx做回归,其他影响yyy的因素都放到残差项中,这种情况下xxx的估计系数就不再代表xxx影响yyy的净效应了,而是参杂了其他因素对yyy的影响,因为xxx极大可能与残差项中某些被遗漏的变量相关,也就是存在遗漏变量引起的内生性问题。因此,为了排除其他因素(假定这些因素与核心解释变量相关)对估计结果的干扰,从而获得一个“干净”的边际值,回归模型还需要加入其他控制变量。

一般意义上的控制变量是根据经济学理论甚至常识来引入的,这些变量可观测、可度量,并且由于大多数情况是“基于×××和×××的研究”,因此可信服。但是,除了这部分可观测、可度量的控制变量,影响结果变量yyy的经济要素是复杂多样的,其中就包括许多不可观测且不可度量的因素,比如某年实施的经济政策、地区的风俗文化、行业的典型特征、个体的性格认知等等。为了控制住这些不可观测因素对研究结果的干扰,就需要额外在回归方程中引入FE,比如常见的年份FE、地区FE、行业FE和个体FE等等。

下面以一个手动生成的数据集为例。

cls
clear all
set obs 50gen id = ceil(_n / 10)bys id: gen year = _n + 2010gen ind = 1
replace ind = 2 if 1.id
replace ind = 3 if 3.idgen city = 1
replace city = 2 if 2.id
replace city = 3 if 5.idbro

这个面板数据集从个体id、年份year、行业ind和城市city四个维度对样本企业进行定义。具体举例,id为1的企业存续年份为2011至2020年,其行业代码为2,注册地属于城市1,并且在这十年间,该企业所属行业和注册地未发生变更(是否发生变更是一个关键信息,事关不同FE相互之间是否存在多重共线性,下文将展开论述)。

一般而言,在回归方程中引入FE有两种方法(见上期推送『计量模型 | 时间固定效应与时间趋势项』),下面基于tabulate的方法具体分析。

ta   id, gen(  idfe)
ta year, gen(yearfe)
ta  ind, gen( indfe)
ta city, gen(cityfe)

运行以上代码后可以观察到,数据集中生成了一系列的虚拟变量,以indfe*为例,indfe*是根据变量ind的不同取值生成的分组变量,由于总共有三个行业,因此有三个行业分组变量(indfe1indfe2indfe3)。

将这三个变量引入回归方程中就可以说是控制了行业FE(为避免虚拟变量陷阱Stata将自动omit一个分组变量),行业FE表征企业所属行业的不可观测的典型特征对企业的同质性影响,换言之,如果怀疑行业的某些特征对行业内所有企业的yyy均存在影响(如金融业企业一般都比较“赚钱”),并且对行业内的不同企业的作用大小不存在明显差异,那么行业FE就可以代表这样的行业特征。那么,为什么说是“同质性”影响?因为行业FE假定同一行业中的样本行业特征是近似一致的。这一假定从数据集中也可以看出来,即同一行业样本的indfe#均赋值为1(属于行业#),或者均赋值为0(不属于行业#)。其他FE同理。

但是,细心一点可以观察到,除时间FE,其他非时变的FE均可由个体FE线性表出,如indfe2等于idfe1cityfe1等于idfe1idfe3idfe4。这就意味着,如果模型中控制多个非时变的FE,其他FE总能被个体FE表出,即存在多重共线性的问题,这样的FE将被omitted。因此,许多论文不会在模型中同时控制个体FE和行业FE。

然而,这并不是说同时控制个体FE和行业FE是不可行的。一种特殊情况是,如果企业所属行业发生变更(如环境规制政策实施前后,部分制造业企业选择变更行业以规避政策的不利影响或套取政策红利,虽然后一种情况比较少),在这种情况下行业FE将不再是非时变的了,因此行业FE就不会再被个体FE线性表出。况且,就算不存在企业跨行转移的情况,也可以通过附上时变因素来规避共线性的问题,即行业 - 年份FE(具体引入方法见上期推送『计量模型 | 时间固定效应与时间趋势项』)。

这里就引入了交互FE的话题。模型中控制交互FE不只是为了附上时变因素以同时引入两个非时变FE,规避共线性的问题,更关键的在于交互FE的经济含义,在于控制交互FE将更加合乎常识与经济学理论,模型解释将更加的逻辑自洽。

上文提到了“同质性”,比如年份FE的同质性就是假定在同一年份某一不可观测因素(如政策冲击、经济周期等)对所有企业的结果变量yyy的作用方向、作用大小是一样的。但是,现实的经济冲击并不会对所有企业产生一致的同质性影响,不同企业因自身实力、价值链地位、所有者性质等的不同在面对同一经济冲击时做出的战略性反应不同,从而导致最终的结果不同。

比如2012年出台的《绿色信贷指引》,这一自上而下的环境规制政策(或者,信贷政策)虽然是在全国层面实施的,但是对不同行业企业的影响不同。具体而言,制造业企业由于“高污染、高能耗、产能过剩”的典型特征最易受到绿色信贷政策的影响,金融机构在《绿色信贷指引》下将直接缩减对“两高一剩”企业的信贷供给,如果这些企业本身就面临严峻的融资约束压力,并且没有其他可供替代的融资渠道(如内源融资、商业信用等),信贷渠道受阻将最终反映到企业的生产经营活动。

总结来说就是,控制时间FE仅仅考虑到了时间维度上的同质性经济冲击,但现实中的经济冲击将对不同类型企业产生异质性影响,为将这些不可观测的异质性冲击因素控制住,回归方程需要引入交互FE,比如说这里的ind - year FE

关于上文《绿色信贷指引》的一个补充事实是,2014年发布了《绿色信贷实施情况关键评价指标》,其中给出了涉及“两高一剩”行业的参考目录,这些行业目录具体以四位数行业代码呈现。这就意味着,为了精确捕捉这一政策安排的异质性冲击,就必须将ind细化到四位数行业层面,即控制四位数行业 - 时间FE。

既然交互FE这么好,那在什么情况下可以使用呢?任何情况下都可以使用,因为交互FE比单独的FE更严格,交互FE本质上包含了单个FE(这从生成的分组虚拟变量的数目就可以看出来)。但是,引入过多的虚拟变量可能导致核心解释变量统计上不显著,甚至造成符号与预期相反,这种情况下就需要仔细斟酌一下,到底是经济系统本身就是这种运行规律?还是说过多的虚拟变量导致某些控制变量被omitted,从而影响了估计结果?切不能简单地“见Star行事”,因为某些情况下基于这样的交互FE得出的结果更能反映经济系统本身的运行规律,且不显著的回归结果某种程度上可以讨论出影响机制,增强论文的故事性,比如分样本回归。

但是,有一种情况建议使用交互FE。以上面的《绿色信贷指引》为例,假设基于这个政策做一个DID,“两高一剩”行业企业treated赋值为1,其他企业赋值为0;2012年及以后post赋值为1,以前赋值为0;被解释变量是企业TFP。

观察这一模型的数据结构可以发现,被解释变量是企业级别,核心解释变量是行业 - 年份级别。那么,为了控制企业级别的不可观测因素对企业TFP的影响,同时为了控制样本期间其他所有行业级别的环境规制政策对企业TFP的影响,模型就需要引入企业FE和行业 - 年份FE,至于行业代码具体细化到什么程度,这就是另外的故事了。

计量模型 | 固定效应与交互固定效应相关推荐

  1. 双重差分模型能做固定效应吗_互助问答第53期:控制时间效应、交互项等问题...

    今日问题 尊敬的老师: 您好! 我在学习DID的过程中遇到以下问题,特向您请教. (1)我看到很多做DID的论文都提到个体固定和时间固定,参考网站上(https://www.jianshu.com/p ...

  2. 时间固定效应和个体固定效应的选择_互助问答第31期:固定效应与随机效应选择和面板数据处理...

    样本描述:各位老师好,我的论文采用的是微观面板非平衡数据(合并了3波数据,总观测值6万左右),每波观测之间约有20%的样本不同(约10%的样本流失,10%的新样本补入),因变量是连续变量,核心自变量是 ...

  3. 时间固定效应和个体固定效应的选择_STATA固定效应的时间固定和个体固定效应估计方法、检验策略和操作步骤...

    STATA固定效应的时间固定和个体固定效应估计方法.检验策略和操作步骤 最近在研究空间动态面板模型,其中涉及到固定效应模型要确定时间固定和个体固定效应时,由于在stata中使用,查阅了很多文献最终攻克 ...

  4. spatialreg | 空间计量模型的结果解读——直接效应和间接效应

    很久之前,学堂君写了一篇介绍几种常见空间计量模型的推文,前不久又重发了下: spatialreg | 空间滞后模型.空间误差模型和空间杜宾模型简单形式的R语言实现 空间计量模型相比于普通的统计模型,它 ...

  5. 空间计量模型_Stata中的空间计量回归模型应用

    在Stata 15中,推出了最新的空间计量官方命令,均以sp开头,表示 spatial data),可以处理横截面与面板形式的空间数据.本文主要为大家介绍空间计量横截面及面板模型的应用,全文分为两部分 ...

  6. MATLAB面板数据空间计量模型估计代码④

    代做空间计量-[面板数据]模型估计. 经典的面板数据模型,要考虑到固定效应和随机效应,在建立空间面板数据也需要考虑固定效应和随机效应.同时在进行拉格朗日乘子检验.空间模型的回归估计,还要考虑到是否具有 ...

  7. 线性空间计量模型与stata操作

    线性空间计量模型与stata操作 文章目录 线性空间计量模型与stata操作 @[toc] 1 一般空间计量模型 1.1 空间自回归模型(SAR) 1.2 空间杜宾模型(SDM) 1.3 空间自相关模 ...

  8. 面板空间计量模型(Stata)

    面板空间计量模型(Stata) 文章目录 面板空间计量模型(Stata) @[toc] 1 面板空间自回归模型 2 面板空间误差模型 3 面板空间自相关模型 4 面板空间杜宾模型 5 动态面板空间计量 ...

  9. riopoly matlab,MATLAB-空间计量模型详细步骤

    <MATLAB-空间计量模型详细步骤>由会员分享,可在线阅读,更多相关<MATLAB-空间计量模型详细步骤(23页珍藏版)>请在人人文库网上搜索. 1.1.excel与MATL ...

  10. 3.计量模型的基础分析流程(数据分析学习DAY4)

    大作业终于要做完了. 本科后两年其实计量模型用得不是很多,更多使用的金融相关的模型.导致计量分析都快忘得差不多了. 从上周开始看了一会高级计量的书,被里面复杂的数学推到搞得很头疼,但想了想其实自己不必 ...

最新文章

  1. 手机中geetest是什么文件_安卓手机系统中各类英文文件夹的含义详解,不知道的尽快熟知!...
  2. 学计算机的想当警察去一线,想当警察但又怕收入不高,我到底该选择梦想还是现实?...
  3. linux内核软中断引起大量丢包
  4. 苹果手机如何调节屏幕彩色(对于百度提供的方式行不通时此方法必有用)
  5. Atitit.现实生活中最好使用的排序方法-----ati排序法总结
  6. Linux 服务器乱码问题解决
  7. matlab 混沌工具箱,matlab混沌工具箱
  8. html中重叠盒子之间的距离,div间距设置_div之间距离设置布局
  9. WinEdt Latex 在字母上加两个点
  10. mysql count统计
  11. Java版本和JDK版本
  12. 国内主要的广告联盟背景
  13. 视频教程-Python数据分析案例实战 视频课程-Python
  14. 腾讯市值1个月蒸发1700亿美元;微软发布Windows 11 首个Beta版本; 恶意程序开发者转向新兴编程语言 | 架构视点...
  15. 极大似然函数求解_从最大似然函数 到 EM算法详解
  16. 数论四大定理之——威尔逊定理
  17. idea怎么设置代码提示不区分大小写_intellij idea设置代码提示不区分大小写
  18. ic启动器我的世界_hmcl启动器下载
  19. 学校计算机老师关心学生的作文600字,老师关爱同学的作文十篇
  20. 关于一个大一学生的俄罗斯方块项目分享C#开发,附源码(一)

热门文章

  1. Python实现pdf转图片
  2. CN2专线和普通国际对比优势在哪里 有什么优势
  3. 新机Switch OLED真机实测分享
  4. 我奋斗了十八年不是为了和你喝一杯咖啡
  5. [转帖]方正数码发布基于龙芯3A3000系列整机
  6. PYS60版短信搜索程序
  7. JavaScript封装回调函数(委托)
  8. uniapp app端调起高德地图导航
  9. c-lodop打印网页内容
  10. 【腾讯地图】出现“鉴权失败,请传入正确的key”怎么解决?