搬运网站:https://blog.csdn.net/Claire_chen_jia/article/details/106903842?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~all~top_click~default-1-106903842.nonecase

双重差分模型DID学习

双重差分模型 (Difference-Differences, DID)是政策评估的非实验方法中最为常用的一种方法,其中交互项是DID的灵魂。

交互项形式拥有各种形式,包括(1)传统DID;(2)经典DID;(3)异时DID;(4)广义DID;以及(5)异质性DID。下面分别介绍这几种。

双重差分法是研究“处理效应”(treatment effects)的流行方法。一般来说,DID的使用场景为,在面板数据中,个体可分为两类,即受到政策冲击的“处理组”(treatment group)与未受政策影响的“控制组”(control group)。重点落在政策冲击和是否受到政策冲击,通过引入虚拟变量来实现。即:

政策冲击前后(pre-post)设为0和1,是否受到政策冲击(control-treat)设为0和1.

因而,模型常设计为

处理组虚拟变量 beta 捕捉了处理组的组别效应(处理组与控制组的固有差别),处理期虚拟变量lambda控制了处理期的时间效应(处理期前后的固有时间趋势), X为其他控制变量,而交互项xigema 则代表了处理组在处理期的真正效应(受到政策冲击的效应),这正是我们关心的处理效应。然后进行OLS估计即可。

经典DID是在传统DID模型上控制了个体固定效应(individual fixed effects)和时间固定效应(time fixed effects),并去除单独变量。模型如下:

模型解释如下:

(1)u 为个体固定效应。加入个体固定效应之后,就不必再放入处理组虚拟变量(treat i),否则会引起多重共线性问题。因为前者包含比后者更多的信息(前者控制到个体层面,而后者仅控制到组别层面)。

(2)入 为时间固定效应。同理,加入时间固定效应就不用再加处理期虚拟变量(post t)。否则,将导致严格多重共线性,因为前者包含比后者更多的信息(前者控制了每一期的时间效应,而后者仅控制处理期前后的时间效应)

(3)注意:估计方法依然是OLS,但须使用“聚类稳健标准误”(cluster-robust standard errors)。

在传统与经典DID的模型设定中,一个隐含假设是,处理组的所有个体开始受到政策冲击的时间均完全相同。但有时也会遇到每位个体的处理期不完全一致的情形(heterogeneous timing);比如,某项试点政策在不同城市分批推出。此时,可使用“异时DID”(heterogeneous timing DID)。

异时DID的关键在于,既然每位个体的处理期不完全一致,则处理期虚拟变量也因个体而异,故应写为post(i,t),既依赖于个体 i,也依赖于时间 t。模型设定为如下任意一种形式:

举一个5期面板数据在stata的应用:

1)定义变量:定义因个体而异的处理期虚拟变量post(i,t);

2)识别受影响:post1(i,t) = (0,0,1,1,1)代表第1位个体从第3期开始受到政策处理;post2(i,t) = (0,0,0,1,1)代表第2位个体从第4期开始受到政策处理;post3(i,t) = (0,0,0,0,0)代表从未受到政策冲击(属于控制组)。

以上各种DID方法均假设存在处理组与控制组的区别,但有时某项政策在全国统一铺开,此时只有处理组,并没有控制组,是否还能使用DID呢?答案是“能”,可以尝试“广义DID”(generalized DID)。

使用广义DID的重要前提是,虽然所有个体均同时受到政策冲击,但政策对于每位个体的影响力度并不相同,不妨以 intensity(i) 来表示。

其中,交互项系数为我们关注的对象。此外对于广义DID,文献中也有门槛区分组别的方法,即人为地设定一个门槛值 c,根据 变量是否超过此门槛值来定义处理组与控制组。因为将连续变量压缩为二分变量损失了不少信息,故在实践中已不多见。

传统的处理效应模型一般假设“同质性处理效应”(homogeneous treatment effects),即所有个体的处理效应都相同。显然,此假定太苛刻,在实践中难以成立。更为合理的假定则为“异质性处理效应”(heterogeneous treatment effects),即允许每位个体的处理效应不尽相同。具体而言:

1)在DID的框架下,引入异质性处理效应,即在于对交互项(treatpost)的调整,即引入在组别上的交互项(treatpost*group)。

2)模型建立上,在经典DID的模型中,再引入三重交互项 ,构建异质性DID模型。

由上式可知,对于group=0 那类处理组个体,其处理效应为 s。而对于 group=1那类处理组个体,其处理效应为(s+t) 。因而其处理效应是异质的(只要三重交互项的系数显著)。

3)推广到多雷,只要将将所有个体分为 M 类,设立 (M -1) 个类别虚拟变量。

注意,DID应用的前提是未受到政策冲击时,treat组和control组的变化趋势是平行的,因而进行平行趋势检验是绝对必要的。

从文献来看,最为常见的展示是否符合平行趋势假设的检验方法有两个:

其一,对比不同组别因变量均值的时间趋势;其二,回归中加入各时点虚拟变量与政策变量的交互项,若政策或称为处理发生前的交互项系数不显著,则表明的确有着平行趋势。

第一种的方法(图片来源于stata连享会)为:

第二种方式分为:代码操作和图形输出

安装命令:安装 coefplot

生成各时点虚拟变量与政策变量的交互项的交互项

进行回归

输出图形

详见学习链接

例子参考学习自:

/*模拟数据的生成*设定60个观测值,设定随机数种子clearallsetobs60setseed10101genid=_n//每一个数值的数量扩大11倍,再减去前六十个观测值,即60*11-60=600,为60个体10年的面板数据expand11dropin1/60count///以id分组生成时间标识bysortid:gen time=_n+1999xtsetidtime///生成协变量x1,x2gen x1=rnormal(1,7)gen x2=rnormal(2,5)///生成个体固定效应和时间固定效应sort timeidby time:gen ind=_nsortidtimebyid:gen T=_n///生成treat和post变量,以2005年为接受政策干预的时点,id为30-60的个体为处理组,其余为控制组gen D=0replace D=1ifid>29gen post=0replace post=1iftime>=2005///将基础数据结构保存成dta文件,命名为DID_Basic_Simu.dta,默认保存在当前的 working directory 路径下save"DID_Basic_Simu.dta",replace

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

///调用本文第二部分生成的基础数据结构use"DID_Basic_Simu.dta",clear///生成两种潜在结果,并且合成最终的结果变量,令政策的真实效果为10bysortid:gen y0=10+5*x1+3*x2+T+ind+rnormal()bysortid:gen y1=10+5*x1+3*x2+T+ind+rnormal()iftime<2005bysortid:replace y1=10+5*x1+3*x2+10+T+ind+rnormal()iftime>=2005gen y=y0+D*(y1-y0)///去除协变量和个体效应对y的影响,画出剩余残差的图像xtreg y x1 x2,fe rpredict e,uebinscatter e time,line(connect)by(D)///输出生成的图片,令格式为800*600graph export"article1_1.png",as(png)replace width(800)height(600)///多种回归形式reg y c.D#c.post x1 x2 i.time i.id,robusteststo regxtreg y c.D#c.post x1 x2 i.time,absorb(id) robusteststo aregreghdfe y y c.D#c.post x1 x2, absorb(id time) vce(robust)estout*,title("The Comparison of Actual Paramerer Values")///cells(b(star fmt(%9.3f))se(par))///stats(N N_g,fmt(%9.0f%9.0g)label(N Groups))///legend collabels(none)varlabels(_cons Constant)keep(x1 x2 c.D#c.post)///ESA及图示法///预先生成年度虚拟变量tab time,gen(year)reg y i.D#i.time x1 x2, vce(robust)reghdfe y c.D#(c.year2-year10) x1 x2, absorb(id time) vce(robust)coefplot,///keep(c.D#c.year2 c.D#c.year3 c.D#c.year4 c.D#c.year5 c.D#c.year6 c.D#c.year7 c.D#c.year8 c.D#c.year9 c.D#c.year10)  ///coeflabels(c.D#c.year2 = "-4"  ///c.D#c.year3 = "-3"          ///c.D#c.year4 = "-2"          ///c.D#c.year5 = "-1"          ///c.D#c.year6  = "0"            ///c.D#c.year7  = "1"              ///c.D#c.year8  = "2"              ///c.D#c.year9  = "3"              ///c.D#c.year10 = "4")            ///vertical///yline(0)///ytitle("Coef")///xtitle("Time passage relative to year of adoption of implied contract exception")///addplot(line @b @at)///ciopts(recast(rcap))///scheme(s1mono)///输出生成的图片,令格式为800*600graph export"article1_3.png",as(png)replace width(800)height(600)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

///调用本文第二部分生成的基础数据结构use"DID_Basic_Simu.dta",clear///生成两种潜在结果,并且合成最终的结果变量,令政策的真实效果随时间发生变化,即(5*T-T),由于从2005年开始接受干预,因此,每年的政策效果应为24,28,32,36,40.bysortid:gen y0=10+5*x1+3*x2+T+ind+rnormal()bysortid:gen y1=10+5*x1+3*x2+T+ind+rnormal()iftime<2005bysortid:replace y1=10+5*x1+3*x2+10+T+ind+rnormal()iftime>=2005gen y=y0+D*(y1-y0)///去除协变量和个体效应对y的影响,画出剩余残差的图像xtreg y x1 x2,fe rpredict e,uebinscatter e time,line(connect)by(D)///输出生成的图片,令格式为800*600graph export"article1_1.png",as(png)replace width(800)height(600)///多种回归形式reg y c.D#c.post x1 x2 i.time i.id,reststo regxtreg y c.D#c.post x1 x2 i.time, r feeststo xtreg_feareg y c.D#c.post x1 x2 i.time, absorb(id) robusteststo aregreghdfe y c.D#c.post x1 x2, absorb(id time) vce(robust)eststo reghdfeestout*,title("The Comparison of Actual Paramerer Values")///cells(b(star fmt(%9.3f))se(par))///stats(N N_g,fmt(%9.0f%9.0g)label(N Groups))///legend collabels(none)varlabels(_cons Constant)keep(x1 x2 c.D#c.post)///ESA及图示法///预先生成年度虚拟变量tab time,gen(year)reghdfe y i.D#i.time x1 x2, vce(robust) absorb(id time)reghdfe y c.D#(c.year2-year10) x1 x2, absorb(id time) vce(robust)coefplot,///keep(c.D#c.year2 c.D#c.year3 c.D#c.year4 c.D#c.year5 c.D#c.year6 c.D#c.year7 c.D#c.year8 c.D#c.year9 c.D#c.year10)  ///coeflabels(c.D#c.year2 = "-4"  ///c.D#c.year3 = "-3"          ///c.D#c.year4 = "-2"          ///c.D#c.year5 = "-1"          ///c.D#c.year6  = "0"            ///c.D#c.year7  = "1"              ///c.D#c.year8  = "2"              ///c.D#c.year9  = "3"              ///c.D#c.year10 = "4")            ///vertical///yline(0)///ytitle("Coef")///xtitle("Time passage relative to year of adoption of implied contract exception")///addplot(line @b @at)///ciopts(recast(rcap))///scheme(s1mono)///输出生成的图片,令格式为800*600graph export"article1_4.png",as(png)replace width(800)height(600)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

所有个体开始受到政策冲击的时间均完全相同:Standard DID

个体开始受到政策冲击的时间不相同:Time-varying DID

/*模拟数据的生成*设定60个观测值,设定随机数种子clearallsetobs60setseed10101genid=_n///每一个数值的数量扩大11倍,再减去前六十个观测值,即60*11-60=600,为60个体10年的面板数据expand11dropin1/60count///以id分组生成时间标识bysortid:gen time=_n+1999xtsetidtime///生成协变量以及个体和时间效应gen x1=rnormal(1,7)gen x2=rnormal(2,5)sort timeidby time:gen ind=_nsortidtimebyid:gen T=_ngen y=0///生成处理变量,此时D为Dit,设定1-20在2004年接受冲击,21-40为2006年,36-60为2008年gen D=0gen birth_date=0forvalues i=1/20{replace D=1ifid==`i'&time>=2004replace birth_date=2004ifid==`i'}forvalues i=21/40{replace D=1ifid==`i'&time>=2006replace birth_date=2006ifid==`i'}forvalues i=41/60{replace D=1ifid==`i'&time>=2008replace birth_date=2008ifid==`i'}///将基础数据结构保存成dta文件,命名为DID_Basic_Simu.dta,默认保存在当前的 working directory 路径下save"DID_Basic_Simu_1.dta",replace

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

/*政策效果不随时间而变DID*调用生成的基础数据文件use"DID_Basic_Simu_1.dta",clear///Y的生成,使得接受冲击的个体的政策真实效果为10bysortid:gen y0=10+5*x1+3*x2+T+ind+rnormal()bysortid:gen y1=10+5*x1+3*x2+T+ind+10+rnormal()iftime>=2004&id>=1&id<=20bysortid:replace y1=10+5*x1+3*x2+T+ind+10+rnormal()iftime>=2006&id>=21&id<=40bysortid:replace y1=10+5*x1+3*x2+T+ind+10+rnormal()iftime>=2008&id>=41&id<=60bysortid:replace y1=10+5*x1+3*x2+T+ind+rnormal()ify1==.replace y=y0+D*(y1-y0)///去除个体效应和协变量对Y的影响,得到残差并画图xtreg y x1 x2,fe rpredict e,uebinscatter e time,line(connect)by(D)///输出生成的图片,令格式为800*600graph export"article2_1.png",as(png)replace width(800)height(600)///保存并输出多个命令的结果reg y c.D x1 x2 i.time i.id,reststo regxtreg y c.D x1 x2 i.time,r feeststo xtreg_feareg y c.D x1 x2 i.time,absorb(id)robusteststo aregreghdfe y c.D x1 x2,absorb(idtime)vce(robust)eststo reghdfeestout*,title("The Comparison of Actual Parameter Values")///cells(b(star fmt(%9.3f))se(par))///stats(N N_g,fmt(%9.0f%9.0g)label(N Groups))///legend collabels(none)varlabels(_cons Constant)keep(x1 x2 D)///ESA及图示法  Time-varying DID 和 Event Study Approach 的结合///用当前年份减去个体接受处理的年份,得到相对的时间值event,将-4期之前的时间归并到第-4期,由于部分个体没有多于-4期的时间///然后生成相对时间值的虚拟变量,eventt,并将首期设定为基准对照组gen event=time-birth_datereplace event=-4ifevent<=-4tab event,gen(eventt)drop eventt1xtreg y eventt*x1 x2 i.time,r fecoefplot,///keep(eventt*)///coeflabels(eventt2="-3"///eventt3="-2"///eventt4="-1"///eventt5="0"///eventt6="1"///eventt7="2"///eventt8="3"///eventt9="4"///eventt10="5")///vertical///yline(0)///ytitle("Coef")///xtitle("Time passage relative to year of adoption of implied contract exception")///addplot(line @b @at)///ciopts(recast(rcap))///scheme(s1mono)///输出生成的图片,令格式为800*600graph export"article2_2.png",as(png)replace width(800)height(600)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

/*政策效果随时间而变DID*调用生成的基础数据文件use"DID_Basic_Simu_1.dta",clear///Y的生成,设定真实的政策效果为当年为3,并且每年增加3bysortid:gen y0=10+5*x1+3*x2+T+ind+rnormal()bysortid:gen y1=10+5*x1+3*x2+T+ind+(time-birth+1)*3+rnormal()iftime>=2004&id>=1&id<=20bysortid:replace y1=10+5*x1+3*x2+T+ind+(time-birth+1)*3+rnormal()iftime>=2006&id>=21&id<=40bysortid:replace y1=10+5*x1+3*x2+T+ind+(time-birth+1)*3+rnormal()iftime>=2008&id>=41&id<=60bysortid:replace y1=10+5*x1+3*x2+T+ind+rnormal()ify1==.replace y=y0+D*(y1-y0)///去除个体效应和协变量对Y的影响,得到残差并画图xtreg y x1 x2,fe rpredict e,uebinscatter e time,line(connect)by(D)///输出生成的图片,令格式为800*600graph export"article2_3.png",as(png)replace width(800)height(600)///保存并输出多个命令的结果reg y c.D x1 x2 i.time i.id,reststo regxtreg y c.D x1 x2 i.time,r feeststo xtreg_feareg y c.D x1 x2 i.time,absorb(id)robusteststo aregreghdfe y c.D x1 x2,absorb(idtime)vce(robust)eststo reghdfeestout*,title("The Comparison of Actual Parameter Values")///cells(b(star fmt(%9.3f))se(par))///stats(N N_g,fmt(%9.0f%9.0g)label(N Groups))///legend collabels(none)varlabels(_cons Constant)keep(x1 x2 D)///ESA及图示法  Time-varying DID 和 Event Study Approach 的结合///用当前年份减去个体接受处理的年份,得到相对的时间值event,将-4期之前的时间归并到第-4期,由于部分个体没有多于-4期的时间///然后生成相对时间值的虚拟变量,eventt,并将首期设定为基准对照组gen event=time-birth_datereplace event=-4ifevent<=-4tab event,gen(eventt)drop eventt1xtreg y eventt*x1 x2 i.time,r fecoefplot,///keep(eventt*)///coeflabels(eventt2="-3"///eventt3="-2"///eventt4="-1"///eventt5="0"///eventt6="1"///eventt7="2"///eventt8="3"///eventt9="4"///eventt10="5")///vertical///yline(0)///ytitle("Coef")///xtitle("Time passage relative to year of adoption of implied contract exception")///addplot(line @b @at)///ciopts(recast(rcap))///scheme(s1mono)///输出生成的图片,令格式为800*600graph export"article2_2.png",as(png)replace width(800)height(600)

python 双重差分模型_双重差分模型DID python操作相关推荐

  1. python新手入门教程思路-Python新手入门教程_教你怎么用Python做数据分析

    Python新手入门教程_教你怎么用Python做数据分析 跟大家讲了这么多期的Python教程,有小伙伴在学Python新手教程的时候说学Python比较复杂的地方就是资料太多了,比较复杂.很多网上 ...

  2. 一阶广义差分模型_广义差分法和自相关系数估计.ppt

    广义差分法和自相关系数估计 2. 广义差分法 广义差分法是将原模型变换为满足OLS法的差分模型,再进行OLS估计. 称(3)式为广义差分变换.(2)式可表示为: (4) 其中: (4)式是经广义差分变 ...

  3. python如何训练模型生产_手把手教你用Python构建你的第一个多标签图像分类模型(附案例)...

    你正在处理图像数据吗?我们可以使用计算机视觉算法来做很多事情: 对象检测 图像分割 图像翻译 对象跟踪(实时),还有更多-- 这让我思考--如果一个图像中有多个对象类别,我们该怎么办?制作一个图像分类 ...

  4. 决策树模型 朴素贝叶斯模型_有关决策树模型的概述

    决策树模型 朴素贝叶斯模型 Decision Trees are one of the highly interpretable models and can perform both classif ...

  5. 人口预测和阻尼-增长模型_使用分类模型预测利率-第2部分

    人口预测和阻尼-增长模型 We are back! This post is a continuation of the series "Predicting Interest Rate w ...

  6. 机器学习 训练较快的模型_通过心理模型更快地学习软件,第1部分

    机器学习 训练较快的模型 什么是心理模型? (What Are Mental Models?) The easiest way to describe them is that they're pat ...

  7. reactor多线程模型_网络编程模型的演进之路

    在没有IO多路复用的模型的情况下,为了支持高并发采取以下网络模型 一:阻塞IO+多线程 client连接服务器,服务器有一个线程阻塞的调用accept,accept接收到连接后,创建一个线程来读写读写 ...

  8. 斯特林发动机图纸尺寸_南昌教学模型订做,航空发动机模型_境海模型

    首页 > 新闻中心 发布时间:2020-11-08 13:57:07 导读:境海模型为您提供南昌教学模型订做,航空发动机模型的相关知识与详情: 曾经的沙盘模型一般只有模型自身,没有现代的视觉作用 ...

  9. logit回归模型_常见机器学习模型的假设

    > Photo by Thought Catalog on Unsplash 暂时忘记深度学习和神经网络. 随着越来越多的人开始进入数据科学领域,我认为重要的是不要忘记这一切的基础. 统计. 如 ...

  10. python时间序列动图_手把手教你用Python进行时间序列分解和预测

    来源:数据派THU(ID:DatapiTHU) ▔ 作者:Mohit Sharma 翻译:王闯(Chuck) 校对:王可汗 预测是一件复杂的事情,在这方面做得好的企业会在同行业中出类拔萃.时间序列预测 ...

最新文章

  1. 介绍下JSP如何进行自动刷新
  2. VS2012经常使用的快捷方式完成最全面
  3. oracle树形语句
  4. 消息消费端的确认机制
  5. Yii rabc角色权限管理文章推荐
  6. linux idea 快捷键,Linux 下 IDEA 的 Ctrl+Alt+S
  7. WPF指南之XAML概述
  8. android 开发问题集(一):SDK更新后 运行程序报错Location of the Android SDK has not been setup in the preferences
  9. Spring MVC中@ModelAttribute注解的使用
  10. yum配合rpm查看软件包安装位置
  11. 卸载symantec endpoint protection
  12. Win11快速截屏的4种方法介绍
  13. ios ping服务器
  14. 2021南昌市地区高考成绩排名查询,2021南昌中小学国编成绩排名/分数线
  15. 在函数fnl()中定义一个静态变量n,fnl()中对n的值加1,在主函数中,调用fnl()10次,显示n的值,c++
  16. Http 通过setHeader隐藏ip
  17. 微信小程序如何隐藏左上角返回首页按钮?
  18. Python蓝桥杯练习16——芯片测试
  19. Java闭关修炼64课 很适合新手学习的JAVA视频教程
  20. android4.1不支持微信,华为EMUI 4.1(android6.0)手机能否安装微信小程序?

热门文章

  1. laravel-Voyager的安装
  2. 什么是stm32的部分重映像与完全重映像
  3. linux的mount bind命令
  4. 玉米社:网站seo站外优化技巧、注意事项
  5. CASS地物及地貌的诠释
  6. Java面试遇到的智力题
  7. 什么是函数的副作用——理解js编程中函数的副作用
  8. 康德、孔子和休谟的对话
  9. 超简单vue-devtools工具安装
  10. 基于Java+SpringMVC+Mybaties+jsp+layui实现的宿舍管理系统设计与实现