转载: http://blog.sina.com.cn/s/blog_626867f30101h3ea.html

倾向得分匹配法是一种研究方法,它在研究某项治疗、政策、或者其他事件的影响因素上很常见。对于经济、金融学领域来说,比如需要研究某个劳动者接受某种高等教育对其收入的影响,或者比如研究某个企业运用了某项管理层激励措施以后对企业业绩的影响。如果我们简单地将是否执行了某项时间作为虚拟变量,而对总体进行回归的话,参数估计就会产生偏误,因为在这样的情况下,我们只观察到了某一个对象他因为发生了某一事件后产生的表现,并且拿这种表现去和另一些没有发生这件事情的其他对象去做比较。这样的比较显然是不科学的,因为比较的基础并不同。

通俗地说,我们真正要做的是考虑,如果拿小明来说,小明读了研究生和小明没有读研究生,他的收入会差多少?可是小明已经读了研究生,我怎么才能估计出他要是不读研究生,他的收入会是多少呢?

于是,我们引入“倾向得分匹配”这样一种研究方法。英文叫Propensity Score Matching。这种方法能让我们从一大堆没有参加培训的人群中(也就是我们的总体样本的一个子集),对每个人读研究生的概率进行估计,然后选出和小明具有非常相似的去读研究生的概率,可是没有去读的同学小刚——作为小明的对照,然后再来看他们的区别。当样本中的每个研究生”小明“都找到了匹配的非研究生”小刚“,我们便能对这两组样本进行比较研究了。

1. 所以第一步,我们要对总体样本执行probit或者logit模型,然后估计出每一个观测对象读研究生的概率是多少。以probit模型为例,在stata中,执行以下命令:

probit [dependent var] [independent var]

其中,[dependent var]是一个0或1的二进制变量,1代表该对象读了研究生,否则是0。

2. 对每一个观测值,我们根据估计出来的probit模型,算出他读研究生的概率是多少。Stata中,执行如下命令:

predict pscore, p

其中,pscore是定义的记录每个观测对象概率的变量名称。

3. 使用psmatch2命令,让Stata帮你对于每个读了研究生的观测对象,找出一个与之具有最接近的概率值的,可是没有读研究生的观测对象:

psmatch2 [dependent var], pscore(pscore) noreplacement

其中,(pscore)是在第二步中生成的那个记录对象概率的变量,noreplacement是一个选项,使得任何读了研究生的观察对象的对照对象都具有唯一性,换言之,只能1对1匹配。

4. Stata会在你的数据中自动添加几个变量,其中_id是自动生成的每一个观测对象唯一的ID;_treated表示某个对象是否读了研究生,如果读了,_n表示的是他被匹配到的对照对象的_id;_pdif表示一组匹配了的观察对象他们概率值的差。

做好了这些,你就完成了一个最简单的1对1的倾向得分匹配。psmatch2还提供多种匹配方法,比如在一定的半径范围内的临近匹配、在一定概率阀值内的全部匹配等等。具体的可以在Stata中输入help psmatch2查看所有可用的选项。

参考文献:

Propensity score matching

Help for psmatch2

倾向得分匹配(Propensity Score Matching) 通俗解析及在Stata里的运用相关推荐

  1. 倾向性评分匹配 Propensity Score Matching

    @[TOC](倾向性得分匹配 Propensity Score Matching)k 前言 提示:本文为基于Youtube视频:An intuitive introduction to Propens ...

  2. 倾向得分匹配的stata命令_计量方法的适用条件汇总(二):倾向得分匹配

    独家揭秘: 计量经济学的魅力与激情:陈强老师的高级计量现场班侧记(2019.5.1) 如何学好高级计量:探秘陈强老师的高级计量及Stata现场班(2019.10.1) 接上期推文,本期探讨倾向得分匹配 ...

  3. Propensity Score Matching

    Propensity Score Matching 倾向性得分匹配 直观解释 引言 Randomized Controlled Trials Vs Observational Studies The ...

  4. stata 倾向得分匹配操作

    倾向得分匹配法是一种研究方法,它在研究某项治疗.政策.或者其他事件的影响因素上很常见.对于经济.金融学领域来说,比如需要研究某个劳动者接受某种高等教育对其收入的影响,或者比如研究某个企业运用了某项管理 ...

  5. Propensity Score Matching(PSM)倾向性评分匹配

    Propensity Score Matching(PSM)倾向性评分匹配 PSM能够解决什么问题? 在医疗领域,研究一款新药是否有效,通常需要做的是大规模分组实验,treatment(实验组) 与 ...

  6. rdd 内生分组_内生性问题和倾向得分匹配, 献给准自然试验的厚礼

    欢迎投稿(荐稿)计量经济圈,计量相关都行 邮箱:econometrics666@sina.cn 编辑: @计量经济圈(ID: econometrics666); 来源: 统计学和量化研究 公众号; 感 ...

  7. 倾向得分匹配的stata命令_培训对工资是否影响显著:倾向得分匹配法(PSM)及stata实现...

    第一部分   模型背景 1.研究目的 2.基本思想 第二部分   数据介绍以及语法简介 1.数据介绍 2.语法格式 第三部分   案例讲解以及stata实现 1.变量介绍以及数据描述性统计 2.倾向匹 ...

  8. psm倾向得分匹配法举例_一文读懂倾向得分匹配法(PSM)举例及stata实现(一)

    原标题:一文读懂倾向得分匹配法(PSM)举例及stata实现(一) 一.倾向匹配得分应用之培训对工资的效应 政策背景:国家支持工作示范项目( National Supported Work,NSW ) ...

  9. 久菜盒子:stata-广义倾向得分匹配

    广义倾向得分匹配(Generalized Propensity Score Matching,GPSM)是一种常用的处理非随机样本选择偏差的方法.以下是GPSM在Stata中的一个示例代码: 导入数据 ...

最新文章

  1. 怎么用u盘在服务器上传文件,U盘向云服务器传输文件吗
  2. 怎样学好python-怎样学好python
  3. javaweb jsp
  4. 大数据python试卷_大数据起步--Python语言-中国大学mooc-试题题目及答案
  5. JS解析json数据并将json字符串转化为数组的实现方法
  6. 如何建立好的索引.--针对Distinct
  7. java integer 包_java之学习基本类型包装类的概述及Integer类的概述和构造方法
  8. 渗透测试web未设置http头 Strict Transport Security
  9. 进入快速通道的委托(深入理解c#)
  10. jQuery再学习之二、jQuery选择器
  11. 35、【华为HCIE-Storage】--快照
  12. Cocostudio使用简介
  13. 锐起3.1无盘服务器,[迎新春]锐起3.1无盘XP万能包13V2(IE8版本)
  14. python之获取星期字符串
  15. 阿里云DDNS+iKuai 软路由+证书安装
  16. 华为官方翻新产品秒杀活动来袭,官方正品,7折优惠,真香!
  17. java 获取一天的起始时间和结束时间
  18. 最新红包抓娃娃源码带教程
  19. 如何下载bing必应首页图片
  20. 64格棋盘放芝麻,求重量。

热门文章

  1. 安全军火库:渗透测试工具流行性大调查
  2. SLAM各种并行加速方法
  3. 微信小程序-form表单提交
  4. mysql的定点数_MySQL浮点数和定点数
  5. javamail发送邮件带附件发送
  6. 谷粒学院16万字笔记+1600张配图(十一)——课程管理
  7. Android 手机状态栏变透明以及更换颜色
  8. 硅谷来信2-154-社交网络背后的逻辑
  9. 中小学生学习数学的软件的用户调研
  10. 【数据产品案例】周志华团队和蚂蚁金服合作:用分布式深度森林算法检测套现欺诈