倾向得分匹配,在医学研究及计量经济领域都有广泛应用,其目的在于减少数据偏差和混杂因素的干扰。

很多统计软件都支持PSM,如SPSS和stata。SPSSAU最新版本也提供了倾向得分匹配。

下面我们就一起来了解下,究竟什么是倾向得分匹配?以及如何分析?

PSM解决的是选择偏差问题(即控制混杂因素),倾向得分配比就是利用倾向评分值,从对照组中为处理做中的每个个体寻找一个或多个背景特征相同或相似的个体作为对照。这样就最大程度降低了其他混杂因素的干扰。

比如,想研究‘读研究生’对于收入的影响。一种简单的做法是直接对比‘读过’和‘没有读过’这两类群体的收入差异,但这种做法并不科学。因为还可能存在其他变量影响着研究结果,如性别,年龄,父母学历,父母是否做教育工作等因素都会干扰到研究。

因此,PSM正是为了减少这种干扰。PSM可实现找到类似的两类人,他们的基本特征都基本一致,主要区别在于‘是否读过’研究生。这样可减少干扰因素差异带来的数据偏差和混杂干扰。

一、案例背景

当前有一项‘读研对于收入影响’的研究,共收集1000个研究对象(样本)。其中有的研究对象‘读研究生’,有的研究对象‘没有读研究生’,希望研究是否读过研究生,对于年收入的影响情况。其他变量还包括父母学历,父母是否从事教育相关职业等。

二、操作步骤

选择【计量经济研究】--【倾向得分匹配】。

【研究变量】:放入主要研究变量。本例中为“是否读研”

【特征项】:放入其他可能影响结果的变量。本例中为“父亲学历”、“母亲学历”、“父亲是否从事教育”、“母亲是否从事教育”。

依次将变量放入,点击开始分析。

SPSSAU默认使用最邻近匹配法,进行匹配。抽选方法可以选择不放回抽样和放回抽样两种。

勾选[保存信息],可自动保存匹配得分、匹配关系、匹配成功次数及匹配ID。

三、结果解读

1 基本信息汇总

从上表可知:本次PSM分析使用最邻近匹配方式,并且精确匹配优先的算法,且使用放回抽样方法。总共待匹配项(‘读过研究生’的样本数量)为233个,全部都实现精确匹配成功,匹配成功率为100%。

此表格仅列出算法的过程信息等,具体匹配效果应以下表格即PSM平行假设检验表格为准。

2 平行假设检验

从上表可知:在匹配前,实验组和控制组(是否读研两类群体),他们的父母特征,包括父亲是否从事教育,父亲学历和母亲学历均有着显著性差异(p 值 <0.05),也即说明是否读研两类群体,他们的父母背景特征确实有着不一致性,父母背景特征属于干扰因素。

在匹配之后,‘父亲是否从事教育’,‘母亲是否从事教育’,‘父亲学历’和‘母亲学历’这4项干扰因素,在实验组和控制组两组间并没有呈现出显著性(p 值>0.05),即说明匹配之后,实验组和控制组在父母背景特征上具有一致性。

同时针对标准化偏差值来看,在匹配之后,该值全部均为0,小于20%,即说明匹配之后,‘父亲是否从事教育’,‘母亲是否从事教育’,‘父亲学历’和‘母亲学历’这4项上,实验组和控制组的特征基本一致。(PS:本案例数据较好,因此匹配后标准化偏差完全为0%,实际研究中可能较少出现此类现象)

针对‘标准化偏差减少幅度’来看,该值为100%,也即说明PSM匹配后,实验组和控制组的个体特征差异性,得到了非常明显的改善。匹配前,实验组和控制组在干扰因素之间的平均值差异明显,但匹配之后,实验组和控制组在干扰因素之间的平均值差异不明显。

综合上述说明可知:此次PSM有着良好的效果,PSM匹配后数据可用于进一步科学研究使用。

SPSSAU系统返回的weight信息数据,weight为0表示匹配成功次数为0,weight大于0说明肯定匹配成功(至少匹配成功1次),因此后续研究时,先筛选出weight大于0,然后再进行分析。比如本研究‘是否读研究生’对于‘年收入’的差异,因此可先筛选出weight大于0的数据,然后再进行t检验分析,对比‘是否读研究生’两类群体‘年收入’的差异性。

3 标准化偏差变化对比图表

通过标准化偏差的变化情况,可以了解到每个干扰因素修正前后的变化情况。

如果标准化偏差变化明显,则说明匹配效果较好。由于图中处理后的标准化偏差均为0.00%,说明匹配会让实验组和对照组数据时干扰因素特征的不一致得到明显的改善,意味着匹配效果良好。

四、其他说明

(1)匹配之后如何进行后续研究?

选中‘保存信息’后,SPSSAU系统返回的weight信息数据,weight为0表示匹配成功次数为0,weight大于0说明肯定匹配成功(至少匹配成功1次),因此后续研究时,先筛选出weight大于0,然后再进行分析。

(2)匹配效果不好怎么办?

PSM平行假设检验用于判断匹配效果,而且匹配效果是综合各项指标判断。如果各项指标均‘很差’,可以考虑以下几种做法,分别是:修改匹配方式,修改半径匹配的阀值,修改抽样方式,以及更换干扰因素项等,多次尝试对比找出最优结果即可。同时,PSM匹配并无完美的匹配效果,通常综合各项指标分析,在可接受范围内即可。

以上就是本次分享内容,登录SPSSAU官网了解更多内容。

psm倾向得分匹配法举例_一文了解什么是倾向得分匹配PSM?相关推荐

  1. psm倾向得分匹配法举例_一文读懂倾向得分匹配法(PSM)举例及stata实现(一)

    原标题:一文读懂倾向得分匹配法(PSM)举例及stata实现(一) 一.倾向匹配得分应用之培训对工资的效应 政策背景:国家支持工作示范项目( National Supported Work,NSW ) ...

  2. psm倾向得分匹配法举例_倾向得分匹配法(PSM)举例及stata实现

    倾向得分匹配法 (PSM) 举例及 stata 实现 偏好分数匹配法 (PSM) 和 stata 实施 - 阅读注释 [ 示例 ] 政策背景 : 国家支持的工作,新南威尔士州 ) 研究目标 : 测试接 ...

  3. psm倾向得分匹配法举例_倾向得分匹配法(PSM)举例和stata实现.pdf

    倾向得分匹配法(PSM )举例及stata 实现 --读书笔记 1 [例]培训对工资的效应 政策背景:国家支持工作示范项目(National Supported Work,NSW ) 研究目的:检验接 ...

  4. psm倾向得分匹配法举例_倾向得分匹配法(PSM)举例及stata实现.pdf

    倾向得分匹配法(PSM)举例及stata实现.pdf 倾向得分匹配法(PSM )举例及stata 实现 --读书笔记 1 [例]培训对工资的效应 政策背景:国家支持工作示范项目(National Su ...

  5. psm倾向得分匹配法举例_互助问答第110期:分组回归样本及倾向得分匹配相关问题...

    问题一: 用Stata进行分组回归的时候,数据量会变小.对于回归方程中使用的一些控制变量,比如是否为汉族这种二值虚拟变量可能出现极端的情况,在某一分组中的取值可能都为1,这样在进行回归时Stata会自 ...

  6. psm倾向得分匹配法举例_倾向得分匹配法 PSM

    PSM的定义 在医疗.经济.金融学等领域中,当某项公共政策实施后,我们通常希望通过一些方法去评估该项政策产生的影响,即政策的作用及效应,以更好的指导政策实施,服务于公共决策.比如研究某个劳动者接受某种 ...

  7. java 匹配mysql按钮_使用Java在mysql查询中设置匹配函数

    我有以下在java中查询(mysql)的摘录: queryGeral.append("FROM product p, fabricante_product fp, fabricante f, ...

  8. PSM倾向得分匹配法【python实操篇】

    前言 大家好,我是顾先生,PSM倾向性得分匹配法的Python代码实操终于来啦! ​ 对于PSM原理不太熟悉的同学可以看看前一篇文章:PSM倾向得分匹配法[上篇:理论篇] 目前网上PSM实操的相关文章 ...

  9. 倾向得分匹配的stata命令_培训对工资是否影响显著:倾向得分匹配法(PSM)及stata实现...

    第一部分   模型背景 1.研究目的 2.基本思想 第二部分   数据介绍以及语法简介 1.数据介绍 2.语法格式 第三部分   案例讲解以及stata实现 1.变量介绍以及数据描述性统计 2.倾向匹 ...

最新文章

  1. python循环五角星做法_python实现while循环打印星星的四种形状
  2. 命令行参数实现10万行小字典程序并输出查找时间
  3. ext的ajax写法,ExtJs的Ajax示例
  4. 828c语言程序设计_21计算机考研只考一门高级语言程序设计的院校大汇总!
  5. linux gfs原理,Linux GFS 配置方法及注意事项
  6. lduan SCVMM 2012 库服务器(五)
  7. 一看就懂的字符串匹配算法 之 BF算法(暴力匹配)
  8. Arcmap坐标系转换通用教程【简单明了】
  9. 数据库的内连接、左连接和右连接
  10. C语言数组和指针的区别
  11. dcp1608 linux驱动下载,兄弟激光 DCP-1608驱动
  12. 计算机桌面自设提示语,如何在电脑桌面便签上设置每周五自动弹窗提醒?
  13. C6678多核DSP——CMD文件介绍
  14. php pecl命令,linux 运行pecl命令报错解决办法
  15. 靶机渗透练习97-hacksudo:ProximaCentauri
  16. 【10086个赞】Cocos Creator助力H5游戏大爆发
  17. 根据起始时间和结束时间得到期间所有的日期集合
  18. php外语文献有哪些,外语论文参考文献
  19. [C++]auto类型说明符
  20. ds3617xs 华擎J3455 无线网卡m.2 E key接口扩展2个M.2 E key接口

热门文章

  1. 【Hadoop 】Hadoop datanode启动不起来的原因总结
  2. cad特性匹配快捷键命令_cad2010 特性匹配命令在哪?谢谢
  3. matlab图像处理-中值滤波原理
  4. c# string bytes 转换
  5. 基于555芯片的延时小灯
  6. 微软即将关闭基本身份验证,对企业与员工有什么影响?
  7. 城市交通治安卡口系统解决方案
  8. 基于poi包的流式文件和版式文件操作工具
  9. 计算机内存多大够用,内存多大才够用?电脑内存选购指南
  10. Google API大全