目录

  • 1.安装psmatch2统计包。
  • 2.数据准备
  • 3.数据分析及命令解读
  • 4.结果解读
    • 4.1模型拟合结果,此处无太多实际意义。
    • 4.2试验组可匹配的观测概览,按照命令中设定的匹配规则,试验组有8例患者未能匹配到合适对照。
    • 4.3结果解读的重点应该是对stata新生成的中间变量的解读。
    • 4.4均衡性检验结果
    • 4.5匹配结果的图示化
  • 5.Stata命令汇总
  • 最后留下两个问题给大家思考:
  • 题目

试验设计中,匹配的目的在于确保干预效应估计是建立在可比个体之间的不同结果的基础上。最简单的匹配方式是将干预组和对照组中协变量值相同的两个个体进行配对分析。但是,如果协变量并不是某一个变量,而是一组变量时,这种简单的匹配方式也就不再适用,而是采用倾向得分匹配方式进行匹配。倾向性匹配得分(PSM)分析,主流统计学软件SAS、Stata、SPSS(22.0以上版本)、R语言均可实现。但SAS难度较高,不推荐;SPSS虽然操作简便,但是仅能实现1:1匹配,如无特殊需求可以尝试。笔者重点推荐使用Stata或者R语言完成PSM分析。下面笔者将以实例演示的形式讲解Stata软件在倾向性匹配得分中的应用。

1.安装psmatch2统计包。

命令如下:

.ssc install psmatch2

需要在联网状态下键入上述命令,然后软件自动搜索对应的程序包进行安装,成功安装后会有以下提示:

checking psmatch2 consistency and verifying not already installed…
installing into .\ado\plus… installation complete.(出现此提示表示安装完成)

为了验证是否成功安装以及查看psmatch2命令的帮助菜单,可在命令窗口键入

.help psmatch2

如果能顺利弹出帮助文件,表示安装成功,可正常使用。

2.数据准备

数据如下图所示,共有10个变量,614个观测,试验组185例,对照组429例。treat变量即为分组变量,“1”=试验组,“0”=对照组。age, educ, black, hispan, married, nodegree, re74, re75为协变量, re78为结局变量。事实上,倾向性匹配得分分析是要建立一个以分组变量(treat)为因变量,各个协变量(age, educ, black, hispan, married, nodegree, re74, re75)为自变量的回归方程。而结局变量(re78)在PSM过程中几乎不参与建模。

图1. 数据整理

3.数据分析及命令解读

命令窗口键入如下命令:

.gen tmp = runiform()
.sort tmp (以上两步对所有观测值进行随机排序)
.psmatch2 treat age educ black hispan married nodegree re74 re75, out(re78) logit neighbor(1) common caliper(.05) ties
.pstest, both
.psgraph

命令解读:
以下是帮助菜单中psmatch2语法格式,

psmatch2 depvar [indepvars] [if exp] [in range] [, outcome(varlist)
pscore(varname) neighbor(integer) radius caliper(real)
mahalanobis(varlist) ai(integer) population altvariance kernel llr
kerneltype(type) bwidth(real) spline nknots(integer) common trim(real)
noreplacement descending odds index logit ties quietly w(matrix) ate]

简单说就是:psmatch2 因变量 协变量,[选择项]。重点解读命令语句中选择项的含义。本例中选择“nearest neighbor matching within caliper”匹配方法。out(re78)指明结局变量。logit指定使用logit模型进行拟合,默认的是probit模型。neighbor(1)指定按照1:1进行匹配,如果要按照1:3进行匹配,则设定为neighbor(3),本例中因对照组样本量有限,仅适合1:1进行匹配。common强制排除试验组中倾向值大于对照组最大倾向值或低于对照组最小倾向值。caliper(.05)试验组与匹配对照所允许的最大距离为0.05。ties强制当试验组观测有不止一个最优匹配时同时记录。
pstest, both做匹配后均衡性检验,理论上说此处只能对连续变量做均衡性检验,对分类变量的均衡性检验应该重新整理数据后运用χ2检验或者秩和检验。但此处对于分类变量也有一定的参考价值。
psgraph对匹配的结果进行图示。

4.结果解读

4.1模型拟合结果,此处无太多实际意义。

图2. 回归结果

4.2试验组可匹配的观测概览,按照命令中设定的匹配规则,试验组有8例患者未能匹配到合适对照。

图3. 匹配情况概览

4.3结果解读的重点应该是对stata新生成的中间变量的解读。

打开数据编辑窗口,会发现软件自动生成了几个新变量:其中_pscore是每个观测值对应的倾向值;_id是自动生成的每一个观测对象唯一的ID(事实上这列变量即是对_pscore排序);_treated表示某个对象是否试验组;_n1表示的是他被匹配到的对照对象的_id(如果是1:3匹配,还会生成_n2, _n3);_pdif表示一组匹配了的观察对象他们概率值的差。为了观察方便可以按照id变量进行排序,排序后结果如下图所示:

图4. 匹配后的数据
匹配后数据整理进行统计分析即可。

4.4均衡性检验结果

图5. 均衡性检验结果
由均衡性检验结果可知,(1)各变量匹配后在试验组和对照组间是均衡的。(2)只有educ这个变量匹配前后试验组较对照组p值无变化,匹配前该变量试验组和对照组就无差别,匹配后不太可能出现差异,因此在建模的时候也可以考虑把educ这个变量排除,事实证明排除这个变量后匹配结果更为理想,读者可自行尝试。需要再次强调的是,此处理论上说只能对连续变量做均衡性检验,对分类变量的均衡性检验应该重新整理数据后运用χ2检验或者秩和检验等方法。

4.5匹配结果的图示化

图6. 匹配结果

5.Stata命令汇总

.ssc install psmatch2 #安装程序包
.use "F:\lalonde.dta" #调用F盘存储数据
.gen tmp = runiform()
.sort tmp #对所有观测随机排序
.psmatch2 treat age educ black hispan married nodegree re74 re75, out(re78) logit neighbor(1) common caliper(.05) ties #PSM分析
.pstest, both #均衡性检验
.psgraph #图示匹配结果

最后留下两个问题给大家思考:

问题1:倾向性匹配得分分析这么牛,是不是可以替代设计良好的随机对照试验?
问题2:PSM既然可以很好的均衡基线特征,统计分析时继续运用多元回归是否还有必要?

题目

凡事有利必有弊!PSM肯定不是完美无缺的(废话,如果PSM完美无缺,那还要随机对照试验干什么?)。大家觉得PSM这种方法有何缺陷呢?当然,也可以顺便谈谈PSM的优点。
查看源图
计量经济圈资深圈友:Inno·静,贡献倾向得分匹配分析代码
第一种:
教程: 倾向匹配分析深度(Propsensity matching analysis)
安装系统包:ssc install psmatch2

统计缺失值:misstable sum smoke2_new qa1age employ2014 cfps2010edu_best qe1_best urban qq301 qg307siops feduc meduc

建模:probit smoke2_new qa1age employ2014 cfps2010edu_best qe1_best urban qq301 qg307siops feduc meduc

计算得分:predict pscore, p

匹配:

psmatch2 smoke2_new, pscore(pscore) noreplacement
attnd med_per fasmoke3_why $xlist, pscore(myscore) comsup boot reps($breps) dots

第二种:

psmatch2  smoke2_new qa1age employ2014 cfps2010edu_best qe1_best urban qq301 feduc meduc, out(income) logit neighbor(1) common caliper(.05) tiespstest, bothpsgraph

简单说就是:psmatch2 因变量 协变量,[选择项]。重点解读命令语句中选择项的含义。本例中选择“nearest neighbor matching within caliper”匹配方法。out(re78)指明结局变量。logit指定使用logit模型进行拟合,默认的是probit模型。neighbor(1)指定按照1:1进行匹配,如果要按照1:3进行匹配,则设定为neighbor(3),本例中因对照组样本量有限,仅适合1:1进行匹配。

common强制排除试验组中倾向值大于对照组最大倾向值或低于对照组最小倾向值。caliper(.05)试验组与匹配对照所允许的最大距离为0.05。ties强制当试验组观测有不止一个最优匹配时同时记录。

pstest, both做匹配后均衡性检验,理论上说此处只能对连续变量做均衡性检验,对分类变量的均衡性检验应该重新整理数据后运用χ2检验或者秩和检验。但此处对于分类变量也有一定的参考价值。

psgraph对匹配的结果进行图示。

第三种:

global ylist logmed_per5global treat fasmoke1_whyglobal xlist falcohol3_why fasmokenum2_why smoke_longth logindincglobal xlist falcohol3_why logindincpscore $treat $xlist, pscore(mypscore) blockid(myblock) detail,if household_hsy==1psgraph, treated($treat)pscore(mypscore)gen logitpscore = log(mypscore/(1-mypscore))sum logitpscorequi psmatch2 $treat, outcome($ylist) pscore(mypscore) caliper(.01138) neighbor(1)pstest $xlist, treated($treat) both graph, if household_hsy==1drop mypscore myblock

PSM倾向匹配详细步骤和程序相关推荐

  1. 分享微信小程序开发详细步骤

    1.梳理小程序开发功能需求 自己可以用思维导图写出自己想要开发的小程序里面,需要设置哪些功能,这些功能帮助我解决什么问题.然后把想法用文字形式在思维导图中写出来. 如果不知道如果梳理,也可以找专业的产 ...

  2. PSM倾向得分匹配法【python实操篇】

    前言 大家好,我是顾先生,PSM倾向性得分匹配法的Python代码实操终于来啦! ​ 对于PSM原理不太熟悉的同学可以看看前一篇文章:PSM倾向得分匹配法[上篇:理论篇] 目前网上PSM实操的相关文章 ...

  3. W7程序计算机面板介绍,win7系统隐藏任意程序运行界面的详细步骤

    win7系统使用久了,好多网友反馈说win7系统隐藏任意程序运行界面的问题,非常不方便.有什么办法可以永久解决win7系统隐藏任意程序运行界面的问题,面对win7系统隐藏任意程序运行界面的图文步骤非常 ...

  4. 微信小程序开发详细步骤解决方案

    什么行业适合使用微信小程序? 01. 什么是微信小程序? 微信内嵌的小程序,不需要下载安装就能使用,具有开发成本低.使用方便等特点,它实现了应用"触手可及",用户通过扫描或搜索就能 ...

  5. PSM倾向得分匹配代码和案例数据

    PSM倾向得分匹配代码和案例数据 含义:倾向评分匹配(Propensity Score Matching,简称PSM)是一种统计学方法,用于处理观察研究(Observational Study)的数据 ...

  6. 微信小程序开发详细步骤(企业小程序开发流程)

    今天珍奶bb给大家简单唠唠微信小程序开发详细步骤(企业小程序开发流程)? 微信小程序制作流程是什么?微信小程序制作模板套用怎么操作?今天珍奶bb给大家简单唠唠微信小程序制作流程是什么? 在唠微信小程序 ...

  7. 微信小程序开发的详细步骤是什么?

    微信小程序开发的详细步骤如下: 1.注册微信小程序开发者账号:需要前往微信公众平台注册一个小程序开发者账号. 2.创建小程序:登录小程序开发者工具,创建一个新的小程序项目,并填写小程序基本信息. 3. ...

  8. 【Windows】普通控制台EXE程序转为windows服务方式运行的详细步骤

    背景 NSSM(Non-Sucking Service Manager)是一个免费的第三方Windows服务管理器,可以将任何可执行文件转换为Windows服务.官网下载地址为:https://nss ...

  9. NSIS(Nullsoft Scriptable Install System)开源安装程序制作软件使用详细步骤(Windows系统下)

    NSIS(Nullsoft Scriptable Install System)开源安装程序制作软件使用详细步骤(Windows系统下)安装包制作 1.软件详情 软件版本 版本说明 翻译跟进 2.教程 ...

最新文章

  1. 讲一讲什么是 MMAP
  2. docker服务器、以及容器设置自动启动
  3. php代码在线快速生成,PHPGEN在线代码生成器
  4. .mdf 如何导入到sqlyog_FLASH如何实例游戏中的音效控制(AS3)
  5. html:(13):ol-li和div作用
  6. Unlicensed ARC session – terminating!
  7. php 缩略图 失真,WORDPRESS缩略图失真变形模糊的解决方法
  8. linux上dig命令,Linux dig命令(示例代码)
  9. System V信号量
  10. IOC 容器中那些鲜为人知的细节(关于 FactoryBean 和 BeanFactory)
  11. vue.js的ajax和jsonp请求
  12. 个人博客网站可以通过写系列连载文章来吸引用户
  13. 协作机器人关节模组总结
  14. 了解H.264(AVC)的你,知不知道什么是SVC?
  15. Creator H5全平台游戏开发教程 PDF 下载(800+页)
  16. html5 |移动 游戏 毕业设计,移动平台下基于HTML5的教育游戏研究与设计
  17. SpringBoot的幕后推手,分布式架构演进+相关笔记参考
  18. 科斯定理-载罗纳德·科斯
  19. android 应用软件注册与自动登录代码
  20. ThinkRock简介

热门文章

  1. php常见错误,php常见错误及错误处理 - 小俊学习网
  2. 问题小结:解决Ubuntu18.04系统无法连接WIFI
  3. 电网计算机面试专业题,国家电网计算机管理员面试经验|面试题 - 职朋职业圈...
  4. 部署web项目在腾讯云当中
  5. HIP4082电机驱动电路详解
  6. 什么时候应该在ECMAScript 6中使用Arrow函数?
  7. 关于健身的那点儿事儿
  8. 修复Ubuntu文件系统
  9. ABD — android debug bridge 简略介绍
  10. 利用正则表达式做验证登录