拓端tecdat|R语言使用倾向评分提高RCT(随机对照试验)的效率
原文链接:http://tecdat.cn/?p=6404
原文出处:拓端数据部落公众号
倾向评分已成为观察性研究中混杂因素调整的常用方法。基本思想是模拟接受治疗或暴露的概率如何取决于混杂因素,即要治疗的“倾向”。
首先要注意的是,人们不会认为倾向评分在RCT中起作用。如上所述,倾向评分用于调整观察性研究中的混淆。在RCT中,随机化确保治疗和其他基线变量在统计学上是独立的,即没有混淆。那么倾向得分有什么用呢?
治疗加权方法的逆概率
在论文中,Williamson,Forbes和White描述了如何使用倾向得分来获得效率提高的治疗效果评估(较小的标准误差)。该方法与标准方法相同,其中人们估计倾向评分模型,然后拟合通过倾向评分的倒数加权的结果模型。因此,在第一步中,我们拟合二元治疗指标的模型,基线变量作为协变量。通常我们会使用逻辑回归模型进行建模。
从拟合的倾向评分模型中,我们获得试验中每个受试者的估计接受治疗的概率(而不是对照)。对于二元结果,我们可以拟合逻辑或对数链接回归来估计比值比或风险比。
模拟研究
对于实际的方法,我们可以使用二元结果和正态分布的基线变量进行小型模拟研究。我们使用逻辑回归模型生成。然后,我们使用基线变量(未调整的分析)估算优势比,然后实施IPTW估算器:
###模拟研究
nSim < - 1000
n < - 1000unadjustedEst < - array(0,dim = nSim)
IPTW_Est < - array(0,dim = nSim)for(i in 1:nSim){z < - 1 *(runif(n)<0.5)
x < - rnorm(n)
xb < - x + z
prob < - exp(xb)/(1 + exp(xb))
y < - 1 *(runif(n)<prob)未调整的< - glm(y~z,family = binomial)#IPTW估算
#first我们适合倾向评分模型
propModel < - glm(z~x,family = binomial)
fitted_p < - 拟合(propModel)
#calculate权重
wgt < - 1 / fitted_p
wgt [z == 0] < - 1 /(1-fitted_p [z == 0])iptwMod < - glm(y~z,family = binomial,weight = wgt)
IPTW_Est [i] < - iptwMod $ coef [2]}
然后,我们通过观察1000个模拟中的平均值和经验值SD来查看两个估算器的性能:
> mean(unadjustedEst)
[1] 0.8392246
> sd(unadjustedEst)
[1] 0.1353718
>
> mean(IPTW_Est)
[1] 0.8364911
> sd(IPTW_Est)
[1] 0.1220977
我们首先注意到平均对数比值比处理效果估计值约为0.84,而不是数据生成机制中使用的值1。这是因为0.84是边际优势比,而1是条件优势比。
接下来,我们看到IPTW估计器在重复样本中的变量小于标准的未调整估计器。因此,我们通过使用基线变量获得了效率。
非常感谢您阅读本文,有任何问题请在下方留言!
拓端tecdat|R语言使用倾向评分提高RCT(随机对照试验)的效率相关推荐
- R语言使用倾向评分提高RCT(随机对照试验)的效率
倾向评分已成为观察性研究中混杂因素调整的常用方法.基本思想是模拟接受治疗或暴露的概率如何取决于混杂因素,即要治疗的"倾向". 我们围绕RCT技术进行一些咨询,帮助客户解决独特的业务 ...
- 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险
最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...
- 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测
最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...
- 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系
最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...
- 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例
最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...
- 拓端tecdat荣获掘金社区入驻新人奖
2021年7月,由掘金发起了"入驻成长礼"颁奖活动.本次活动邀请到知名开发者.服务机构代表等业界人士. 据了解,掘金社区"新入驻创作者礼"主要对已经积累了一定历 ...
- 拓端tecdat荣获2022年度51CTO博主之星
相信技术,传递价值,这是51CTO每一个技术创作者的动力与信念,2022 年度,拓端tecdat 作为新锐的数据分析咨询公司,在51CTO平台上,不断的输出优质的技术文章,分享前沿创新技术,输出最佳生 ...
- 拓端tecdat|bilibili视频流量数据潜望镜
最近我们被客户要求撰写关于bilibili视频流量的研究报告,包括一些图形和统计输出. 最新研究表明,中国有超过7亿人在观看在线视频内容.Bilibili,被称为哔哩哔哩或简称为B站,是中国大陆第二个 ...
- 利用R语言预测银行客户信用的优劣(随机森林方法)
我们选取的数据时1994年德国的一家银行在平定客户信用风险好坏的时候用到的一组变量,共有1000组数据.由于年代久远可能和实际有些出入.数据可以在下面的网址下载. http://archive.ics ...
- R语言并行化基础与提高
本文将介绍R中的并行计算,并给出了一些常见的陷进以及避免它们的小技巧. 使用并行计算的原因就是因为程序运行时间太长.大部分程序都是可以并行化的,它们大部分都是Embarrassingly parall ...
最新文章
- elasticsearch-.yml(中文配置详解)
- iOS9 Search API 之 Spotlight
- 数字图像处理——第三章 空间域图像增强(灰度变换和直方图处理)
- R语言:常用函数总结
- LeetCode:62. 不同路径
- Perl学习笔记(2)
- maven jacoco_使用JaCoCo Maven插件为单元和集成测试创建代码覆盖率报告
- php分区表,【MYSQL】分区表
- 【抽象代数】因子分解与域的扩展
- 吊打奔驰宝马!这个又贵又丑的“玩具”,为何让男人集体高潮?
- springboot多环境配置_编辑 SpringBoot|第五章:多环境配置
- 梅西精彩过人绝技,太帅了!
- 分布式缓存管理与查询系统
- JavaSE基础之-Calendar时间类
- 计算机网络技术专业职业能力分析的结论与成效
- 微信加人就服务器频繁,微信加同一个人好友,提示操作过于频繁,请稍后重试!这个是什么意思啊?...
- 一、简单刷题APP(题库是Excel)之项目功能和效果图
- 手机连接Fiddler后无法上网(已解决)
- Linux Mint系统常用软件安装
- 算法题|-灯泡开关问题