倾向评分已成为观察性研究中混杂因素调整的常用方法。基本思想是模拟接受治疗或暴露的概率如何取决于混杂因素,即要治疗的“倾向”。

我们围绕RCT技术进行一些咨询,帮助客户解决独特的业务问题。首先要注意的是,人们不会认为倾向评分在RCT中起作用。如上所述,倾向评分用于调整观察性研究中的混淆。在RCT中,随机化确保治疗和其他基线变量在统计学上是独立的,即没有混淆。那么倾向得分有什么用呢?

治疗加权方法的逆概率

在论文中,Williamson,Forbes和White描述了如何使用倾向得分来获得效率提高的治疗效果评估(较小的标准误差)。该方法与标准方法相同,其中人们估计倾向评分模型,然后拟合通过倾向评分的倒数加权的结果模型。因此,在第一步中,我们拟合二元治疗指标的模型,基线变量作为协变量。通常我们会使用逻辑回归模型进行建模。

从拟合的倾向评分模型中,我们获得试验中每个受试者的估计接受治疗的概率(而不是对照)。对于二元结果,我们可以拟合逻辑或对数链接回归来估计比值比或风险比。

模拟研究

对于实际的方法,我们可以使用二元结果和正态分布的基线变量进行小型模拟研究。我们使用逻辑回归模型生成。然后,我们使用基线变量(未调整的分析)估算优势比,然后实施IPTW估算器:

###模拟研究
nSim < -  1000
n < -  1000unadjustedEst < -  array(0,dim = nSim)
IPTW_Est < -  array(0,dim = nSim)for(i in 1:nSim){z < -  1 *(runif(n)<0.5)
x < -  rnorm(n)
xb < -  x + z
prob < -  exp(xb)/(1 + exp(xb))
y < -  1 *(runif(n)<prob)未调整的< -  glm(y~z,family = binomial)#IPTW估算
#first我们适合倾向评分模型
propModel < -  glm(z~x,family = binomial)
fitted_p < - 拟合(propModel)
#calculate权重
wgt < -  1 / fitted_p
wgt [z == 0] < -  1 /(1-fitted_p [z == 0])iptwMod < -  glm(y~z,family = binomial,weight = wgt)
IPTW_Est [i] < -  iptwMod $ coef [2]}
 然后,我们通过观察1000个模拟中的平均值和经验值SD来查看两个估算器的性能:
> mean(unadjustedEst)
[1] 0.8392246
> sd(unadjustedEst)
[1] 0.1353718
>
> mean(IPTW_Est)
[1] 0.8364911
> sd(IPTW_Est)
[1] 0.1220977

我们首先注意到平均对数比值比处理效果估计值约为0.84,而不是数据生成机制中使用的值1。这是因为0.84是边际优势比,而1是条件优势比。

接下来,我们看到IPTW估计器在重复样本中的变量小于标准的未调整估计器。因此,我们通过使用基线变量获得了效率。

R语言使用倾向评分提高RCT(随机对照试验)的效率相关推荐

  1. 利用R语言预测银行客户信用的优劣(随机森林方法)

    我们选取的数据时1994年德国的一家银行在平定客户信用风险好坏的时候用到的一组变量,共有1000组数据.由于年代久远可能和实际有些出入.数据可以在下面的网址下载. http://archive.ics ...

  2. R语言并行化基础与提高

    本文将介绍R中的并行计算,并给出了一些常见的陷进以及避免它们的小技巧. 使用并行计算的原因就是因为程序运行时间太长.大部分程序都是可以并行化的,它们大部分都是Embarrassingly parall ...

  3. R语言 scorecard包 评分卡

    我会把文章及时的更新到公共号上,欢迎大家的关注. library(scorecard) data("germancredit") print(dim(germancredit)) ...

  4. R语言第十一讲 决策树与随机森林

    概念 决策树主要有树的回归和分类方法,这些方法主要根据分层和分割 的方式将预测变量空间划分为一系列简单区域.对某个给定待预测的观 测值,用它所属区域中训练集的平均值或众数对其进行预测.         ...

  5. R语言 dataframe 取指定行列filter 随机取数

    一.dataframe基本操作 1.读取数据集,生成dataframe,查看前几行数据 data <- read.csv("../input/ab_data.csv", he ...

  6. R语言构建多元线性回归模型预测汽车的耗油效率

    目录 确定研究目的以及确定因变量和自变量 数据预处理 缺失值处理 异常值处理 估计回归模型参数,建立模型 判断数据是否满足多重线性回归假设条件 (1).线性 (2).独立性 (3).正态性 (4).方 ...

  7. 基于R语言3组以上倾向评分逆概率加权(IPTW)

    基于 PS (倾向评分)的IPTW 法首先由Rosenbaum作为一种以模型为基础的直接标准化法提出,属于边际结构模型.简单来说,就是把许多协变量和混杂因素打包成一个概率并进行加权,这样的话,我只用计 ...

  8. 随机森林c语言编程,一种基于随机森林的C语言源代码静态评分方法与流程

    本发明涉及评分领域及机器学习领域,它特别涉及一种基于随机森林的c语言源代码静态评分的构建方法. 背景技术: c语言源代码静态评分是指对根据一定的题目描述做出解答的c语言源代码进行评分.目前,主要流行的 ...

  9. R语言RCurl爬虫(多线程爬虫)-高评分豆瓣图书

    R语言爬虫-高评分图书(豆瓣) # R语言爬虫-高评分图书(豆瓣) 本篇文章依然延续之前的爬虫类型文章,多次实操有助于对于代码的理解和技术的提升.此次爬取的是豆瓣上高评分的图书,每一次爬取都会给大家提 ...

最新文章

  1. BCH潜力无限,引领区块链发展潮流
  2. opencv openpose
  3. php网站评论代码,PHP评论代码帮助
  4. chrome java虚拟机_JATT:谷歌的Java虚拟机自动调整工具
  5. java implements t_Java泛型——為什么“擴展T”允許而不是“實現T”?
  6. 【干货】从点击率预估的视角看腾讯社交广告算法大赛
  7. MYSQL-实现ORACLE- row_number() over(partition by ) 分组排序功能
  8. 与柯尼汉谈丹尼斯·里奇
  9. 机器学习系列文章【转自我的新浪博客】
  10. 【雅思大作文考官范文】——第十七篇: 'economic progress' essay
  11. qq邮件如何设置html阅读,使用qq邮箱发送html格式的邮件
  12. 仿热血江湖帮战客方.申请人物列表
  13. PACS医学影像DICOM dcmdictpath知识记录梳理
  14. shiro权限控制登陆成功页面跳转问题
  15. 张一鸣打造“抖音”等现象级产品的秘密:技术深度融合业务,引爆产品创新!...
  16. unity Camera控制(上帝视角)
  17. 线性嵌套实例(三个小实例)
  18. 如何用计算机名查看共享打印机,如何查找网络共享打印机名称
  19. 京东mate10评论分析
  20. python版本换行问题

热门文章

  1. 百度地图、高德地图、腾讯地图比较
  2. 百度地图行政区划边界线获取,只要界线,遮罩层透明设置方法
  3. Scala——多范式, 可伸缩, 类似Java的编程语言
  4. 【量化笔记】Markowitz均值-方差模型
  5. Python编写无界面版打字练习程序
  6. 优化工具 Neos Server
  7. [听风]TBC单体插件头像显示ShadowedUnitFrames
  8. 利用遗传算法库DEAP优化交易策略
  9. Kubernetes 管理员认证(CKA)考试笔记(一)
  10. 自律机与计算机联锁的接口,调度集中车站自律机与计算机联锁操作.doc