原文链接:http://tecdat.cn/?p=6400

原文出处:拓端数据部落公众号

众所周知,调整一个或多个基线协变量可以增加随机对照试验中的统计功效。调整分析未被更广泛使用的一个原因可能是因为研究人员可能担心如果基线协变量的影响在结果的回归模型中没有正确建模,结果可能会有偏差。

建立

我们假设我们有关于受试者的双臂试验的数据。对于第i个主题,我们记录基线协变量和结果。我们让表示受试者是否被随机分配到新治疗组或标准治疗组的二元指标。在一些情况下,基线协变量可以是在随访时测量的相同变量(例如血压)的测量值。

错误指定的可靠性

我们现在提出这样一个问题:普通最小二乘估计是否是无偏的,即使假设的线性回归模型未必正确指定?答案是肯定的 。

这意味着对于通过线性回归分析的连续结果,我们不需要担心通过潜在错误指定效应,我们可能会将偏差引入治疗效果估计。

模拟

为了说明这些结果,我们进行了一项小型模拟研究。

我们进行了三次分析:1)使用lm()进行未经调整的分析,相当于两个样本t检验,2)调整后的分析,包括线性,因此错误指定结果模型,以及3)正确的调整分析,包括线性和二次效应。

nsim <- 1000n <- 1000
pi <- 0.5unadjusted <- array(0, dim=nsim)
adjustedmisspec <- array(0, dim=nsim)
adjustedcorrspec <- array(0, dim=nsim)for (sim in 1:nsim) {z <- rbinom(n, 1, pi)
x <-  (n)y <- x+x^2+z+ (n)#analysis not adjusting for baseline
unadjustedMod <- lm(y~z)
unadjusted[sim] <-  (unadjustedMod)[2]#adjusted analysis misspecified
adjustedmisspecMod <- lm(y~z+x)
adjustedmisspec[sim] <-  (adjustedmisspecMod)[2]#adjusted correctly specified
xsq <- x^2
adjustedcorrspecMod <- lm(y~z+x+xsq)
adjustedcorrspec[sim] <-  (adjustedcorrspecMod)[2]}mean(unadjusted)
mean(adjustedmisspec)
mean(adjustedcorrspec)sd(unadjusted)
sd(adjustedmisspec)
sd(adjustedcorrspec)

运行这个  :

> mean(unadjusted)
[1] 0.9988225
> mean(adjustedmisspec)
[1] 0.9980142
> mean(adjustedcorrspec)
[1] 0.9995535
> sd(unadjusted)
[1] 0.121609
> sd(adjustedmisspec)
[1] 0.1090832
> sd(adjustedcorrspec)
[1] 0.0639239

正如所料,所有三个估算都是公正的。 但是,如果我们能够正确指定基线协变量的影响,我们也会看到更大的效率增益。

非常感谢您阅读本文,有任何问题请在下方留言!

拓端tecdat|R语言在RCT中调整基线时对错误指定的稳健性相关推荐

  1. 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...

  2. 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测

    最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...

  3. 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系

    最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...

  4. 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例

    最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...

  5. R语言可视化图像中最常用的点样式(pch、plot characters)列表、ggpubr::show_point_shapes可视化最常用的点样式(pch)

    R语言可视化图像中最常用的点样式(pch.plot characters)列表.ggpubr::show_point_shapes可视化最常用的点样式(pch) 目录

  6. R语言text函数在R原生可视化结果中添加文本标签、内容:指定文本显示的位置、颜色、字体大小等(Position、Change Color 、 Size of Text)

    R语言text函数在R原生可视化结果中添加文本标签.内容:指定文本显示的位置.颜色.字体大小等(Position.Change Color . Size of Text) 目录

  7. R语言e1071包中的支持向量机:构建nu-classification类型的支持向量机SVM并分析不同nu值惩罚下模型分类螺旋线型(sprials)线性不可分数据集的表现

    R语言e1071包中的支持向量机:构建nu-classification类型的支持向量机SVM并分析不同nu值惩罚下模型分类螺旋线型(sprials)线性不可分数据集的表现 目录

  8. R语言e1071包中的支持向量机:仿真数据(螺旋线性不可分数据集)、简单线性核的支持向量机SVM(模型在测试集上的表现、可视化模型预测的结果、添加超平面区域与原始数据标签进行对比分析)、如何改进核函数

    R语言e1071包中的支持向量机:仿真数据(螺旋线性不可分数据集).简单线性核的支持向量机SVM(模型在测试集上的表现.可视化模型预测的结果.添加超平面区域与原始数据标签进行对比分析).如何改进核函数 ...

  9. R语言在ggplot中使用变量指定柱状图的名称实战

    R语言在ggplot中使用变量指定柱状图的名称实战 目录 R语言在ggplot中使用变量指定柱状图的名称实战

  10. R语言把dataframe中的NA值替换为0

    R语言把dataframe中的NA值替换为0 目录 R语言把dataframe中的NA值替换为0 缺失值替换 方法总结 缺失值替换

最新文章

  1. AI算法透明不是必须,黑箱和可解释性可简化为优化问题
  2. python打不开-python程序无法打开是怎么回事
  3. Unity初步 基本拼图实现
  4. java jsoup html_使用JAVA中的JSOUP从HTML中提取CSS样式
  5. 如果有一天,我们再见面
  6. OPENCV-PYTHON将.GIF格式的图像转为PNG格式
  7. Intersection - POJ 1410(线段与矩形是否相交)
  8. JS原生封装时间函数 日期格式过滤
  9. pc样式在ie8中的bug
  10. 云耀服务器切换系统,【计算】云耀服务器-常见操作汇总指南
  11. LeetCode 2155. 分组得分最高的所有下标(前缀和)
  12. 戴尔科技:以技术突破创新边界!
  13. Centos7 之目录处理命令(八)
  14. 计算工资底薪加提成的java_月工资如何计算我是做服务行业,底薪2200全勤100加提成5 - 找法网(findlaw.cn)...
  15. 使用netmeeting进行网络培训
  16. 计算机网络原理 - 网络层、链路层总结笔记
  17. cad断点快捷键_CAD打断命令怎么使用,快捷键是什么
  18. 第二证券|钠电池三种技术路线谁更将率先取代锂电池?
  19. 某微信公众号运营数据分析报告
  20. 正则表达式-贪婪匹配与懒惰匹配之获取短信验证码

热门文章

  1. 邢波老师致广大学员的一封信(2010-10-26)
  2. Hibernate 主键策略
  3. 计算机世界:免费的代价
  4. 多线程读取视频及深度学习推理
  5. 一篇文章掌握MySQL事务的四大特性
  6. pytorch可视化
  7. 类的多态性:成员变量与成员方法访问特点(C++、Java)
  8. springcloud-config-client的那些坑
  9. Springboot 统一maper 和逆向工程
  10. 二维码ZBar之ZBarReaderView