逆概率加权法（Inverse Probability Weighting, IPW）的原理及R实现

逆概率加权（IPW）是一种用于解释由于非随机选择观测值或人群信息的非随机缺失而造成的缺失和选择偏差的方法。

原理：这种方法可以通过对观察值的加权来修正分析，使其具有被选中的概率。IPW是基于这样一个假设，即整个研究人群都有可以预测纳入概率（非遗漏）的个体信息，因此，在考虑到这些信息后，我们可以仅从非遗漏的观察值开始对整个目标人群进行推断。计算的程序如下：首先，我们考虑整个研究人群，用逻辑回归模型计算非失访信息的概率，其中响应是非失访，协变量是其可能的预测因素。每个受试者的权重是由预测概率的倒数给出的。然后使用加权模型只对非失踪的观察值进行分析。IPW方法首先生成了一个留在研究中的模型。计算该模型的预测值，而IPW是该预测的留在研究中的概率的倒数。例如，一个一直留在研究中的受试者，但根据该模型，只有1%的机会留在随访中，他的权重为100。理由是他们不仅代表自己，还代表99个 "类似 "他们的人，这些人在随访样本中没有代表。
局限性：IPW是一种允许将选择过程嵌入估计分析中的技术，但它在 "纠正 "选择偏差方面的有效性取决于是否有足够的信息，对整个人口来说，预测非失访概率。通过对所有模型应用稳定的逆概率加权删来解决因数据缺失和失访而产生的潜在选择偏差，并提供了可推广到初始目标人群的结果。加权的应用可以减轻这种非随机选择和缺失造成的偏差，因此，可以将具有完3.整数据和随访的人口子集的结果推广到最初的目标人口。

IPW只能处理那些可以用观察到的信息来预测的数据缺失情况。如果数据缺失取决于结果的未来时间，而这显然是不可观察的，那么我们就不能在不做推测性假设的情况下以可靠的方式捕捉这种依赖关系。
当你使用IPW的技术时，最好是使用稳定的IP权重。它们的可变性较小，因此能产生一个更有效的估计。这就是稳定的IP权重的计算方法。

R实现：

#Simulate data with continuous confounder and outcome, binomial exposure.
#Marginal causal effect of exposure on outcome: 10.
n <- 1000
simdat <- data.frame(l = rnorm(n, 10, 5))
a.lin <- simdat$l - 10
pa <- exp(a.lin)/(1 + exp(a.lin))
simdat$a <- rbinom(n, 1, prob = pa)
simdat$y <- 10*simdat$a + 0.5*simdat$l + rnorm(n, -10, 5)
simdat[1:5,]
library(ipw)
#Estimate ipw weights.
temp <- ipwpoint(exposure = a,family = "binomial",link = "logit",numerator = ~ 1,denominator = ~ l,data = simdat)
summary(temp$ipw.weights)#Plot inverse probability weights
graphics.off()
ipwplot(weights = temp$ipw.weights, logscale = FALSE,main = "Stabilized weights", xlim = c(0, 8))#Examine numerator and denominator models.
summary(temp$num.mod)
summary(temp$den.mod)#Paste inverse probability weights
simdat$sw <- temp$ipw.weights#Marginal structural model for the causal effect of a on y
#corrected for confounding by l using inverse probability weighting
#with robust standard error from the survey package.
require("survey")
msm <- (svyglm(y ~ a, design = svydesign(~ 1, weights = ~ sw,data = simdat)))
coef(msm)
confint(msm)

ref:1.Inverse probability treatment weighting | R-bloggers

2.Narduzzi, Silvia, Martina Nicole Golini, Daniela Porta, Massimo Stafoggia, and Francesco Forastiere. "Inverse probability weighting (IPW) for evaluating and" correcting" selection bias." Epidemiologia e prevenzione 38, no. 5 (2014): 335-341.

3. Oulhote, Y., Lanphear, B., Braun, J.M., Webster, G.M., Arbuckle, T.E., Etzel, T., Forget-Dubois, N., Seguin, J.R., Bouchard, M.F., MacFarlane, A. and Ouellet, E., 2020. Gestational exposures to phthalates and folic acid, and autistic traits in Canadian children. Environmental health perspectives, 128(2), p.027004.

逆概率加权法（Inverse Probability Weighting, IPW）的原理及R实现相关推荐

基于R语言逆概率加权(IPTW)并行生存曲线分析
逆概率加权法最早由 Horvitz和Thompson提出,即对每个可观测的yi的概率取倒数,作为被观测的 yi 的权重,修正由缺失数据或有偏抽样带来的估计偏差.IPTW 是减少多组观察性数据间混杂偏倚 ...
基于R语言3组以上倾向评分逆概率加权(IPTW)
基于 PS (倾向评分)的IPTW 法首先由Rosenbaum作为一种以模型为基础的直接标准化法提出,属于边际结构模型.简单来说,就是把许多协变量和混杂因素打包成一个概率并进行加权,这样的话,我只用计 ...
关于辛普森悖论和逆概率加权的解决方案的记录
本质是不同实验间的总体成功率差别很大,而趋向于成功的分组总会更大概率获得成功例子1: 例子2: 逆概率加权: 可以把两种不同的实验样本均为同样本表现相当于权重归为100个人的表现
SPSS进行倾向评分逆概率加权（IPTW）
基于 PS (倾向评分)的IPTW 法首先由Rosenbaum作为一种以模型为基础的直接标准化法提出,属于边际结构模型.简单来说,就是把许多协变量和混杂因素打包成一个概率并进行加权,这样的话,我只用计 ...
基于MATLAB的全局多项式插值法（趋势面法）与逆距离加权（IDW）法插值与结果分析
基于MATLAB的全局多项式插值法(趋势面法)与逆距离加权(IDW)法插值与结果分析 1 背景知识 2 实际操作部分 2.1 空间数据读取 2.2 异常数据剔除 2.3 验证集筛选 2.4 最小二乘法 ...
分析师入门常见错误幸存者偏差，如何用匹配和加权法规避
公众号后台回复"图书",了解更多号主新书内容作者:数据狗来源:DataGo数据狗在日常功能迭代分析中,一般会直接看使用该功能和未使用该功能的用户在成功指标上的表现,将两组数据 ...
数据分析36计(22)：分析师入门常见错误幸存者偏差，如何用匹配和加权法规避...
在日常功能迭代分析中,一般会直接看使用该功能和未使用该功能的用户在成功指标上的表现,将两组数据求个差异值就得出功能的效果结论.但是有敏锐的分析师会发现,功能大部分情况下有筛选效应,即使用该功能的用户可 ...
LeetCode: 150：逆波兰表示法求值。
题目根据逆波兰表示法,求表达式的值. 有效的运算符包括 +, -, *, / .每个运算对象可以是整数,也可以是另一个逆波兰表达式. 说明: 整数除法只保留整数部分. 给定逆波兰表达式总是有效的.换 ...
多目标决策问题1.1.1：线性加权法——熵权法确定权重
多目标决策问题是目前数学建模中比较普遍的一类问题, 此类问题要求我们满足多个目标函数最优与决策变量的线性约束条件或非线性约束条件下进行求解, 多目标决策问题主要有主要目标法.线性加权法.分层序列法.步 ...
百度地图上进行空间插值---反距离加权法
今天成功的完成了百度地图的空间插值Javascript插件,其中空间插值是基于反距离加权法. 插值算法的原理网上有很多资料,我也是参考别人的资料,在这里我直接论文截图: 之前一直在找工作,最近写论文才 ...

逆概率加权法（Inverse Probability Weighting, IPW）的原理及R实现

逆概率加权法（Inverse Probability Weighting, IPW）的原理及R实现相关推荐

最新文章

热门文章