目录

R语言之生信⑦Cox比例风险模型(单因素)

======================================

Cox比例风险模型(Cox,1972)本质上是一种回归模型,通常用于医学研究中的统计学,用于研究患者的生存时间与一个或多个预测变量之间的关联。

介绍

在前一章(TCGA生存分析)中,我们描述了生存分析的基本概念以及分析和总结生存数据的方法,包括:1.危险和生存功能的定义 2.为不同患者群构建Kaplan-Meier生存曲线用于比较两条或更多条生存曲线的logrank检验

但是上述方法--Kaplan-Meier曲线和logrank测试 - 是单变量分析的例子。他们根据调查中的一个因素来描述生存,但忽略了任何其他因素的影响。

此外,Kaplan-Meier曲线和logrank检验仅在预测变量是分类时才有用(例如:治疗A与治疗B;男性与女性)。它们不适用于基因表达,体重或年龄等定量预测因子。

另一种方法是Cox比例风险回归分析,它适用于定量预测变量和分类变量。此外,Cox回归模型扩展了生存分析方法,以同时评估几种风险因素对生存时间的影响。

临床研究需求

在临床研究中,存在许多情况,其中几个已知量(称为协变量)可能影响患者预后。

例如,假设比较两组患者:那些患者和没有特定基因型的患者。如果其中一组也包含较老的个体,则存活率的任何差异可归因于基因型或年龄或两者。因此,在研究与任何一个因素相关的生存时,通常需要调整其他因素的影响。

cox比例风险模型是用于对生存分析数据建模的最重要方法之一。该模型的目的是同时评估几个因素对生存的影响。换句话说,它允许我们检查特定因素如何影响特定时间点发生的特定事件(例如,感染,死亡)的发生率。该比率通常称为危险率。预测变量(或因子)通常在生存分析文献中称为协变量。

风险比(HR)大于1表示与事件概率正相关的协变量,因此与生存期长度负相关。

HR = 1:无效

HR <1:减少危害

HR> 1:危险增加

library("survival")

library("survminer")

data("lung")

head(lung)

res.cox

res.cox

summary(res.cox)

> res.cox

> res.cox

Call:

coxph(formula = Surv(time, status) ~ sex, data = lung)

coef exp(coef) se(coef) z p

sex -0.531 0.588 0.167 -3.18 0.0015

Likelihood ratio test=10.63 on 1 df, p=0.001

n= 228, number of events= 165

> summary(res.cox)

Call:

coxph(formula = Surv(time, status) ~ sex, data = lung)

n= 228, number of events= 165

coef exp(coef) se(coef) z Pr(>|z|)

sex -0.5310 0.5880 0.1672 -3.176 0.00149 **

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

exp(coef) exp(-coef) lower .95 upper .95

sex 0.588 1.701 0.4237 0.816

Concordance= 0.579 (se = 0.022 )

Rsquare= 0.046 (max possible= 0.999 )

Likelihood ratio test= 10.63 on 1 df, p=0.001

Wald test = 10.09 on 1 df, p=0.001

Score (logrank) test = 10.33 on 1 df, p=0.001

Cox回归结果可解释如下:

统计学意义。标记为“z”的列给出Wald统计值。它对应于每个回归系数与其标准误差的比率(z = coef / se(coef))。 wald统计量评估给定变量的β(ββ)系数是否在统计学上显着不同于0.从上面的输出,我们可以得出结论,变量性别具有高度统计上显着的系数。

回归系数(coef)。 Cox模型结果中要注意的第二个特征是回归系数(coef)的符号。对于具有较高该变量值的受试者,正号表示危险(死亡风险)较高,因此预后更差。变量性别被编码为数字向量。 1:男,2:女。 Cox模型的R总结给出了第二组相对于第一组的风险比(HR),即女性与男性。在这些数据中,性别的β系数= -0.53表明女性死亡风险(较低的存活率)低于男性。

危险比(HR)(exp(coef))。指数系数(exp(coef)= exp(-0.53)= 0.59),也称为风险比,给出协变量的效应大小。例如,女性(性别= 2)可将危险降低0.59倍,即41%。女性与预后良好有关。

风险比的置信区间(95%CI)。总结输出还给出了风险比(exp(coef))的上下95%置信区间,下限95%= 0.4237,上限95%= 0.816。

该模型的全局统计意义。最后,输出给出了模型总体显着性的三个替代测试的p值:似然比检验,Wald检验和得分数据统计。这三种方法是渐近等价的。对于足够大的N,它们将给出类似的结果。对于小N,它们可能有所不同。对于小样本量,似然比检验具有更好的行为,因此通常是优选的。

要一次将单变量coxph函数应用于多个协变量,请键入:

covariates

univ_formulas

function(x) as.formula(paste('Surv(time, status)~', x)))

univ_models

# Extract data

univ_results

function(x){

x

p.value

wald.test

beta

HR

HR.confint.lower

HR.confint.upper

HR

HR.confint.lower, "-", HR.confint.upper, ")")

res

names(res)

"p.value")

return(res)

#return(exp(cbind(coef(x),confint(x))))

})

res

as.data.frame(res)

> as.data.frame(res)

beta HR (95% CI for HR) wald.test p.value

age 0.019 1 (1-1) 4.1 0.042

sex -0.53 0.59 (0.42-0.82) 10 0.0015

ph.karno -0.016 0.98 (0.97-1) 7.9 0.005

ph.ecog 0.48 1.6 (1.3-2) 18 2.7e-05

wt.loss 0.0013 1 (0.99-1) 0.05 0.83

上面的输出显示了回归β系数,效应大小(作为风险比给出)和每个变量相对于总体生存的统计显着性。每个因素都通过单独的单变量Cox回归来评估。

变量sex,age和ph.ecog具有统计学意义,而ph.karno的系数不显着。

年龄和ph.ecog具有正β系数,而性别具有负系数。因此,年龄较大和较高的ph.ecog与较差的存活率相关,而女性(性别= 2)与较好的存活率相关。

r语言 svycoxph_R语言之生信⑦Cox比例风险模型(单因素)相关推荐

  1. r语言 svycoxph_R语言-Cox比例风险模型

    Cox比例风险模型(cox proportional-hazards model),简称Cox模型 是由英国统计学家D.R.Cox(1972)年提出的一种半参数回归模型.该模型以生存结局和生存时间为应 ...

  2. R语言生存分析详解:KM曲线、COX比例风险模型、HR值解读、模型比较、残差分析、是否比例风险验证:基于survival包lung数据集

    R语言生存分析详解:KM曲线.COX比例风险模型.HR值解读.模型比较.残差分析.是否比例风险验证:基于survival包lung数据集 目录

  3. R语言生存分析之COX比例风险模型构建及列线图(nomogram)、校准曲线(calibration curve)绘制示例

    R语言生存分析之COX比例风险模型构建及列线图(nomogram).校准曲线(calibration curve)绘制示例 列线图(Alignment Diagram),又称诺莫图(Nomogram图 ...

  4. Cox 比例风险模型中HR和置信区间

    Cox 回归是一种用于生存分析的统计模型,它可以用来估计某个因素对生存时间的影响.Cox 回归基于 Cox 比例风险模型,该模型假设风险比率是常数,即不随时间变化.在 Cox 回归中,我们使用最大似然 ...

  5. coxphfit+matlab,计算Cox比例风险模型的coxph和cph函数有什么区别?

    RCS =受限立方样条. 您可以通过查看help(package="rms") 找到函数的帮助文件下面是源代码的摘录,所以你可以看到那里的cph函数调用coxph.fit功能(的c ...

  6. python数据分析案例-利用生存分析Kaplan-Meier法与COX比例风险回归模型进行客户流失分析与剩余价值预测

    目录 1. 概述 1.1 背景 1.2 目的 1.3 数据说明 2. 相关概念 2.1 事件 2.2 生存时间 2.3 删失 2.4 生存概率 2.5 中位生存时间 2.6 风险概率 3. 数据处理 ...

  7. R语言临床预测模型:分层构建COX生存回归模型STRATIFIED COX MODEL、KM生存曲线、PH假设检验...

    全文链接:http://tecdat.cn/?p=32046 stratified cox model是针对协变量不满足PHA提出的,这里的思想是对协变量分层(点击文末"阅读原文" ...

  8. 生信豆芽菜数据分析平台-模型构建

    之前接到粉丝来信,想让我们上线一些构建诊断模型和风险模型的工具,为此,我们加班加点,上线了几个工具,接下来逐一介绍一下 链接: http://www.tbfollow.com/singleCollec ...

  9. SPSS教程之生存分析的Cox回归模型(比例风险模型)

    最近有同学问师兄,"最近我要做生存分析,可是我不太会,也不太懂,师兄能不能教教我",好吧,今天开一贴,讲讲这个.有同样的问题的同学可以一起来看看,毕竟在临床.科研上,这方面知识还是 ...

  10. COX 比例风险回归模型--有感

    生存分析 三大块内容: 1,描述性的 生存率.中位生存期.生存曲线等,常用Kaplan-meier法 2,比较分析 两组的生存曲线是否有差别,log-rank检验(单个因素) 3,cox比例风险回归 ...

最新文章

  1. 人工智能在音频链中找到自己的声音
  2. 尸鬼封尽の覆盖源码 管你什么鬼一招解决
  3. 机器学习知识点(七)决策树学习算法Java实现
  4. ITK:可变长度向量
  5. Java集合unmodifiableMap()方法及示例
  6. 剑指offer之礼物的最大值
  7. sql server linux性能,详细了解SQL Server 2008性能和性能优化
  8. java逻辑运算符_Java逻辑运算符
  9. 等了一年终于要来了 电影《八佰》定档8月21日全国上映
  10. UITableViewStyleGrouped顶部留白问题
  11. 一共有多少种操作系统
  12. 数据结构视频教程 -《数据结构(邓俊辉)》
  13. GT S7278 Android4.4,三星S7278U官方原版固件rom系统刷机包(线刷格式)
  14. 人工智能AI讲师NLP培训讲师叶梓:人工智能之最新NLP自然语言处理技术与实战-23
  15. 每周分享第 31 期
  16. 业务复习-微信登录/第三方登录实现
  17. 知乎带货月入过万的赚钱路子,前期操作后期可躺赚
  18. 华为服务器新机安装配置,安装驱动,制作raid,raid5
  19. 电脑电池,正确给笔记本电脑电池校正的技巧攻略
  20. Hive正则表达式案例总结

热门文章

  1. 你只管打开这个视频,剩下的交给「卧槽」
  2. android微信版本怎么升级,安卓微信怎么更新到最新版本?
  3. 图片去水印工具软件,比PS还好用的图片杂物去除工具
  4. 精灵球Plus使用方法
  5. 英文参考文献格式引用方法分析
  6. 邮箱不能发送大附件,什么邮箱可以发送超大附件?
  7. php版微信公众号消息主动推送_php实现微信公众号主动推送消息
  8. 如何批量删除Word中向下箭头的符号
  9. 7-4 华氏度转摄氏度 (5分)_PTA_Java基础练习
  10. 关于音频情感分类的随笔(4)