欢迎关注”生信修炼手册”!

在生存分析中,探究生存时间的影响因素是一个重要的研究内容,通过KM和log-rank test检验的方法,只能够处理单个二分类因素的生存数据。当想探究多个因素或者离散型变量对生存时间的影响时,我们就需要借助于cox回归方法。cox回归的全称如下

cox proportional hazards regression model

称之为cox等比例风险回归模型, 对应的公式如下

将上述公式进行log转换,可以变换成以下格式

这个公式和逻辑回归的公式就非常的接近了, cox回归其实是在线性回归和逻辑回归的基础上延伸而出的一种方法,将影响生存的多个因素当做回归方程中的自变量,将风险函数h(t)和h0(t)的比值当做因变量。

每个自变量对应的系数,如b1,b2这类的 ,称之为偏回归系数。当偏回归系数大于0时, 随着该自变量值的增加,风险增加,生存时间减少,当系数小于0时,则相反;等于0时,没有影响。

将exp(b)称之为hazard ratio, 简称HR。将偏回归系数转换成HR, 对应的关系如下

  1. HR = 1, 没有影响

  2. HR > 1,   风险增加

  3. HR < 1,   风险降低

在临床上,将HR>1的自变量称之为坏的预后因子,将HR<1的自变量称之为好的预后因子。通过survivalR包,可以轻松的实现cox回归分析,步骤如下

1. 准备生存数据

对于每个个体而言,其生存数据会出现两种情况,第一种是观测到生存时间,通常用1表示,第二种则是删失。通常用0表示。survival自带了一个测试数据lung, 内容如下所示

每一行代表一个样本,time表示生存时间,status表示删失情况,这里只有1和2两种取值,默认排序后的第一个level对应的值为删失,这里则为1表示删失。其他列为样本对应的性别,年龄等基本信息。

2. cox回归分析

代码如下

可以看到,cox回归的适用范围更广,以最后一个回归分析为例,结果如下所示

首先查看likehood ration test , wald test, logrank test三种检验方法的p值,p值小于0.05, 这个回归方程是统计学显著的。说明在这么多自变量中包含了对生存时间具有影响的因素。

然后查看每个自变量的p值,可以看到sex和ph.ecog这两个变量的p值小于0.05,而age的p值大于0.05, 说明sex和ph,ecog这两个变量对生存时间的影响更加显著。

最后查看自变量的coef等指标,coef就是偏回归系数,exp(coef)就是HR。sex的HR值小于1,该数据集中1=male, 2= female, HR表示的是数值大的风险/数值小的风险,在这里就是female/ male, 说明female死亡的相对较低。HR的值约为0.58, 说明female的死亡风险只占了male的58%, 相比male, female的死亡风险降低了42%。ph.ecog的HR值大于1, 说明随着ph.ecog数值的增加,死亡风险会增加。

3. 结果可视化

sex为例, 可视化的代码如下

效果图如下

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

用R语言进行Cox回归生存分析相关推荐

  1. R语言使用survminer包生存分析及可视化(ggsurvplot)实战详解:从数据集导入、生存对象生成、ggsurvplot可视化参数配置、设置、可视化对比

    R语言使用survminer包生存分析及可视化(ggsurvplot)实战详解:从数据集导入.生存对象生成.ggsurvplot可视化参数配置.设置.可视化对比 目录 R语言使用survminer包生 ...

  2. 手把手教你使用R语言建立COX回归并画出列线图(Nomogram)

    列线图,又称诺莫图(Nomogram),它是建立在回归分析的基础上,使用多个临床指标或者生物属性,然后采用带有分数高低的线段,从而达到设置的目的:基于多个变量的值预测一定的临床结局或者某类事件发生的概 ...

  3. R语言泊松Poisson回归模型分析案例

    这个问题涉及马蹄蟹研究的数据.研究中的每只雌性马蹄蟹都有一只雄性螃蟹贴在她的巢穴中.这项研究调查了影响雌蟹是否有其他男性居住在她附近的因素.被认为影响这一点的解释变量包括雌蟹的颜色(C),脊椎状况(S ...

  4. R语言画Cox回归森林图

    ##### cox多因素回归森林图####### #install.packages("tableone") library(tableone) library(survival) ...

  5. r roc曲线 语言_R语言系列6:生存分析中多重时间依赖性ROC曲线绘制 timeROC

    上一篇文章,我们讲到R语言实现Cox回归生存预测模型构建,以及如何将Logistic回归中,多条ROC曲线绘制在一个图里 今天主要围绕生存分析中,预测模型验证部分,如何将多条time-depend e ...

  6. R语言使用cox函数构建生存分析回归模型、使用subgroupAnalysis进行亚组分析并可视化森林图

    R语言使用cox函数构建生存分析回归模型.使用subgroupAnalysis进行亚组分析并可视化森林图 目录

  7. R语言主成分回归(PCR)、 多元线性回归特征降维分析光谱数据和汽车油耗、性能数据...

    原文链接:http://tecdat.cn/?p=24152 什么是PCR?(PCR = PCA + MLR)(点击文末"阅读原文"获取完整代码数据). • PCR是处理许多 x ...

  8. 基于R语言的Copula变量相关性分析及应用

    在工程.水文和金融等各学科的研究中,总是会遇到很多变量,研究这些相互纠缠的变量间的相关关系是各学科的研究的重点.虽然皮尔逊相关.秩相关等相关系数提供了变量间相关关系的粗略结果,但这些系数都存在着无法克 ...

  9. 语言nomogram校准曲线图_医学统计与R语言:Meta 回归作图(Meta regression Plot)

    微信公众号:医学统计与R语言如果你觉得对你有帮助,欢迎转发 输入1: install.packages("metafor") library(metafor) dat.bcg 结果 ...

  10. R语言的Copula变量相关性分析

    在工程.水文和金融等各学科的研究中,总是会遇到很多变量,研究这些相互纠缠的变量间的相关关系是各学科的研究的重点.虽然皮尔逊相关.秩相关等相关系数提供了变量间相关关系的粗略结果,但这些系数都存在着无法克 ...

最新文章

  1. Windows_Server_2008_R2_AD_DS架构-第06部分_FSMO、AD的诊断及排故
  2. java----java工具包
  3. SemEval-2022组队参赛啦!八节课带你入门全球最大的语义测评大赛
  4. 爆破专栏丨Spring Security系列教程之Spring Security的四种权限控制方式
  5. Python基础概念_13_常见关键字
  6. 镜像服务器文件实时监控同步程序
  7. (十)python3 只需3小时带你轻松入门——模块与包
  8. leetcode746. 使用最小花费爬楼梯
  9. k2p 官方固件_继斐讯K2P之后,红米AC2100也将成一代路由器神机?
  10. 给你一份详细的web前端CSS布局指南,请查收
  11. linux运维命令3
  12. UIScrollView 遇到的小坑
  13. windows消息钩子
  14. 一个low逼的boofuzz脚本生成器
  15. 记一次Godaddy域名解析托管到AWS的Route53操作
  16. 单片机跑操作系统,到底有几种选择?
  17. 量子计算机用什么传导信息,量子是如何传递信息的?
  18. 免费实时汇率查询Api接口
  19. MySQL连接查询的成本
  20. 求菲波那切数列第n项

热门文章

  1. poi生成excel并让excel的列有筛选功能
  2. HHL论文第三弹(参数讨论)
  3. ffmpeg GPU加速压制视频
  4. 关于程序员的996,我们谈谈历史和逻辑
  5. a卡是什么?a卡和n卡的区别
  6. DNS请求报文和响应报文解析
  7. foobar2000提取音频
  8. 2021-2024年中国两轮电动车企业经营情况对比
  9. JavaScript高级(二)
  10. 泛化误差,偏差方差分解