用R语言进行Cox回归生存分析
欢迎关注”生信修炼手册”!
在生存分析中,探究生存时间的影响因素是一个重要的研究内容,通过KM和log-rank test检验的方法,只能够处理单个二分类因素的生存数据。当想探究多个因素或者离散型变量对生存时间的影响时,我们就需要借助于cox回归方法。cox回归的全称如下
cox proportional hazards regression model
称之为cox等比例风险回归模型, 对应的公式如下
将上述公式进行log转换,可以变换成以下格式
这个公式和逻辑回归的公式就非常的接近了, cox回归其实是在线性回归和逻辑回归的基础上延伸而出的一种方法,将影响生存的多个因素当做回归方程中的自变量,将风险函数h(t)和h0(t)的比值当做因变量。
每个自变量对应的系数,如b1,b2这类的 ,称之为偏回归系数。当偏回归系数大于0时, 随着该自变量值的增加,风险增加,生存时间减少,当系数小于0时,则相反;等于0时,没有影响。
将exp(b)称之为hazard ratio, 简称HR。将偏回归系数转换成HR, 对应的关系如下
HR = 1, 没有影响
HR > 1, 风险增加
HR < 1, 风险降低
在临床上,将HR>1的自变量称之为坏的预后因子,将HR<1的自变量称之为好的预后因子。通过survival
R包,可以轻松的实现cox回归分析,步骤如下
1. 准备生存数据
对于每个个体而言,其生存数据会出现两种情况,第一种是观测到生存时间,通常用1表示,第二种则是删失。通常用0表示。survival自带了一个测试数据lung
, 内容如下所示
每一行代表一个样本,time
表示生存时间,status
表示删失情况,这里只有1和2两种取值,默认排序后的第一个level对应的值为删失,这里则为1表示删失。其他列为样本对应的性别,年龄等基本信息。
2. cox回归分析
代码如下
可以看到,cox回归的适用范围更广,以最后一个回归分析为例,结果如下所示
首先查看likehood ration test , wald test, logrank test三种检验方法的p值,p值小于0.05, 这个回归方程是统计学显著的。说明在这么多自变量中包含了对生存时间具有影响的因素。
然后查看每个自变量的p值,可以看到sex和ph.ecog这两个变量的p值小于0.05,而age的p值大于0.05, 说明sex和ph,ecog这两个变量对生存时间的影响更加显著。
最后查看自变量的coef等指标,coef就是偏回归系数,exp(coef)就是HR。sex的HR值小于1,该数据集中1=male, 2= female, HR表示的是数值大的风险/数值小的风险,在这里就是female/ male, 说明female死亡的相对较低。HR的值约为0.58, 说明female的死亡风险只占了male的58%, 相比male, female的死亡风险降低了42%。ph.ecog的HR值大于1, 说明随着ph.ecog数值的增加,死亡风险会增加。
3. 结果可视化
以sex
为例, 可视化的代码如下
效果图如下
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!
用R语言进行Cox回归生存分析相关推荐
- R语言使用survminer包生存分析及可视化(ggsurvplot)实战详解:从数据集导入、生存对象生成、ggsurvplot可视化参数配置、设置、可视化对比
R语言使用survminer包生存分析及可视化(ggsurvplot)实战详解:从数据集导入.生存对象生成.ggsurvplot可视化参数配置.设置.可视化对比 目录 R语言使用survminer包生 ...
- 手把手教你使用R语言建立COX回归并画出列线图(Nomogram)
列线图,又称诺莫图(Nomogram),它是建立在回归分析的基础上,使用多个临床指标或者生物属性,然后采用带有分数高低的线段,从而达到设置的目的:基于多个变量的值预测一定的临床结局或者某类事件发生的概 ...
- R语言泊松Poisson回归模型分析案例
这个问题涉及马蹄蟹研究的数据.研究中的每只雌性马蹄蟹都有一只雄性螃蟹贴在她的巢穴中.这项研究调查了影响雌蟹是否有其他男性居住在她附近的因素.被认为影响这一点的解释变量包括雌蟹的颜色(C),脊椎状况(S ...
- R语言画Cox回归森林图
##### cox多因素回归森林图####### #install.packages("tableone") library(tableone) library(survival) ...
- r roc曲线 语言_R语言系列6:生存分析中多重时间依赖性ROC曲线绘制 timeROC
上一篇文章,我们讲到R语言实现Cox回归生存预测模型构建,以及如何将Logistic回归中,多条ROC曲线绘制在一个图里 今天主要围绕生存分析中,预测模型验证部分,如何将多条time-depend e ...
- R语言使用cox函数构建生存分析回归模型、使用subgroupAnalysis进行亚组分析并可视化森林图
R语言使用cox函数构建生存分析回归模型.使用subgroupAnalysis进行亚组分析并可视化森林图 目录
- R语言主成分回归(PCR)、 多元线性回归特征降维分析光谱数据和汽车油耗、性能数据...
原文链接:http://tecdat.cn/?p=24152 什么是PCR?(PCR = PCA + MLR)(点击文末"阅读原文"获取完整代码数据). • PCR是处理许多 x ...
- 基于R语言的Copula变量相关性分析及应用
在工程.水文和金融等各学科的研究中,总是会遇到很多变量,研究这些相互纠缠的变量间的相关关系是各学科的研究的重点.虽然皮尔逊相关.秩相关等相关系数提供了变量间相关关系的粗略结果,但这些系数都存在着无法克 ...
- 语言nomogram校准曲线图_医学统计与R语言:Meta 回归作图(Meta regression Plot)
微信公众号:医学统计与R语言如果你觉得对你有帮助,欢迎转发 输入1: install.packages("metafor") library(metafor) dat.bcg 结果 ...
- R语言的Copula变量相关性分析
在工程.水文和金融等各学科的研究中,总是会遇到很多变量,研究这些相互纠缠的变量间的相关关系是各学科的研究的重点.虽然皮尔逊相关.秩相关等相关系数提供了变量间相关关系的粗略结果,但这些系数都存在着无法克 ...
最新文章
- Windows_Server_2008_R2_AD_DS架构-第06部分_FSMO、AD的诊断及排故
- java----java工具包
- SemEval-2022组队参赛啦!八节课带你入门全球最大的语义测评大赛
- 爆破专栏丨Spring Security系列教程之Spring Security的四种权限控制方式
- Python基础概念_13_常见关键字
- 镜像服务器文件实时监控同步程序
- (十)python3 只需3小时带你轻松入门——模块与包
- leetcode746. 使用最小花费爬楼梯
- k2p 官方固件_继斐讯K2P之后,红米AC2100也将成一代路由器神机?
- 给你一份详细的web前端CSS布局指南,请查收
- linux运维命令3
- UIScrollView 遇到的小坑
- windows消息钩子
- 一个low逼的boofuzz脚本生成器
- 记一次Godaddy域名解析托管到AWS的Route53操作
- 单片机跑操作系统,到底有几种选择?
- 量子计算机用什么传导信息,量子是如何传递信息的?
- 免费实时汇率查询Api接口
- MySQL连接查询的成本
- 求菲波那切数列第n项