(生物信息学)R语言与统计学入门(九)—— 单因素cox回归分析
## 近期将推出 苦逼医学生R语言入门;R语言与高级统计学 付费专栏,感谢大家支持 ##
COX回归模型,又称“比例风险回归模型(proportional hazards model,简称Cox模型)”,是由英国统计学家D.R.Cox(1972)年提出的一种半参数回归模型。该模型以生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响,能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。由于上述优良性质,该模型自问世以来,在医学随访研究中得到广泛的应用,是迄今生存分析中应用最多的多因素分析方法。
下面我们直接测试代码:
数据准备如下存成CSV格式,方便R语言读取:
setwd("D:\\")
dir()
data <- read.csv("Cox.csv",header = T,sep = ",")
head(data)# > head(data)
# sampleID RFS.time RFS ALY
#1 TCGA-2A-A8VL-01 621 0 2.0320
#2 TCGA-2A-A8VO-01 1701 0 1.8710
#3 TCGA-2A-A8VT-01 1373 0 0.7952
#4 TCGA-2A-A8VV-01 671 0 2.6270
#5 TCGA-2A-A8VX-01 1378 0 2.3310
#6 TCGA-2A-A8W1-01 112 0 1.9390
下面我们下载coin软件包:
install.packages("coin")
library(coin)
cox <- coxph(Surv(RFS.time,RFS)~data$ALY,data)
cox# > cox
#Call:
#coxph(formula = Surv(RFS.time, RFS) ~ data$ALY, data = data)
#
# coef exp(coef) se(coef) z p
#data$ALY 0.2845 1.3291 0.1143 2.489 0.0128
#
#Likelihood ratio test=5.34 on 1 df, p=0.02089
#n= 421, number of events= 52
注意我们这里研究的RFS,无病生存期。
结果显示P值是有意义的。
summary(cox)# > summary(cox)
#Call:
#coxph(formula = Surv(RFS.time, RFS) ~ data$ALY, data = data)
#
# n= 421, number of events= 52
#
# coef exp(coef) se(coef) z Pr(>|z|)
#data$ALY 0.2845 1.3291 0.1143 2.489 0.0128 *
#---
#Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
#
# exp(coef) exp(-coef) lower .95 upper .95
#data$ALY 1.329 0.7524 1.062 1.663
#
#Concordance= 0.607 (se = 0.049 )
#Likelihood ratio test= 5.34 on 1 df, p=0.02
#Wald test = 6.2 on 1 df, p=0.01
#Score (logrank) test = 6.08 on 1 df, p=0.01
这里的exp(coef)就是风险比HR的意思。Lower95和upper95是HR置信区间的上下限。
这是针对连续性变量,我们研究的基因表达就是连续性变量。
cox回归也可以进行分类变量的分析,下面我们将基因的表达分为高低表达组:
data$ALY <- ifelse(data$ALY>median(data$ALY),"High expression","Low expression")
head(data)# > head(data)
# sampleID RFS.time RFS ALY
#1 TCGA-2A-A8VL-01 621 0 High expression
#2 TCGA-2A-A8VO-01 1701 0 Low expression
#3 TCGA-2A-A8VT-01 1373 0 Low expression
#4 TCGA-2A-A8VV-01 671 0 High expression
#5 TCGA-2A-A8VX-01 1378 0 High expression
#6 TCGA-2A-A8W1-01 112 0 Low expression
此时是二分类变量:
cox <- coxph(Surv(RFS.time,RFS)~data$ALY,data)
summary(cox)# > summary(cox)
#Call:
#coxph(formula = Surv(RFS.time, RFS) ~ data$ALY, data = data)
#
# n= 421, number of events= 52
#
# coef exp(coef) se(coef) z Pr(>|z|)
#data$ALYLow expression -0.6992 0.4970 0.2922 -2.393 0.0167 *
#---
#Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
#
# exp(coef) exp(-coef) lower .95 upper .95
#data$ALYLow expression 0.497 2.012 0.2803 0.8812
#
#Concordance= 0.56 (se = 0.039 )
#Likelihood ratio test= 6.04 on 1 df, p=0.01
#Wald test = 5.73 on 1 df, p=0.02
#Score (logrank) test = 5.96 on 1 df, p=0.01
其中High expression组被设置成了reference,这里的exp(coef)是针对Low expression组的,意思是这个ALY基因低表达的患者死亡风险是ALY基因高表达患者的0.497倍。
除了二分类变量以外,还可以分析多分类,无论是哪种分类变量,都会设置某一个类为一个参照。
(生物信息学)R语言与统计学入门(九)—— 单因素cox回归分析相关推荐
- (生物信息学)R语言与统计学入门(二)——单因素方差分析
上次说到t检验,是检验两组数据的均数差异,链接如下: (生物信息学)R语言与统计学入门(一)--t 检验_李京弦的博客-CSDN博客 这次我们来介绍一下单因素方差分析. 单因素方差分析: 方差分析(A ...
- (生物信息学)R语言与统计学入门(五)—— Wilcoxon秩和检验法和Mann-Whitney U检验
上回说到t检验:(生物信息学)R语言与统计学入门(一)--t 检验_Lijingxian教你学生信的博客-CSDN博客t检验,亦称student t检验(Student's t test),比较两个平 ...
- (生物信息学)R语言与统计学入门(七)—— 一元线性回归分析
我们之前讲过相关性分析,生物信息学常见的相关性分析是pearson相关和spearman相关. (生物信息学)R语言与统计学入门(六)-- Pearson和Spearman相关性分析_Lijingxi ...
- R语言使用aov函数进行单因素协方差分析(One-way ANCOVA)、使用multcomp包的glht函数检验组均值之间所有成对对比差异、通过contrast参数自定义对比组进行组间两两方差分析
R语言使用aov函数进行单因素协方差分析(One-way ANCOVA).使用multcomp包的glht函数检验组均值之间所有成对对比差异.通过contrast参数自定义对比组进行组间两两方差分析( ...
- R语言使用aov函数进行单因素协方差分析(One-way ANCOVA)、单因素协方差分析(ANCOVA)扩展了单因素方差分析,包括一个或多个协变量(covariates)
R语言使用aov函数进行单因素协方差分析(One-way ANCOVA).单因素协方差分析(ANCOVA)扩展了单因素方差分析,包括一个或多个协变量(covariates) 目录
- R语言使用aov函数进行单因素协方差分析(One-way ANCOVA)、使用HH包中的ancova函数可视化单因素协方差分析中的因变量、协变量和因子之间关系的图
R语言使用aov函数进行单因素协方差分析(One-way ANCOVA).使用HH包中的ancova函数可视化单因素协方差分析中的因变量.协变量和因子之间关系的图(Visualizing the re ...
- R语言使用aov函数进行单因素协方差分析(One-way ANCOVA)、使用effects包中的effect函数来计算调整后的分组均值(calculate adjusted means)
R语言使用aov函数进行单因素协方差分析(One-way ANCOVA).使用effects包中的effect函数来计算调整后的分组均值(effects library to calculate ad ...
- R语言使用aov函数进行单因素协方差分析(One-way ANCOVA)、验证协方差分析的回归斜率是否均匀(回归斜率在每个组中都是相同的、回归斜率的均匀性检验)
R语言使用aov函数进行单因素协方差分析(One-way ANCOVA).验证协方差分析的回归斜率是否均匀(回归斜率在每个组中都是相同的.回归斜率的均匀性检验)(Assessing test assu ...
- R语言七天入门教程二:认识变量与运算符
R语言七天入门教程二:认识变量与运算符 一.什么是变量 1.变量 顾名思义,我们可以将变量理解为"可以改变的量",是计算机语言中能储存计算结果或能表示值的抽象概念.这里的值可以是数 ...
- R语言七天入门教程六:文件相关操作
R语言七天入门教程六:文件相关操作 一.文件的读写 R 语言作为统计学编程语言,常常需要处理大量数据,而这些数据通常会从文件中进行读取,因此文件读写在R语言中是非常重要的操作.在R语言中,用到最多的文 ...
最新文章
- R语言ggplot2可视化为组合图添加综合图例实战:使用ggpubr包ggarrange函数实现综合图例、使用patchwork包实现综合图例
- 欧洲两个研究团队开发出了让截肢者能感觉到并准确抓住物体的仿生手
- Convert.ToInt32
- 印度初创公司开发了下一代区块链网络安全解决方法
- 关于小范围整数N拆解成2的幂相加的个数
- websphere Error 404:SRVE0190E: File not found: index.action
- hadoop集群配置和在windows系统上运用java操作hdfs
- 灰色按钮激活程序的原理 (学习)
- yolo v5 代码阅读记录
- vr全景图如何制作?vr制作用什么软件?(详细教程)
- EditText的属性介绍
- 利用java程序实现文件加密
- 现代操作系统 第一章 引论
- 平面设计内容包括什么,平面设计具体包括哪些内容
- WindowsLiveWriter安装步骤
- Linux下载HTTP文件
- 有关网络安全基础知识
- 3天搞定的小型B/S内部管理类软件定制开发项目【软件开发实战10步骤详解】
- java catch 空指针异常_java空指针异常怎么处理
- 基于python和amap(高德地图)web api的爬虫,用于搜索某POI点
热门文章
- GSM模块_GSM设备和网络错误代码
- 双系统笔记本 android,电脑安装双系统 微软 安卓 实现一机多用
- Axure RP 8的介绍
- python numpy dtype object_python – 创建numpy数组时dtype = object意味着什么?
- 继续:Racket网络编程
- 网页截图服务器,命令行下的2款网页截图工具推荐
- 威斯康星麦迪逊计算机专业排名,威斯康星大学麦迪逊分校计算机工程学科排名...
- 构造常数函数解决抽象函数导数小题
- 什么是BIM,什么是CIM?
- 记录一次keil调试过程:自动识别GPS厂家芯片