本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文。

医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。

文章目录

  • 前言
  • logistic回归

前言

这是R语言和医学统计学的第8篇内容。

主要是用R语言复现课本中的例子。我使用的课本是孙振球主编的《医学统计学》第4版,封面如下:

logistic回归

使用课本例16-2的数据,直接读取:

df16_2 <- foreign::read.spss("E:/各科资料/医学统计学/研究生课程/12 Logistic Regression18-9/12 Logistic Regression18-9/例16-02冠心病.sav", to.data.frame = T,reencode  = "utf-8")
## re-encoding from utf-8str(df16_2)
## 'data.frame':  54 obs. of  10 variables:
##  $ 序号: num  1 2 3 4 5 6 7 8 9 10 ...
##  $ x1  : Factor w/ 4 levels "<45","45~","55~",..: 3 2 2 2 3 3 2 3 2 1 ...
##  $ x2  : Factor w/ 2 levels "无","有": 2 1 2 1 1 1 1 1 1 1 ...
##  $ x3  : Factor w/ 2 levels "无","有": 1 2 1 1 1 2 2 2 1 1 ...
##  $ x4  : Factor w/ 2 levels "不吸","吸": 2 2 2 2 2 2 1 2 1 2 ...
##  $ x5  : Factor w/ 2 levels "无","有": 1 1 1 1 1 1 1 2 1 1 ...
##  $ x6  : Factor w/ 2 levels "低","高": 1 1 1 1 2 1 1 1 1 1 ...
##  $ x7  : Factor w/ 3 levels "<24","24~","26~": 1 1 1 1 1 2 1 1 1 1 ...
##  $ x8  : Factor w/ 2 levels "否","是": 2 1 1 1 2 2 1 1 2 1 ...
##  $ y   : Factor w/ 2 levels "对照","病例": 1 1 1 1 1 1 1 1 1 1 ...
##  - attr(*, "variable.labels")= Named chr [1:10] "" "年龄(岁)" "高血压史" "高血压家族史" ...
##   ..- attr(*, "names")= chr [1:10] "序号" "x1" "x2" "x3" ...
##  - attr(*, "codepage")= int 65001

数据一共10列,第1列是编号,第2-9列是自变量,第10列是因变量。

数据结构见上图,只截取了一部分。

进行logistic回归(逐步回归):

f <- glm(y ~ x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8, data = df16_2, family = binomial())f1 <- step(f, direction = "forward")
## Start:  AIC=64.03
## y ~ x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8summary(f1)
##
## Call:
## glm(formula = y ~ x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8, family = binomial(),
##     data = df16_2)
##
## Deviance Residuals:
##     Min       1Q   Median       3Q      Max
## -2.1727  -0.4719  -0.1409   0.5315   2.5914
##
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)
## (Intercept) -5.46026    2.07370  -2.633  0.00846 **
## x145~        0.85285    1.54399   0.552  0.58070
## x155~        0.47754    1.59320   0.300  0.76438
## x165~        3.44227    2.10985   1.632  0.10278
## x2有         1.14905    0.93176   1.233  0.21750
## x3有         1.66039    1.16857   1.421  0.15535
## x4吸         0.85994    1.32437   0.649  0.51613
## x5有         0.73600    0.97088   0.758  0.44840
## x6高         3.92067    1.57004   2.497  0.01252 *
## x724~       -0.03467    1.13363  -0.031  0.97560
## x726~       -0.38230    1.61710  -0.236  0.81311
## x8是         2.46322    1.10484   2.229  0.02578 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
##     Null deviance: 74.786  on 53  degrees of freedom
## Residual deviance: 40.028  on 42  degrees of freedom
## AIC: 64.028
##
## Number of Fisher Scoring iterations: 6

因为实际采用的方法略有不同,结果和课本也不完全一样,不过并不影响结果。

本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文。

医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。

R语言和医学统计学(8):logistic回归相关推荐

  1. R语言和医学统计学(7):多元线性回归

    本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文. 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化. 文章目录 前言 多元线性回归 回归诊断 可以通过看图来判断 ...

  2. R语言splines包构建基于logistic回归的自然样条分析:南非心脏病数据集、非线性:基函数展开和样条分析、你简单分析的不重要特征,可能只是线性不显著、而非线性是显著的

    R语言splines包构建基于logistic回归的自然样条分析:南非心脏病数据集.非线性:基函数展开和样条分析.你简单分析的不重要特征,可能只是线性不显著.而非线性是显著的 目录

  3. R语言和医学统计学(10):正态性和方差齐性检验

    本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文. 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化. 文章目录 前言 正态性检验 shapiro wilk检验 k ...

  4. R语言和医学统计学(3):卡方检验

    本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文. 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化. 前言 这是R语言和医学统计学的第3篇内容. 主要是用R语言复 ...

  5. R语言和医学统计学(6):重复测量方差分析

    本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文. 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化. 文章目录 前言 重复测量数据两因素两水平的方差分析 重复测量 ...

  6. R语言和医学统计学(2):方差分析

    本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文. 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化. 前言 这是R语言和医学统计学的第2篇内容. 主要是用R语言复 ...

  7. R语言和医学统计学(5):多因素方差分析

    本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文. 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化. 文章目录 前言 2 x 2 两因素析因设计资料的方差分析 I ...

  8. R语言和医学统计学系列(1):t检验

    本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文. 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化. 前言 本期开始将推送使用R语言进行医学统计学的相关内容. 使 ...

  9. R语言和医学统计学(9):多重检验

    本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文. 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化. 文章目录 前言 多个样本均数间的多重比较 LSD-t检验 T ...

最新文章

  1. 中国安防为何世界最强?中科院AI+安防报告,解密8大趋势和8大限制【附下载】| 智东西内参...
  2. 【Flutter】Flutter Gallery 官方示例简介 ( 学习示例 | 邮件应用 | 零售应用 | 理财应用 | 旅行应用 | 新闻应用 | 自适应布局应用 )
  3. 计算机里的dump是什么意思?(转储、转储文件)
  4. C#中导出百万级Excel只需几秒除了NPOI还可以这样
  5. Bit-Z为什么成为熊市之光?
  6. UIButton的竖排图片和文本
  7. Dubbo入门和应用
  8. spark1.0和2.0的区别_Spark2.1.0——Spark初体验
  9. Python+selenium自动化测试环境安装
  10. cesium拾取pick系列(拾取坐标和对象)
  11. 分享一个完全免费的高质量 PPT 模板下载网站
  12. C#修改Windows系统时间
  13. 硬盘安装archlinux
  14. vscode Couldn‘t start client Rust Language Server
  15. 日语截图翻译软件(百度ocr+python3+pyqt5)
  16. 目标跟踪 OP,CLE,DP,AUC的概念和计算
  17. 第一周预习HTML标签(笔记可以不记,代码一定要敲)
  18. 30 行 Javascript 代码搞定智能家居系统 1
  19. c语言编程 黑色星期五,求黑色星期五问题~
  20. php之array的使用

热门文章

  1. java el 表达式_Javaweb之EL表达式
  2. 上交所逐笔委托_[转载]上交所、深交所市价委托种类及含义
  3. 经验分享:个人网站如何备案?
  4. linux用root权限执行命令,Linux root权限获取之sudo命令详解
  5. 80后的回忆·少年篇
  6. 浏览器中的音视频知识总结v1.0(工作中需要和视频打交道必看!)
  7. 李开复台大演讲:人工智能来了,别怕
  8. Spring Boot (六): 为 JPA 插上翅膀的 QueryDSL
  9. 接入alipay-sdk
  10. 【mybatis】Mybatis中的一级、二级缓存