作者:丁点helper

来源:丁点帮你

前文,我们对Logistic回归分析的来龙去脉有了一个基本的了解,但是Logistic回归之所以应用十分广泛还有一个重要的原因——能直接输出OR值?

什么是OR值?如何理解?我们今天就来好好看一看。

怎么理解OR值

多重线性回归,一般是指有多个自变量X,只有一个因变量Y。前面我们主要是以简单线性回归为例在介绍,两者的差距主要在于自变量X的数量,在只有一个X时,就称简单线性回归。

OR值是《流行病学》中的重要概念,称作“优势比”(odds ratio),也称“比值比”,反映的是某种暴露与结局的关联强度。

这句话初学者看起来可能会特别费劲:什么叫优势?优势比又是什么意思?暴露和结局又该怎么理解?我们结合例子把这些问题一一理清。

案例:我们想探讨吸烟是否会导致糖尿病的发生。一种很实用的思路是找两组人群,一组患有糖尿病,另一种不患糖尿病,然后,分别调查这两组人群哪些人吸烟、哪些人不吸。

通过调查我们获得如下数据:

结合上表,可以看到,患病组一共有40人,其中24人吸烟,16人不吸烟。我们就称“吸烟”是一种“暴露”。

所以,“暴露”具有十分广泛的定义,一般某些研究对象具有我们感兴趣的因素,就称这些研究对象为“暴露组”。

暴露包括各种特征(如性别、年龄、教育程度等),以及某种特定的行为(如饮酒、不爱运动等),或接触某种有毒、有害物质(如PM2.5等),而不具备这些因素的对象称为“非暴露组”。

所谓研究“暴露对结局”的影响,这里的“结局”在本例中就指“是否患有糖尿病”,一般可以等同于我们前面说的“因变量Y”。

所谓的“优势”可以理解为“暴露比值”!那怎么理解暴露比值呢?

在本例中,对于患有糖尿病的对象,暴露比值为:吸烟的比例除以不吸烟的比例,即为:24/16 = 1.50;同样,在不患有糖尿病的人群中,也可以计算一个吸烟的比例除以不吸烟的比例,即为:18/22 = 0.82。

把这两个比例相除,就得到了吸烟与糖尿病相关关系的OR值,即OR = 1.50/0.82 = 1.83>1。由此,我们可以初步推断,吸烟会加重患糖尿病的风险。

一般而言,OR值的意义可以总结如下(假设结局发生记为1,不发生记为0):

OR = 1,暴露与结局的无相关性;

OR > 1,暴露可以促进结局的发生;

OR < 1,暴露可以抑制结局事件的发生

Logistic很重要的意义就在于会直接输出OR值,这一点甚至比看直接的回归系数(β)还有意义。

OR值与回归系数β的数量关系为:OR = eβ。在实际的应用中应该如何解读OR值,我们结合一下文献案例进行讲解。

R值的应用分析

多重线性回归,一般是指有多个自变量X,只有一个因变量Y。前面我们主要是以简单线性回归为例在介绍,两者的差距主要在于自变量X的数量,在只有一个X时,就称简单线性回归。

以下文章于2015年发表于《中国护理管理》,研究团队主要采用Logistic回归分析医护人员“工作感受”的影响因素,研究的摘要截图如下:

文章采用第五次国家卫生服务调查问卷中有关工作感受的调查表,测量医护人员工作感受情况:包括工作认知、工作满意度、职业紧张和离职意愿4个维度。

该研究并没有直接采用“工作感受”量表总得分进行研究,而是将上述4个维度分别作为“因变量(Y)”与其他因素,如性别、年龄、婚姻状况、最高学历、专业技术职称(X)等进行Logistic回归分析。

前文我们强调了进行Logistic回归的基本条件是:Y是分类变量,本研究符合这个条件吗?

符合。作者将“工作认知、工作满意度、职业紧张和离职意愿”的量表得分换算成两个类别:1=高,0=低,由此,这些因变量就是典型的二分类变量,从而可以进行Logistic回归分析。

需要明确的是,该研究一共进行了四次分析,因为有四个因变量。自变量赋值表和Logistic分析表如下:

我们在分析Logistic回归分析结果时,必须结合自变量的赋值情况来看,这是因为将“男性”赋值为“1”得到的结果与将“男性”赋值为“0”的结果会正好相反,解读时需特别注意。如上表4,我们重点看“B值”和“OR值”。

比如,表格的第一行,研究的是“护士工作满意度”的影响因素。虽然模型开始时纳入了所有的自变量,但经过筛选,最终有意义仅剩下“婚姻状况”和“工作时间”(P<0.05)两个有统计学意义的变量。这里我们以“婚姻状况”为例来解读OR值的含义。

根据自变量赋值表,婚姻状况变量中“0”为“无配偶”,“1”为“有配偶”,其表格中对应的OR值为“4.045”(>1),根据我们上文总结的OR值的意义,大于1的OR值表明:暴露会促进结局的发生。

在本研究中,“暴露”可以理解为“有配偶”,“结局”可理解为“获得高的工作满意度”,因此,OR大于1,表明:随着婚姻状况的提升(从无配偶,“晋级”为有配偶),工作高满意度的情况更容易发生

从而说明,“婚姻状况”是护士工作满意度的一个影响因素,并且相对于“无配偶”的护士,“有配偶”的护士工作满意度得分更高。

再次提醒,能够这样解读,是因为我们把“工作满意度高”赋值为“1”,“工作满意度低”赋值为“0”,这个顺序和“有无配偶”的顺序是一致的。

与此形成对比,对于“医生离职意愿”这个因变量而言,年龄的回归系数(B值)为-0.711,其对应的OR值变为“0.491”(<1),意味着,随着年龄的提升,医生的离职意愿是变低的

这一点也是很符合常识的。一般而言,年龄越大,其在职年限也越大,各方面的待遇会更好些,所以更不会选择离职。

最后,值得指出的是,本案例我们讲解的Logistic回归具体而言称作“二分类”Logistic回归分析,这也是应用最广泛的一类。

而当因变量不再是二分类变量,而是多分类变量时,我们仍可以进行Logistic回归,此时称作“多分类Logistic回归分析”。

关于多分类的Logistic回归分析操作起来较为复杂,后期我们有机会再进行更详细的讲解。

如何理解广义线性回归分析Logistic输出的OR值?相关推荐

  1. 【数学建模笔记】【第七讲】多元线性回归分析(一): 回归分析的定义、对于线性的理解以及内生性问题的探究

    多元线性回归分析 回归分析是数据分析中最基础也是最重要的分析工具,绝大多数的数据分析问题,都可以使用回归的思想来解决.回归分析的任务就是,通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制, ...

  2. R语言贝叶斯广义线性混合(多层次/水平/嵌套)模型GLMM、逻辑回归分析教育留级影响因素数据...

    全文下载链接:http://tecdat.cn/?p=24203 本教程使用R介绍了具有非信息先验的贝叶斯 GLM(广义线性模型) (点击文末"阅读原文"获取完整代码数据). 当前 ...

  3. R语言广义加性模型(generalized additive models,GAMs):使用广义线性加性模型GAMs构建logistic回归

    R语言广义加性模型(generalized additive models,GAMs):使用广义线性加性模型GAMs构建logistic回归 目录

  4. eviews做回归分析时输出值的理解

    一.背景 假设我们在对一组样本做回归分析,输出结果如下 Estimate Std. Error t value Pr(>|t|) (Intercept) 10.0035 5.9091 1.693 ...

  5. 统计|如何理解线性回归分析中残差检验的基本步骤

    本博文源于<商务统计>,旨在讲述如何对线性回归分析中已经拟合好的直线做残差分析.当谈起残差,必须了解残差是y的实际值和预测值之差. 线性回归模型的残差检验假定条件 线性假定:X与Y之间的关 ...

  6. 手把手教线性回归分析(附R语言实例)

    本文长度为8619字,建议阅读15分钟 本文为你介绍线性回归分析. 通常在现实应用中,我们需要去理解一个变量是如何被一些其他变量所决定的. 回答这样的问题,需要我们去建立一个模型.一个模型就是一个公式 ...

  7. 关于GLMM(generalized linear mixed model)广义线性混合模型

    文章目录 1.广义线性混合模型 2.GLMM的基本程序实现 2.1 Stata基本实现 2.2 R基本实现方法 3.GLMM的交叉项分析 3.1 Stata实现 3.2 R实现 4.置信区间的计算方法 ...

  8. python中如何画logistic_如何在 Python 中建立和训练线性和 logistic 回归 ML 模型?

    原标题:如何在 Python 中建立和训练线性和 logistic 回归 ML 模型? 英语原文: 翻译:(Key.君思) 线性回归与logistic回归,是. 在我的里,你们已经学习了线性回归机器学 ...

  9. 在python中使用最小二乘法画出拟合曲线_基于jupyter notebook的python编程-----运用最小二乘法,导入文件数据模拟一元线性回归分析...

    基于jupyter notebook的python编程-----运用最小二乘法,导入文件数据模拟一元线性回归分析 用最小二乘法模拟一元线性回去曲线的目录 一.运行jupyter notebook,搭建 ...

最新文章

  1. Linux下Web服务器应用之基础简介
  2. hadoop 实战练习_hadoop入门到实战(2)hive经典练习题
  3. 百度地图- - - 鹰眼轨迹- - - -实时定位
  4. ArrayBlockingQueue中的方法
  5. Python对象类型
  6. 关于爬虫中遇到的问题
  7. mysql与mssql中datetime类型字段问题_excel数据存入sqlserver过程中,遇到Datetime的格式问题。...
  8. glup打包代码不更新
  9. 教你如何在linux 下批量卸载
  10. 03Linux用户和组及权限
  11. TCP的带宽估计和丢包恢复
  12. 玩转Linux进程控制命令
  13. asp.net中DataGrid双行跨列表头设计心得
  14. xcode5 xcode6 xcode6.2beta网盘下载地址
  15. linux的bridge,Linux Bridge 详解
  16. did拼接屏最小拼缝0.88mm
  17. 计算机软件安装流程,计算机软件系统快速安装流程简介
  18. 程序员工资一般多少_一般程序员真实工资 程序员工资薪酬大起底
  19. 2019 计蒜之道 初赛 第一场 A 商汤的AI伴游小精灵
  20. Excel根据手机号区分运营商

热门文章

  1. 博特电子-17届智能车无线充电组恒功率方案
  2. matlab奇异矩阵高效求逆,奇异矩阵求逆问题!!!
  3. 计算机专业证书难度,计算机专业应该考这些证书!
  4. 基于单片机的心率体温血压系统设计(#0494)
  5. 智能语音将成下一代人机交互新入口
  6. 基于SSM实现企业生资源管理系统-ERP系统
  7. 朱刘算法 有向图的最小生成树
  8. 持币大户谈PRS投资策略
  9. PR基础学习(一) 界面初步认识
  10. python格式化字符%e_用%格式化Python字符串