点击上方蓝字关注我们

在社会科学的研究中,经常会遇到二元变量的情况,例如死亡或未死亡、购买或未购买等,对于二元变量,无法直接采用一般的多元线性模型无法进行回归分析,因为残差不满足正态性、无偏性、共方差性等假设,同时解释变量的取值范围不再是-∞~+∞。如果希望根据一系列预测变量的值来预测某种特征或结果是否存在,且因变量为二元变量,通常采用二元Logistic回归。

1二元逻辑回归分析的原理与线性回归模型一样,二元逻辑回归模型也需要对模型进行检验和评价,同样分为对回归方程整体的显著性检验、回归系数的显著性检验和模型拟合优度评价。1.回归方程整体显著性检验与一般的线性模型一样,二元逻辑回归方程的显著性检验用于检验In与所有变量之间的线性关系是否显著,检验的原假设是各回归系数同时为零,备选假设为各回归系数不同时为零。常用的检验方法有对数似然比检验和Hosmer-Lemeshow检验。2.回归系数的显著性检验与一般线性回归模型一样,还需要对每个回归系数的显著性进行检验。但是,在二元逻辑回归模型中,回归系数显著性检验不是通过T检验,而是构造Wald统计量来进行,Wald 统计量和似然统计量都是极大似然估计方法中常用的检验统计量。3.模型拟合优度评价二元逻辑回归模型拟合优度评价的常用统计量包括Cox-Snell R方统计量和NagelkerkeR方统计量。2二元Logistic回归的SPSS实现“data 09.sav”数据文件是一些肿瘤患者的基本资料。现要求利用通过年龄、肿瘤大小和扩散等级来拟合癌变部位的淋巴结是否含有癌细胞的二元Logistic回归方程。1.打开 “data 09.sav” 数据文件,选择“分析”—“回归”—“二元Logistic”,弹出如下图所示“Logistic回归”对话框,在左侧的变量列表中选中“癌变部位的淋巴结是否含有癌细胞”,将其选入“因变量列表”,将“年龄”、“肿瘤大小(厘米)”、“扩散等级”变量选入右边的“协变量列表”,“方法”选择系统默认的“输入”。

2.单击【分类】按钮,弹出如下图所示的“Logistic回归:定义分类变量”对话框,将“扩散等级”变量选入分类协变量列表,对比方法选择系统默认的指示灯。单击【继续】按钮返回主对话框。

3.单击“保存”按钮,弹出如下图所示的“Logistic回归:保存”按钮。在“预测值”栏中勾选“概率”和“组成员”复选框,在“影响”栏中勾选“杠杆值”复选框,在“残差”栏中勾选“标准化”复选框,并勾选“包含协方差矩阵”复选框。单击【继续】按钮返回主对话框。

4.单击【选项】按钮,弹出如下图所示的“Logistic回归:选项”对话框。在“统计和图”栏中勾选“分类图”、“Hosmer-Lemeshow拟合度”、“exp(B)的CI”,其他为系统默认。单击【继续】按钮返回主对话框。

5.完成所有设置后,单击【确定】按钮执行命令。3二元Logistic回归的结果分析1.从表1中可以看出参与分析的个案为978,无缺失值。

2.表2为因变量变量的编码。表3为自变量中的分类变量根据指示变量编码方案所生成的新变量。新变量的变量名称为扩散等级(1)何扩散等级(2)。

3.表4是拟合开始前模型外变量的卡方检验,所有变量的显著性均小于0.05,整体的显著性也小于0.05,整体的显著性也小于0.05,所以,所有变量进入模型都是有意义的。

4.表5是3种常用的卡方统计量,因拟合方法选择的是输入,所以一步就完成了模型的拟合,所以,步长、块和模型的卡方值都相同,显著性小于0.05,说明解释变量的全体与Logit P之间的线性关系显著,采用此模型是合理的。

5.表6是模型拟合优度统计量,表中的-2对数似然值为838.913,值较大,说明模型拟合效果不是很好,Cox&snell R平方和Nagelkerke R 平方值分别为0.087和0.142,值较小,说明模型方程能解释的回归变异很小,模型拟合不理想。

6.表7给出了Hosmer和Lemeshow检验的统计量,显著性小于0.05,所以拒绝零假设,表示方程拟合效果不理想。

7.表8是Hosmer和Lemeshow检验的列联表,根据预测概率,将数据分为10组,第2行和第3行是“癌变部位的淋巴结是否含有癌细胞=无”的观测值和期望值,第4行和第5行是“癌变部位的淋巴结是否含有癌细胞=有”的观测值和期望值,可见各行的观测值和期望值存在一定的差异,说明模型拟合效果不理想。

8.表9是观测值和预测值的分类表,从表中可以看出798名癌变部位的淋巴结没有癌细胞的患者被准确预测,正确率只有97.9.0%,但是只有16名癌变部位的淋巴结含有癌变细胞的患者被准确预测,正确率只有9.0%,总的正确率为81.7%,说明预测效果不理想。

9.表10给出了各变量的系数(B),可以写出方程:Z=1.116*肿瘤大小(厘米)+2.953*肿瘤扩散等级(1)+2.026*肿瘤扩散等级(2)-5.714得出估计淋巴结中是否含有癌细胞的概率为:

后台回复【二元Logistic回归】获取案例中的数据。

参考资料:

李昕,张明明.SPSS 22.0统计分析[M].北京:电子工业出版社,2015.

图文:郭鑫排版:郭鑫

logistic回归分析优点_二元Logistic回归相关推荐

  1. logistic回归分析优点_逻辑回归的简单介绍

    一.逻辑回归的概念 逻辑回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域. 二.逻辑回归不是回归 从名字来理解逻辑回归.在逻辑回归中,逻辑( ...

  2. 二元logistic模型案例_二元逻辑回归的简介与操作演示

    二元逻辑回归介绍 定义 Logistic回归主要用于因变量为分类变量(如是否等)的回归分析,自变量可以为分类变量,也可以为连续变量.它可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用 ...

  3. logistic回归分析优点_机器学习实战项目-Logistic回归

    Logistic 回归 概述 Logistic 回归虽然名字叫回归,但是它是用来做分类的.其主要思想是: 根据现有数据对分类边界线建立回归公式,以此进行分类. 须知概念 Sigmoid 函数 回归 概 ...

  4. 二元logistic模型案例_基于Logistic回归的二元分类应用(含公式推导)

    一. 关于回归 在分类中问题中,如果给定一个输入,其所产生的输出是一个布尔值,那么这是是与否型的答案:而在输出是数值型的值下,我们所希望的学习结果不是C={0, 1},而是一个连续的函数.我们倾向于将 ...

  5. 二元logistic模型案例_二元选择(logistic的s )模型.ppt

    二元选择(logistic的s )模型 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. ...

  6. 一文理解二元logistic回归

    目录 1.二元logistic分析思路说明 2.如何使用SPSSAU进行二元logistic操作 3.二元logistic相关问题 在研究X对于Y的影响时,如果Y为定量数据,那么使用多元线性回归分析( ...

  7. excel计算二元线性回归_快速掌握Logistic回归分析及应用

    影响关系研究是所有研究中最为常见的.我们都知道当Y是定量数据时,线性回归可以用来分析影响关系.如果现在想对某件事情发生的概率进行预估,比如一件衣服的是否有人想购买?这里的Y是"是否愿意购买& ...

  8. 多元有序logistic回归分析_多元Logistic_回归分析解析.ppt

    医学研究中经常遇到分类型变量 二分类变量: 生存与死亡 有病与无病 有效与无效 感染与未感染 多分类有序变量: 疾病程度(轻度.中度.重度) 治愈效果(治愈.显效.好转.无效) 多分类无序变量: 手术 ...

  9. 【学习笔记】二元Logistic回归预测

    目录 1.基本含义和思想 2.论文[3]进行回归预测的思路是什么? 3.求逻辑回归模型的数学过程 3.1 改写函数 3.2 函数变换 3.3 得到离散概率 3.4 最大似然法 3.5 牛顿法 4.逻辑 ...

  10. 多元有序logistic回归分析_有序Logistic回归实例分析(Ordinal Regression)

    如果研究X对于Y的影响,Y为定量数据则可以使用线性回归分析.如果Y是定类数据,此时则需要使用Logit(logistic)回归分析.Logit回归共分为三种,分别是二元Logit(Logistic)回 ...

最新文章

  1. Delphi 的内存操作函数(2): 给数组指针分配内存
  2. [轉]VS2010 SP1 TFS 2010 SP1 官方正式版下载
  3. Mysql数据库安全管理配置
  4. Matconvnet 学习笔记
  5. oracle dbms调度程序,Oracle 调度程序作业( dbms_scheduler )(zt)
  6. (转)Arcgis for JS之Cluster聚类分析的实现
  7. ECMAScript 6学习总结(2)——ECMAScript 6常用方法总结
  8. EJB3.0学习笔记---JBOSS 7.1.1 Final版本安装与配置
  9. 使用xftp工具修改文件权限
  10. 一个大图切成几个小图加载速度更快_谷歌SEO页面速度的重要性
  11. [转]OOPC:Object-Oriented Programming in C
  12. iOS 之NSOperation(一)
  13. 136.Single Number
  14. 网页设计作业作品成品HTML5+CSS大作业——简单的程序员个人博客(7页) 大学个人博客网页制作教程 表格布局网页模板
  15. 修复inspinia中popover的点击问题
  16. 笔记本开机密码忘记了怎么解决,消除笔记本密码
  17. 定企业生死的中台,到底长啥样?
  18. Python3.X 爬虫实战(并发爬取)
  19. TQFP 和LQFP 器件的焊接方法
  20. 骑友,怎么挑选适合自己的赛事

热门文章

  1. 计算机应用202001常规,2001年4月份全国高等教育自学考试计算机应用基础试题
  2. 自考计算机基础知识考题,自考计算机应用基础试题及参考答案
  3. 【软件应用】word等office软件中好用的数学公式编辑器插件
  4. php ip 访问频繁,php刷新过于频繁自动加ip黑名单
  5. win32实现两个透明窗口联动
  6. 兼容IE,Firefox,chrome等浏览器 : 设为首页和收藏的Javascript代码
  7. 计算机安全权限不足或配置文件损坏,Windows XP用户配置文件丢失或损坏后的恢复方法...
  8. 如何设计百度 豆丁 道客巴巴 下载器
  9. gis地图php,中国地图矢量gis数据
  10. 2022牛客寒假算法基础集训营(一)1全部题解