SPSS(九)Logistic模型族进阶

我么们知道logistic回归针对的是二分类的因变量

当因变量是无序多分类和有序多分类的情况呢?所以这篇博客介绍下面两种方法

无序多分类Logistic回归模型

有序多分类Logistic回归模型

无序多分类Logistic回归模型

研究问题:病例-对照研究中设立一组病例和多组对照,需要分析暴露是否和患病有关,则结局变量为无序三分类,应当使用该模型加以分析

  • 病例
  • 医院对照
  • 健康人群对照

针对这个问题我们没学无序多分类Logistic回归模型之前可以怎么做?

1.强行做二分类logistic回归,把(病例和医院对照)和健康人群作为两个类别,但是这样做丢失信息太多

2.先做病例与健康人群,再做病例和医院对照的logistic回归,这样做虽然遵守基本研究方向,生成两个报告,但是分析结果各干各的,想进一步研究各因素的影响大小,同一个模型的可以做与之相关的检验,现在两个模型就无能为力了

无序多分类Logistic回归模型:

因变量为无序多分类,除一个对照水平外,以每一分类与对照水平作比较

例如结果变量有三个水平:a、b、c,如果以a为参照水平,就可以得到两个Logistic函数,一个是b与a相比,另一个是c与a相比

同时应当有:Pa+Pb+Pc=1

模型简介

案例:不同背景人群的选举倾向

老布什、克林顿、佩罗在1992年进行的较量,数据集在我的资源下载【SPSS(九)无序多分类数据集.sav】

分析--回归--多项Logistic

为了方便讲解,我们目前只加入自变量为分类的变量

结果解读:

  • 案例处理摘要:自变量的计数统计
  • 模型拟合信息:截距就是仅常数项,-2倍对数似然值是模型对数据的解释程度,模型的价值指标,越接近0越好,单独看没有意义,要和其他模型比较,最终就是加入16个参数之后模型有没有改善,Sig.<0.05,说明有意义,而且-2倍对数似然值对比仅常数项下降了123.593个卡方值
  • 伪R方:R方无限接近与1越好,R方是衡量模型可用性,模型信息量表达,伪R方和R方解读一样
  • 似然比检验:变量引入模型是否有价值,Sig.<0.05,就是有价值的;但是对方程1还是方程2有价值,我们结合后面的参数估计看
  • 参数估计:看第二行,老布什为参考水平与克林顿对比,性别中以女性为参考,Sig.<0.05有意义,Exp(B)为1.589,布什与克林顿相比男性选民比女性选民多1.589倍

如上图,看第三行,老布什为参考水平与佩罗对比,学历以研究生水平为参考,发现三行的Exp(b)相类似,可以划分为中等学历,老布什与佩罗相对比,中等学历比研究生学历多2倍,degree=0的Sig.>0.05认为低学历里面对老布什与佩罗没有太大的差异

其实对于学历这个自变量我们后期想优化模型可以这么做

1.参考水平选低学历为参考水平解读起来会顺口一点

2.分类自变量扔进模型默认进行哑变量编码,我们尝试使用最佳尺度是不是会好一点

3.把学历换为原始的连续自变量受教育年限选进来会不会好一点,但是受教育年限是线性回归还是曲线回归要研究一下

对于结果,其实我们可以选老布什之外的两个作为参考水平,看是不是解读起来会不会好一点,虽然模型结果都是一样

上面这个案例中,单独做两个Logistic回归和只做一个无序多分类Logistic回归到底会有多大差别?

其实结果不会相差太多,但是无序多分类Logistic回归可以看两个模型的似然比检验,而且某些参数可以做设定,比如假设年龄和性别回归参数一样大,可以检验其是否成立

有序多分类Logistic回归模型

针对因变量为有序多分类的回归预测,我们可以使用有序多分类Logistic回归模型

单变量分析使用秩和检验即可,如果进行多变量分析,简单的按照连续变量来处理可能不合适

思路:把有序类别考虑上升一个或者更多的级别

多分类有序因变量的资料,分类水平大于2且水平之间有等级关系。

拟合水平数-1个logit模型,称为累加logit模型(Cumulative logits model)。

例如对一个四分类有序变量,即应当同时拟合以下三个模型:π1、π2、π3分别为因变量取第一类、第二类、第三类时的概率,而第四类则作为用于对比的基础水平。

模型简介

和无序多分类Logistic回归不一样的是,有序多分类Logistic回归回归系数是一样的,只改变常数项

回归系数是一样这样真的符合实际情况吗?(平行线检验)

可见,这种模型实际上是依次将因变量划分为两个等级,不管模型中因变量的分割点在什么位置,模型中各自变量的系数β都保持不变,所改变的只是常数项α。此时求出的OR值是自变量每改变一个单位,因变量提高一个及一个以上等级的比数比。这种假设看似复杂,但大量实践证明,它是符合多数实际情况的。

模型适用条件

  • 样本量大
  • 通过平行线检验

案例:工作满意度影响因素分析

由于文件数据集太大,数据上传到我的资源,大家可以去下载

分析--回归--有序

结果解读

警告:年龄拆分下来会有很多空的单元格

拟合度:这个方程拟合现在的数据是否充分是否还有其它交互项项需要纳入

我么发现拟合度两个结果在打架,一个显著性小于0.05,一个显著性大于0.05,原因是拟合度要求每个单元格有足够多的样本,我们有一个连续型变量是缺失的,有一些单元格没有数据

参数估计:

阈值指的就是因变量

位置就是自变量

性别gender显著性大于0.05不用管

年龄age,估计那个不是OR值,OR值需要手动计算,Exp(估计),年龄通过检验,解释为年龄每增加一个单位,满意度等级上升Exp(-0.31)倍

平行性检验

我们说了有序多分类Logistic回归是有适用条件的,我们做平行线检验

分析--回归--有序

输出--平行线检验

结果解读:

零假设:回归系数一样的情况下,算出的-2对数似然值

广义:假如我们不要求系数一样,让各模型参数自己变化,得到-2对数似然值为6189.793,但是增加了9个参数,Sig.>0.05是不值得的

所以,我们的模型平行线检验是没有问题的,数据符合我们的假设

SPSS(九)Logistic模型族进阶(图文+数据集)相关推荐

  1. SPSS(六)SPSS之回归分析衍生方法(图文+数据集)

    SPSS(六)SPSS之回归分析衍生方法(图文+数据集) 我们知道线性回归是有适用条件的 因变量的独立性 正态性 方差齐性 无极端值 自变量.因变量要有线性趋势 假如不满足以上的条件,还能做回归分析吗 ...

  2. SPSS(十九)SPSS之时间序列模型(图文+数据集)

    SPSS(十九)SPSS之时间序列模型(图文+数据集) 时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列.正如人们常说,人生的出场顺序很重要,时间序列中隐藏着一些过去与未来的关系. ...

  3. SPSS(十七)SPSS之判别分析进阶(图文+数据集)

    SPSS(十七)SPSS之判别分析进阶(图文+数据集) 为什么会有这些新模型的出现? 树模型结构 神经网络模型 传统模型的局限 任何统计模型都是对现实世界复杂联系的简化 统计理论假设对任何一个随机现象 ...

  4. SPSS(五)SPSS之相关分析与线性回归模型(图文+数据集)

    SPSS(五)SPSS之相关分析与线性回归模型(图文+数据集) 在讲解线性回归模型之前,先来学习相关分析的知识点,因为相关分析与回归有着密切的联系 相关分析 任意多个变量都可以考虑相关问题,不单单局限 ...

  5. (转载)SPSS之相关分析与线性回归模型(图文+数据集)

    SPSS之相关分析与线性回归模型(图文+数据集) 在讲解线性回归模型之前,先来学习相关分析的知识点,因为相关分析与回归有着密切的联系 相关分析 任意多个变量都可以考虑相关问题,不单单局限于两个变量,一 ...

  6. SPSS(十二)SPSS对应分析(图文+数据集)

    SPSS(十二)SPSS对应分析(图文+数据集) 对应分析的介绍 对应分析其实是对分类变量进行信息浓缩的方法,之前的主成分分析/因子分析针对的是连续型的变量 分析分类变量间关系时 卡方检验只能给出总体 ...

  7. (转载)SPSS之聚类分析(图文+数据集)

    SPSS之聚类分析(图文+数据集) 聚类分析简介 按照个体(记录)的特征将它们分类,使同一类别内的个体具有尽可能高的同质性,而类别之间则具有尽可能高的异质性. 为了得到比较合理的分类,首先要采用适当的 ...

  8. SPSS(十一)SPSS信息浓缩技术--主成分分析、因子分析(图文+数据集)

    SPSS(十一)信息浓缩技术--主成分分析.因子分析(图文+数据集) 当我们的自变量存在多重共线性,表现为进行回归时候方程系数估计不正常以及方程检验结果不正常,也许我们可以使用变量挑选的办法(手动挑选 ...

  9. SPSS(十四)SPSS之多维尺度分析(图文+数据集)

    SPSS(十三)SPSS之多维尺度分析(图文+数据集) 多维尺度分析简介 多维尺度(Multidimensional scaling,缩写MDS,又译"多维标度")也称作" ...

最新文章

  1. “口碑营销”产品模型推测与分析
  2. IOS第三天(@property与@synthesize的用法)
  3. 设置计算机关机静音,Shortcuts 捷径控制 Windows 电脑:静音开关、音量调节、待机、关机...
  4. 【Linux】一步一步学Linux——builtin命令(215)
  5. python分割字符串输出_python字符串分割
  6. 在HTML中使用javascript (js高级程序设计)
  7. 手游传奇刷元宝_传奇手游 平民制霸刀刀爆元宝!
  8. SQL Server 2000 Service Pack 4 is released
  9. .Net core 应用程序发布Web时,有些文件夹没有发布成功解决办法
  10. Atitit 混合叠加俩张图片的处理 图像处理解决方案 javafx blend
  11. python fft函数_python scipy fft.fft用法及代码示例
  12. 深入理解Nginx模块开发与架构解析第2版(书签导航正确)
  13. python deap_python 的 DEAP框架学习
  14. ADB 环境变量配置教学
  15. 海康大华宇视硬件NVR通过GB28181注册接入到LiveGBS国标流媒体服务后通道显示为0如何处理
  16. 计算机用三角函数时如何用弧度制,弧度制 三角函数的简单应用
  17. Youtube视频传输规律
  18. Windows常见错误
  19. 移动端产品设计(02)-移动APP产品结构
  20. Python初学笔记4-【嵌套循环】

热门文章

  1. React-mentions 库介绍
  2. 爆音在bilibili 的韵脚语录
  3. 倾角传感器工作原理与特点
  4. BAT产品经理面试题--如何同时拿下百度腾讯阿里的产品岗offer
  5. win8.1 android 双系统,图文详解Win8.1安装双系统的步骤
  6. 简单介绍Excel单元格行列指示的实现原理(俗称聚光灯功能)
  7. ESP32之SPI外设概述
  8. 知乎高赞!11个短小精悍的Python代码!
  9. 只想让你知道我喜欢你
  10. Chrome标签整理