在医学研究中,为了控制一些重要的混杂因素,经常会把病例和对照按年龄,性别等条件进行配对,形成多个匹配组。各匹配组的病例数和对照人数是任意的,比如一个病例和若干个对照匹配即1:1,在医学上称作“1:1病历对照研究”,常见还有1:M(M <=3),即1个病例和1或2或3个对照匹配。

病历对照研究或者倾向得分匹配研究(一种将研究数据处理成‘随机对照实验数据’的方法)中常使用条件Logistic回归进行分析。其与普通的二元logistic回归区别在于,多出配对ID,即将配对组纳入考虑范畴。

1、案例背景

某北方城市研究喉癌发病的危险因素,使用1:2匹配的病例对照研究方法进行调查。共有25对配对数据(每对3个,即25*3=75行数据)。现研究两个影响因素分别是:是否吸烟和是否有癌症家族史。数据格式(部分)如下表:

提示:

条件logistic回归时,数据中一定需要记录配对编号,比如1:2的配对(1个病例配对2个对照,且共有20个组,组别编号从1到20,那么同时会有3个1,3个2,3个3,类似下去),而且在分析时将配对编号放入对应框中。

配对编号ID:共有25对配对,编号从1~25,每个数字会重复3次(分别对应病例或对照组);

Y是否患喉癌:数字1表示病例组即患喉癌,数字0表示对照组即没有患喉癌;

X1是否吸烟:数字1表示吸烟,数字0表示不吸烟;

X2癌症家族史:数字1表示有家族患喉癌史,数字0表示没有家族患喉癌史。

在做条件logistic回归时,因变量只能为0和1二分类数据。数字中只能包括0和1,如果不是,可使用[数据处理]->[数据编码]进行设置。

2、操作

本例子操作截图如下:

3、结果分析

SPSSAU共输出三个表格,分别是:“条件logit回归模型似然比检验结果”,“条件logit回归模型分析结果汇总”,“条件logit回归模型分析结果汇总”。

① 第一个表格:条件logit回归模型似然比检验结果

模型似然比检验,用于分析模型是否有效;

在分析上,首先需要模型通过似然比检验,其原定假设为不加入X和加入X模型无明显差异,如果对应的p值小于0.05,意味着拒绝原假设,也即说明模型有意义。

从上表可知:此处模型检验的原定假设为:是否放入自变量(X1是否吸烟, X2癌症家族史)两种情况时模型质量均一样;从上表可知,模型拒绝原定假设(chi=6.319,p=0.042 <0.05),即说明本次构建模型时,放入的自变量具有有效性,本次模型构建有意义。

② 第二个表格:条件logit回归模型分析结果汇总

包括模型的回归系数,R方值等数据;

从上表可知:模型McFadden R方值为0.115,意味着是否吸烟, 癌症家族史共2项可解释是否患喉癌的11.5%原因。

具体来看:X1是否吸烟的回归系数值为1.243,并且呈现出0.05水平的显著性(z=2.322,p=0.020 <0.05),意味着X1是否吸烟会对Y是否患喉癌产生显著的正向影响关系。以及 (RR值,exp(b)值)为3.465(95% CI:1.214~9.892),意味着相对不吸烟群体,吸烟群体患喉癌的风险倍数会加大3.465倍。

X2癌症家族史的回归系数值为-0.184,但是并没有呈现出显著性(z=-0.365,p=0.715>0.05),意味着是否有癌症家族史并不会对患喉癌产生影响。

4、总结

分析过程涉及以下几个关键点:

(1)条件logistic回归时,数据中一定需要记录下配对编号,比如1:2的配对(1个病例配对2个对照,且共有20个组,组别编号从1到20,那么同时会有3个1,3个2,3个3,类似下去),而且在分析时将配对编号放入对应框中。

(2)条件logistic回归时,因变量只能为0和1二分类数据,数字中只能包括0和1,如果不是,可使用数据处理->数据编码进行设置。

logit回归模型假设_一文读懂条件Logistic回归相关推荐

  1. 二值logit模型的适用条件_一文读懂条件Logistic回归

    在医学研究中,为了控制一些重要的混杂因素,经常会把病例和对照按年龄,性别等条件进行配对,形成多个匹配组.各匹配组的病例数和对照人数是任意的,比如一个病例和若干个对照匹配即1:1,在医学上称作" ...

  2. logit回归模型假设_一文让你搞懂Logistic回归模型

    注:本文是我和夏文俊同学共同撰写的 现考虑二值响应变量 ,比如是否购车,是否点击,是否患病等等,而 是相应的自变量或者称特征.现希望构建一个模型用于描述 和 的关系,并对 进行预测. 线性模型可以吗? ...

  3. R语言构建logistic回归模型:WVPlots包PRTPlot函数可视化获取logistic回归模型的最优阈值、优化(precision、enrichment)和recall之间的折衷

    R语言构建logistic回归模型:WVPlots包PRTPlot函数可视化获取logistic回归模型的最佳阈值(改变阈值以优化精确度(precision.enrichment)和查全率(recal ...

  4. stata 求输出相关系数矩阵命令_一文读懂结果输出命令大全(上)

    目录 描述统计量 help tabstat   //Stata 官方命令 描述统计量组间均值差异检验 help ttest help ttable2 help estout 相关分析命令 help p ...

  5. psm倾向得分匹配法举例_一文读懂倾向得分匹配法(PSM)举例及stata实现(一)

    原标题:一文读懂倾向得分匹配法(PSM)举例及stata实现(一) 一.倾向匹配得分应用之培训对工资的效应 政策背景:国家支持工作示范项目( National Supported Work,NSW ) ...

  6. stata 将数据集变量名称导出_一文读懂空间计量经济学及stata操作

    在Stata 15中,推出了最新的空间计量官方命令,均以sp开头,表示 spatial data),可以处理横截面与面板形式的空间数据.本文主要为大家介绍空间计量命令之spregress的使用. 一. ...

  7. mysql 默认事务隔离级别_一文读懂MySQL的事务隔离级别及MVCC机制

    回顾前文: <一文学会MySQL的explain工具> <一文读懂MySQL的索引结构及查询优化> (同时再次强调,这几篇关于MySQL的探究都是基于5.7版本,相关总结与结论 ...

  8. java中date类型如何赋值_一文读懂java中的Reference和引用类型

    简介 java中有值类型也有引用类型,引用类型一般是针对于java中对象来说的,今天介绍一下java中的引用类型.java为引用类型专门定义了一个类叫做Reference.Reference是跟jav ...

  9. python输入什么就输出什么_一文读懂Python的输入和输出

    本文介绍了Python的输入和输出,既然是Python代码,那么就一定有输出量,那么,Python是如何输出的呢? 输出 用print()在括号中加上字符串,就可以向屏幕上输出指定的文字.比如输出'h ...

最新文章

  1. 台积电获苹果A10大量订单 三季度销售额将增长20%
  2. 【快乐水题】1816. 截断句子
  3. 非易失性内存在阿里生产环境的首次应用:Tair NVM最佳实践总结
  4. 描写火车站场景_描写火车站热闹场面的作文300字
  5. 函数使用了堆栈的字节超过_单片机地址空间,堆栈理解
  6. Table 自动换行问题
  7. 简单的实现登录拦截及统一异常处理(自定义异常)
  8. 心电图计算心率公式_心电图到底能反应啥问题,看过之后你也能当“医生”
  9. 飞康任命Gartner前分析师担任亚洲区市场总监
  10. java数据横转竖_关于竖表转横表的问题
  11. 如何对酒店的固定资产进行日常管理?
  12. 年终盘点 | 2020年最佳CV论文速览「AI核心算法」
  13. 随心情更新的学习笔记——JS代码之栈的佩兹的糖果盒
  14. Oracle查询成绩高于成绩,Oracle认证考试成绩查询方法
  15. 苹果手机的ipsec
  16. 【iOS】开发者账号
  17. 连接高匿代理接口调用并测试是否可用
  18. 抖音合理安排DOU+投放,快速提升作品播放与互动,轻松上热门变现
  19. 解决newbing提示“今日你已达到今天的对话限制, 登录以继续你的聊天”和bing没有聊天对话框的问题
  20. vlive显示服务器不流畅,为什么手机登录vlive出现这个一直进不去

热门文章

  1. 千牛包表包下载_带有服务器端处理和VueJS组件的数据表包
  2. ROS2机器人f1tenth之CLI工具基础
  3. 如何恢复u盘删除文件?最新图文教程
  4. R语言可视化作图笔记(5.1)交互式图形
  5. 【SpringBoot框架篇】31.基于分布式锁或xxx-job实现分布式任务调度
  6. Python-20:解析行政区域Python版
  7. 公众号 h5 页面 图片上传 wx.chooseImage使用
  8. CSS总结(基本文本和字体样式)
  9. Java毕设项目网上体育用品商城系统(java+VUE+Mybatis+Maven+Mysql)
  10. 使用office2003打开docx文件