什么是Logit回归?

Logit回归(又称逻辑回归、罗杰斯蒂回归、Logistic回归)无疑是社会科学,尤其是社会学研究中使用最广的方法,没有之一。这也是因为社会科学中变量的类型所决定的。因变量的类型决定着回归模型的使用,对于社会科学中常用的类别变量对应的就是Logit回归。

Logit回归又不同于一般线性回归,一般线性回归的回归系数以及R方等较容易解释,但是Logit回归的数学原理中涉及到了对数转换等,所以解释起来与一般线性回归有着较多的不同之处。

Logit回归系数有哪些不同

一般线性回归的解释相对较容易,即x没变化多少个单位,y的变化。但是,由于Logit回归进行了Logit转换,所以就不能像线性回归一样解释,因为因变量已经变成ln(p/1-p),我们不能再说x变化多少个单位ln(p/1-p)变化多少,这样没有实际的意义。而logit回归的本质是针对因变量为分类变量,即相较于另一种情况,某一情况的发生概率。所以针对logit回归的这一特性,我们需要汇报OR值(odds ratio),也称发生比。

可能这样理解起来较为抽象,我们来看一个例子:

上表来源:薛海平. 2015. 从学校教育到影子教育:教育竞争与社会再生产[J]. 北京大学教育评论(03): 47-69+188-189.

该研究的因变量为城镇学生是否参加补习,是一个典型的二分类变量。作者在报告结果的时候同时汇报了回归系数和OR值(发生比Exp(B))。在软件操作时候,SPSS会自动输出Exp,而Stata需要在命令后面增加or的选项。

从上表中我们可以看出,回归系数为正值时,发生比为为大于1的数,而系数为负时候为小于1的数。在进行解释的时候,我们可能更关注发生比。以上表为例,东部地区参加课外补习的概率是西部地区的1.491倍。

Logit回归如何用Stata操作只输出回归系数

logit 因变量 自变量以及控制变量 //二分类Logistic回归

mlogit 因变量 自变量以及控制变量 //多分类Logistic回归

ologit 因变量 自变量以及控制变量 // 次序Logistic回归

输出OR值

logit 因变量 自变量以及控制变量,or //二分类Logistic回归

mlogit 因变量 自变量以及控制变量,or //多分类Logistic回归

ologit 因变量 自变量以及控制变量,or // 次序Logistic回归

论文中如何写?

在论文中Logit回归的写法可谓是各有千秋,有的直接在表中汇报OR值,有的只汇报系数在行文中写出关键变量的发生比,还有像上文一样将系数和OR值都列出来的。这些写法没有对错之分,只取决于作者的习惯。

方法1:只汇报系数

直接汇报系数的好处是,能够直观的看出某一变量对因变量方向上的影响,因为系数是有正负之分的更加直观。

我们来看一个例子:

注:上表数据非真实数据,只为举例子使用。(实际上是小编在候机然后遇到机场大面积延误)

从上表可知,在控制其他变量的情况下,恶劣天气对于飞机是否延误具有正向的影响,相较于费恶劣天气,恶劣天气时飞机更容易延误。风力对于飞机是否延误也具有正向的影响,风力越大,飞机越容易延误。机场所在纬度对于飞机是否延误的影响是负向的,即所在纬度越高飞机越不容易延误。乘客数量对于飞机是否延误的影响也是负向的,即乘客数量越多飞机越不容易延误。票价对于飞机是否延误的影响不显著,但也是负向的。购买延误险的乘客比例越高,飞机越不容易延误。是否是天合联盟成员对于飞机延误没有显著影响。

只汇报系数的缺点:不能看出数量的差异,即我们只知道室恶劣天气具有正向影响,但不知道恶劣天气对于飞机延误概率的影响有多大。

方法2:汇报OR值

汇报OR值的好处是能够看出数量的影响。而对于汇报OR值可以有两种办法,第一种就是前文关于课外补习的例子,在表中直接给出,在表中直接写出的相对较容易,直接描述即可。

第二种是在表中依旧只汇报系数,而在行文中写出,例如:

相较于非恶劣天气,恶劣天气导致飞机延误的概率会提升75.86%(Exp0.565-1=0.7586,p<0.01)。

相较于非恶劣天气,恶劣天气导致飞机延误的概率是非恶劣天气的1.76倍(Exp0.565=1.76,p<0.01)

有木有觉得这样写更高大上一点?而且还能凑点字数。嘻嘻

希望对大家的学习有帮助,我继续等我的延误的飞机了~

模型与logit_基础方法 | 如何用Logit回归模型写论文?相关推荐

  1. logit回归模型的参数估计过程_评分卡模型原理及应用

    关注新蜂数字金融,ID:gh_c5ca7eb11df4 这是新蜂数字金融的第145篇原创首发文章 信用评分卡模型,作为金融业一项重要的风险控制手段,在行业中有着广泛的应用.只有对模型进行科学认知,理解 ...

  2. logit回归模型假设_一文读懂条件Logistic回归

    在医学研究中,为了控制一些重要的混杂因素,经常会把病例和对照按年龄,性别等条件进行配对,形成多个匹配组.各匹配组的病例数和对照人数是任意的,比如一个病例和若干个对照匹配即1:1,在医学上称作" ...

  3. logit回归模型_常见机器学习模型的假设

    > Photo by Thought Catalog on Unsplash 暂时忘记深度学习和神经网络. 随着越来越多的人开始进入数据科学领域,我认为重要的是不要忘记这一切的基础. 统计. 如 ...

  4. logit回归模型_你们要的二项Logit模型在这里——离散选择模型之八

    前言:本文主要介绍如何以效用最大化理论为基础,推导出二项 Logit(Binary Logit)模型. 本文为系列离散选择模型(Discrete Choice Model, DCM)系列文章的第8篇. ...

  5. logit回归模型假设_一文让你搞懂Logistic回归模型

    注:本文是我和夏文俊同学共同撰写的 现考虑二值响应变量 ,比如是否购车,是否点击,是否患病等等,而 是相应的自变量或者称特征.现希望构建一个模型用于描述 和 的关系,并对 进行预测. 线性模型可以吗? ...

  6. logit回归模型假设_Logistic回归模型及应用建模(二)

    二.因变量多分类 logistic 回归 ​1.概述:多元Logistic回归模型被用来建立有多个输出变量的模型,且这些预测变量通过一个线性组合变成为一个最终的预测变量.Multinomial Log ...

  7. logit回归模型假设_机器学习基础---逻辑回归(假设函数与线性回归不同)

    一:分类 (一)分类基础 在分类问题中,你要预测的变量y是离散的值,我们将学习一种叫做逻辑回归 (Logistic Regression) 的算法,这是目前最流行使用最广泛的一种学习算法. 在分类问题 ...

  8. logit回归模型假设_常见logistic回归模型有哪几种?

    日常统计分析中,较为常见的logistic回归分析主要包括三种形式,分别是二项logistic回归,无序多分类logistic回归和有序多分类logistic回归. 这三种统计方法,在SPSS统计软件 ...

  9. logit回归模型_详解 Logit/Probit 模型中的 completely determined 问题

    NEW!连享会·推文专辑: Stata资源 | 数据处理 | Stata绘图 | Stata程序 结果输出 | 回归分析 | 时间序列 | 面板数据 | 离散数据 交乘调节 | DID | RDD   ...

最新文章

  1. 如何运用NLP向个性类型客户介绍产品
  2. 点融产品 VP 赵征宇:增长是一个探索人性的过程
  3. php键名改为0.1.2.3,揭秘 0.1 + 0.2 != 0.3(php 请自觉点用round)
  4. Keras在mnist上的CNN实践,并且自定义loss函数曲线图
  5. springboot整合redis修改分区
  6. 我必须要吐槽,你们的数据管理都是错的,这才是规划和产出
  7. openstack之创建虚拟机
  8. mac 允许任何源 软件安装 -- 在安全模式中没有显示
  9. php默认站点,PHP学习之Apache修改默认站点的目录
  10. OpenCV学习】矩阵运算和操作2
  11. linux shell 脚本中 字符串截取并赋值引用
  12. OpenCV由汉字生成图片(透明)----可以对抗论文查重!!!
  13. 《计算机应用基础》测试题,《计算机应用基础》测试题(一)
  14. 软件工程之软件概要设计
  15. (搬运)手机卫星通信详细科普图漫版
  16. Team Queue -uva
  17. 今天是个好日子 12月17日
  18. java中奖概率_java实现抽奖概率类
  19. win7+linux双系统安装
  20. 新的时间处理工具joda

热门文章

  1. y7000p电池固件_拯救者Y7000、Y7000P、Y9000k显卡切换了解一下
  2. 去哪编辑html5页面,h5页面 判断网页在哪打开
  3. tablayout 增加数字小标_为TabLayout添加角标的最简单方法
  4. CVPR2016:ResNet 从根本上解决深度网络退化问题
  5. 图像分割 | 训练集输入labe(mask)处理以及类别不均衡的处理-以segnet为例
  6. 霍夫变换(初始学习)
  7. 复现HITB PHP lover代码审计
  8. 使用ulimit设置文件最大打开数
  9. JVM规范阅读-instance of
  10. 关于WebApi 跨域问题的解决的方式