前言:本文主要介绍如何以效用最大化理论为基础,推导出二项 Logit(Binary Logit)模型。

本文为系列离散选择模型(Discrete Choice Model, DCM)系列文章的第8篇。


温馨提示:阅读本文之前,请准备好纸、笔、以及小板凳。自己动手推导一遍有助于理解。

Probit模型的建模过程回顾

在《效用最大化准则:离散选择模型的核心(Probit篇)——离散选择模型之七》一文中,我们基于效用最大化理论给出了二项Probit模型的推导过程。简单回顾一下建模的过程:

  • 假设对于决策主体n面临两个备选方案i和j
  • 方案i的效用
    可以表示为可以观测得到的、确定性的部分
    和一个随机项
    之和:
(1)
  • 类似地,方案j的效用

    可以表示为:
(2)
  • 对于决策主体 n 而言,若方案 i 的效用

    高于方案 j 的效用
    ,则 n 选取方案 i 。也就是说,n 选择方案 i 的概率
    等价于事件
    发生的概率:
(3)
  • 如果令

    服从均值为0、方差为
    的正态分布,则
    服从均值为0、方差为
    的正态分布。在此基础上,便可以推导出Probit模型的表达形式如下面的(4)式所示。其中,
    表示标准正态分布的累积分布函数。
(4)

Probit模型的特点

从建模的角度来说,Probit模型假设随机项

服从正态分布,这具有一定的合理的——也是其优点;

但是Probit模型没有闭合解——每次算

的值的时候都需要求积分,这就给实际应用造成了一定的不便。

为解决这一问题,研究者提出,若假设随机项

服从Gumbel分布(而非上面提到的正态分布),就可以得到一个性质和Probit模型类型、但解析更为方便的模型——这就是二项Logit模型。
Fig.1. 标准正态分布的累积分布函数

Gumbel分布

Gumbel分布是一种极值型分布,常被用于极端事件的估计和预测。比如某水文站,每天观测某条河道的水位,连续观测了50年;如果单独对河道每年的最高水位进行建模,就可以考虑用Gumbel分布。除此之位,Gumbel分布还被应用于地震、洪水等极端自然灾害现象的预测。

记参数为的

的Gumbel分布为
,其概率密度函数(PDF)可以表示为:
(5)

下图2显示了当参数

取不同的值时,
所对应的概率密度函数的图形。从图中可以看出,
是位置系数(Gumbel分布的众数是
),
是尺度系数——与Gumbel分布的离散性有关(Gumbel分布的方差是
)。
Fig.2. Gumbel分布
时所对应的Gumbel分布称之为标准Gumbel分布;
的概率分布为:
(6)

其所对应的累积分布函数(CDF)为:

(7)

从图3中可以看出:标准Gumbel分布与标准正态分布的形状大体上接近,但Gumbel分布不是对称的,其分布呈现一定的偏态。另外,Gumbel分布尾巴要比标准正态分布更肥一点。

Fig.3. 标准Gumbel分布和标准正态分布

Logistic分布

在推导二项Logit模型的表达式之前,再介绍另外一个分布:Logistic分布。

随机变量

服从Logistic分布是指
具有下列分布函数和密度函数:
(8)
(9)

其中,

为位置参数,
为形状参数。为方便起见,我们将参数为
的Logistic分布记为

下图4给出了参数

取不同的值时所对应的Logistic分布的概率密度函数(PDF)。从图中可以看出,曲线在
附近增长速度比较快,两端增长速度比较慢。形状参数
的值越小,曲线在
附近增长得越快。当
时,称为标准Logistic分布;其所对应的分布函数和密度函数分别为:
(10)
(11)
Fig.4. Logistic分布

Logit模型的推导

先给出一条重要性质:如果随机变量

均服从Gumbel分布,且
之间相互独立,则
服从Logistic分布。

亦即,若:

  • 之间相互独立

则:

详细的证明过程请参见《从Gumbel分布到Logistic分布——离散选择模型之九》。

根据上面的(3)式我们知道决策主体 n 选择方案 i 的概率

等价于:

在Logit模型中,我们就是假设随机效用部分

均服从Gumbel分布,且
之间相互独立。根据上面的性质,
便服从参数为0、1的Logistic分布。于是上面的式子可以进一步改写成:
(12)

分子分母同时乘以

可得:
(13)

式中

表示方案i、j的效用中的确定性的部分。前面提到过,效用的确定性部分可以表示成多个自变量的线性组合,即:

最终,在二项Logit模型中,决策者 n 选择方案 i 的概率可以表示为:

(14)

(14)式即为二项Logit模型的表达式。图5给出了仅有一个自变量时的二项Logit和二项Probit的图像:

Fig.5. 二项Logit和二项Probit模型对比

【本篇完】


专栏文章列表(动态更新中...)

离散选择模型基础:

  • 离散选择模型(Discrete Choice Model)简介
  • 线性模型 vs. Logistic模型
  • Logit究竟是个啥?
  • Odds 和 Odds Ratio 的区别
  • 正确打开/解读Logit模型系数的方式
  • Logit模型拟合实战案例(SAS)
  • Logit模型拟合实战案例(Python)

二项Logit/Probit:

  • 效用最大化准则:离散选择模型的核心(Probit模型上篇)
  • 效用最大化准则:离散选择模型的核心(Probit模型下篇)
  • 效用最大化准则:离散选择模型的核心(二项Logit模型)
  • 从Gumbel分布到Logistic分布

多项Logit(MNL):

  • 效用最大化准则:多项Logit模型(Multinomial Logit, MNL)
  • 多项Logit模型(MNL)拟合实战案例(SAS篇)
  • MNL的IIA特性与“红公交/蓝公交悖论”(上篇)
  • MNL的IIA特性与“红公交/蓝公交悖论”(下篇)
  • 如何将决策者的属性和方案属性同时放到MNL模型中?
  • Logit模型中的个人属性、方案属性数据处理案例
  • 为什么条件Logit模型中没有常数项,以及,你的女神会不会不喜欢你?
  • Logit模型中的ASC(Alternative-Specific Constant)是指什么?

统计学相关:

  • 最大似然估计(上)
  • 最大似然估计(下)
  • 模型中存在共线性问题,该怎么破?

关注【DCM笔记】公众号,私信作者获取相关文章中的 练习数据 和 代码:

logit回归模型_你们要的二项Logit模型在这里——离散选择模型之八相关推荐

  1. 二值logit模型的适用条件_你们要的二项Logit模型在这里——离散选择模型之八...

    前言:本文主要介绍如何以效用最大化理论为基础,推导出二项 Logit(Binary Logit)模型. 本文为系列离散选择模型(Discrete Choice Model, DCM)系列文章的第8篇. ...

  2. 非期望产出的sbm模型_线性模型 vs. Logistic模型——离散选择模型之二

    前言:为什么因变量是分类变量的时候,我们会选择Logistic模型.而非最常见的线性回归模型?或者,换个说法:线性回归模型的劣势是什么?Logistic模型的优势又是什么?--针对这些问题,本文为您详 ...

  3. logit模型应用实例_最大似然估计(上)——离散选择模型之十

    原创文章,如需转载请联系作者! 希望这篇文章能讲清楚什么是"最大似然估计". 通过前文的推理,我们已经得到了二项Probit和二项Logit的模型表达式.在二项Probit模型中, ...

  4. 离散选择模型(Discrete Choice model)

    目录 1. 什么是离散选择模型? 1.1 基本概念 1.2 效用 1.3 离散选择模型的类型 2. 线性概率模型 3. Probit模型 3.1 效用最大化准则 4. Logit模型 4.1 Gumb ...

  5. MNL——多项Logit模型学习笔记(三)二项Logit模型、Gumble分布以及Logistic分布

    上一节最后一部分,介绍了Provit模型,从建模的角度来说,Probit模型假设随机项服从正态分布,这是具有一定的合理性的--也是其优点:但是Probit模型没有闭合解--每次算P(n)i 的值的时候 ...

  6. 效用最大化准则:离散选择模型的核心(二项Logit模型)——离散选择模型之九

    效用最大化准则:离散选择模型的核心(二项Logit模型)--离散选择模型之九 (qq.com)

  7. 正确打开/解读Logit模型系数的方式——离散选择模型之四

    正确打开/解读Logit模型系数的方式--离散选择模型之四 - 知乎 (zhihu.com)

  8. 离散选择模型(DCM)和深度神经网络(DNN)结合

    前言:这篇文章是深度学习和传统离散选择模型的融合. 机器学习在交通运输领域中越来越多地被应用,但 DCM(discrete choice model, 离散选择模型)和 DNN(deep neural ...

  9. python拟合离散数据_Logit模型拟合实战案例(Python)——离散选择模型之六

    前言:本文详细介绍如何在Python中拟合Logit模型,包括数据准备.哑变量的处理.参数拟合结果解读等内容. 本文为系列离散选择模型(Discrete Choice Model, DCM)系列文章的 ...

最新文章

  1. 傅里叶变换的Matlab代码
  2. linux nginx 安装stream,Centos7下Nginx简单搭建与stream模块简单配置
  3. Kotlin学习笔记——安装配置kotlin
  4. Netty权威指南之伪异步I/O编程
  5. pythonexcel怎么合并_Python把多个Excel合并成一个Excel
  6. 中国十个主要城市10-18年的统计年鉴
  7. Win7上USB转串口芯片ch341驱动安装方法
  8. 第七课GUI练练表面功夫
  9. java注册功能实现
  10. 腾讯文档快捷键在哪里
  11. Qt 之 Concurrent Run
  12. 学习笔记-DQPSK系统的调制与解调
  13. 硬盘柱面损坏怎么办_硬盘有坏道怎么修复?使用DiskGenius修复硬盘逻辑坏道的方法...
  14. EasyX 窗口如何最大化,以及拖拽调整大小
  15. 计算机c盘哪些可以清理,怎么清理C盘?不知道哪些可以删除?
  16. Java Scanner用法详解
  17. 从escrow.com购买域名的经验
  18. 谈谈英语学习(5):听力
  19. 通过股票代码识别所属板块(20190730)
  20. 小白一键系统重装系统GHO文件如何下载教程

热门文章

  1. cmaq安装教程linux,CMAQ编译和安装
  2. Altium Designer挖空开槽填坑之board cutout
  3. c/c++函数参数的缺省值使用要点:
  4. 《dota2》地精修补匠tinker路人攻略
  5. python网易云音乐下载,可选择歌曲,下载路径
  6. BestCoder Round #86 HDU 5804,HDU 5805,HDU 5806,HDU 5807
  7. docker 分析cpu占用过高
  8. 佩尔方程(超详细推导+例题讲解) 每日一遍,算法再见!
  9. 2020南京航空航天大学计算机科学与技术学院软件工程复试/面试经验分享
  10. cpu占用过高解决方案实践