二值logit模型的适用条件_你们要的二项Logit模型在这里—

前言：本文主要介绍如何以效用最大化理论为基础，推导出二项 Logit(Binary Logit)模型。

本文为系列离散选择模型(Discrete Choice Model, DCM)系列文章的第8篇。

温馨提示：阅读本文之前，请准备好纸、笔、以及小板凳。自己动手推导一遍有助于理解。

Probit模型的建模过程回顾

在《效用最大化准则：离散选择模型的核心(Probit篇)——离散选择模型之七》一文中，我们基于效用最大化理论给出了二项Probit模型的推导过程。简单回顾一下建模的过程：假设对于决策主体n面临两个备选方案i和j

方案i的效用

可以表示为可以观测得到的、确定性的部分

和一个随机项

之和：

(1)类似地，方案j的效用

可以表示为：

(2)对于决策主体 n 而言，若方案 i 的效用

高于方案 j 的效用

，则 n 选取方案 i 。也就是说，n 选择方案 i 的概率

等价于事件

发生的概率：

(3)如果令

和

服从均值为0、方差为

和

的正态分布，则

服从均值为0、方差为

的正态分布。在此基础上，便可以推导出Probit模型的表达形式如下面的(4)式所示。其中，

表示标准正态分布的累积分布函数。

(4)

Probit模型的特点

从建模的角度来说，Probit模型假设随机项

和

服从正态分布，这具有一定的合理的——也是其优点；但是Probit模型没有闭合解——每次算

的值的时候都需要求积分，这就给实际应用造成了一定的不便。

为解决这一问题，研究者提出，若假设随机项

和

服从Gumbel分布(而非上面提到的正态分布)，就可以得到一个性质和Probit模型类型、但解析更为方便的模型——这就是二项Logit模型。Fig.1. 标准正态分布的累积分布函数

Gumbel分布

Gumbel分布是一种极值型分布，常被用于极端事件的估计和预测。比如某水文站，每天观测某条河道的水位，连续观测了50年；如果单独对河道每年的最高水位进行建模，就可以考虑用Gumbel分布。除此之位，Gumbel分布还被应用于地震、洪水等极端自然灾害现象的预测。

记参数为的

、

的Gumbel分布为

，其概率密度函数(PDF)可以表示为：

(5)

下图2显示了当参数

和

取不同的值时，

所对应的概率密度函数的图形。从图中可以看出，

是位置系数(Gumbel分布的众数是

)，

是尺度系数——与Gumbel分布的离散性有关(Gumbel分布的方差是

)。Fig.2. Gumbel分布

、

时所对应的Gumbel分布称之为标准Gumbel分布；

的概率分布为：

(6)

其所对应的累积分布函数(CDF)为：

(7)

从图3中可以看出：标准Gumbel分布与标准正态分布的形状大体上接近，但Gumbel分布不是对称的，其分布呈现一定的偏态。另外，Gumbel分布尾巴要比标准正态分布更肥一点。Fig.3. 标准Gumbel分布和标准正态分布

Logistic分布

在推导二项Logit模型的表达式之前，再介绍另外一个分布：Logistic分布。

随机变量

服从Logistic分布是指

具有下列分布函数和密度函数：

(8)

(9)

其中，

为位置参数，

为形状参数。为方便起见，我们将参数为

、

的Logistic分布记为

。

下图4给出了参数

和

取不同的值时所对应的Logistic分布的概率密度函数(PDF)。从图中可以看出，曲线在

附近增长速度比较快，两端增长速度比较慢。形状参数

的值越小，曲线在

附近增长得越快。当

、

时，称为标准Logistic分布；其所对应的分布函数和密度函数分别为：

(10)

(11)Fig.4. Logistic分布

Logit模型的推导

先给出一条重要性质：如果随机变量

和

均服从Gumbel分布，且

、

之间相互独立，则

服从Logistic分布。亦即，若：

、

之间相互独立

则：

根据上面的(3)式我们知道决策主体 n 选择方案 i 的概率

等价于：

在Logit模型中，我们就是假设随机效用部分

和

均服从Gumbel分布，且

、

之间相互独立。根据上面的性质，

便服从参数为0、1的Logistic分布。于是上面的式子可以进一步改写成：

(12)

分子分母同时乘以

可得：

(13)

式中

、

表示方案i、j的效用中的确定性的部分。前面提到过，效用的确定性部分可以表示成多个自变量的线性组合，即：

最终，在二项Logit模型中，决策者 n 选择方案 i 的概率可以表示为：

(14)

(14)式即为二项Logit模型的表达式。图5给出了仅有一个自变量时的二项Logit和二项Probit的图像：Fig.5. 二项Logit和二项Probit模型对比

【本篇完】

专栏文章列表(动态更新中...)

离散选择模型基础：

二项Logit/Probit：

多项Logit(MNL)：

统计学相关：

关注【DCM笔记】公众号，私信作者获取相关文章中的练习数据和代码：

二值logit模型的适用条件_你们要的二项Logit模型在这里——离散选择模型之八...相关推荐

logit回归模型_你们要的二项Logit模型在这里——离散选择模型之八
前言:本文主要介绍如何以效用最大化理论为基础,推导出二项 Logit(Binary Logit)模型. 本文为系列离散选择模型(Discrete Choice Model, DCM)系列文章的第8篇. ...
非期望产出的sbm模型_线性模型 vs. Logistic模型——离散选择模型之二
前言:为什么因变量是分类变量的时候,我们会选择Logistic模型.而非最常见的线性回归模型?或者,换个说法:线性回归模型的劣势是什么?Logistic模型的优势又是什么?--针对这些问题,本文为您详 ...
logit模型应用实例_最大似然估计（上）——离散选择模型之十
原创文章,如需转载请联系作者! 希望这篇文章能讲清楚什么是"最大似然估计". 通过前文的推理,我们已经得到了二项Probit和二项Logit的模型表达式.在二项Probit模型中, ...
效用最大化准则：离散选择模型的核心（二项Logit模型）——离散选择模型之九
效用最大化准则:离散选择模型的核心(二项Logit模型)--离散选择模型之九 (qq.com)
正确打开/解读Logit模型系数的方式——离散选择模型之四
正确打开/解读Logit模型系数的方式--离散选择模型之四 - 知乎 (zhihu.com)
离散选择模型（DCM）和深度神经网络（DNN）结合
前言:这篇文章是深度学习和传统离散选择模型的融合. 机器学习在交通运输领域中越来越多地被应用,但 DCM(discrete choice model, 离散选择模型)和 DNN(deep neural ...
离散选择模型（Discrete Choice model）
目录 1. 什么是离散选择模型? 1.1 基本概念 1.2 效用 1.3 离散选择模型的类型 2. 线性概率模型 3. Probit模型 3.1 效用最大化准则 4. Logit模型 4.1 Gumb ...
python拟合离散数据_Logit模型拟合实战案例（Python）——离散选择模型之六
前言:本文详细介绍如何在Python中拟合Logit模型,包括数据准备.哑变量的处理.参数拟合结果解读等内容. 本文为系列离散选择模型(Discrete Choice Model, DCM)系列文章的 ...
离散选择模型之Gumbel分布
文章目录 Gumbel 分布 matlab 产生服从极值分布的相关函数 I类型极值分布(Gumbel分布) 广义极值分布附录----[数据介绍](https://www.sohu.com/a/303 ...

二值logit模型的适用条件_你们要的二项Logit模型在这里——离散选择模型之八...

二值logit模型的适用条件_你们要的二项Logit模型在这里——离散选择模型之八...相关推荐

最新文章

热门文章