二值logit模型的适用条件_你们要的二项Logit模型在这里——离散选择模型之八...
前言:本文主要介绍如何以效用最大化理论为基础,推导出二项 Logit(Binary Logit)模型。
本文为系列离散选择模型(Discrete Choice Model, DCM)系列文章的第8篇。
温馨提示:阅读本文之前,请准备好纸、笔、以及小板凳。自己动手推导一遍有助于理解。
Probit模型的建模过程回顾
在《效用最大化准则:离散选择模型的核心(Probit篇)——离散选择模型之七》一文中,我们基于效用最大化理论给出了二项Probit模型的推导过程。简单回顾一下建模的过程:假设对于决策主体n面临两个备选方案i和j
方案i的效用
可以表示为可以观测得到的、确定性的部分
和一个随机项
之和:
(1)类似地,方案j的效用
可以表示为:
(2)对于决策主体 n 而言,若方案 i 的效用
高于方案 j 的效用
,则 n 选取方案 i 。也就是说,n 选择方案 i 的概率
等价于事件
发生的概率:
(3)如果令
和
服从均值为0、方差为
和
的正态分布,则
服从均值为0、方差为
的正态分布。在此基础上,便可以推导出Probit模型的表达形式如下面的(4)式所示。其中,
表示标准正态分布的累积分布函数。
(4)
Probit模型的特点
从建模的角度来说,Probit模型假设随机项
和
服从正态分布,这具有一定的合理的——也是其优点;但是Probit模型没有闭合解——每次算
的值的时候都需要求积分,这就给实际应用造成了一定的不便。
为解决这一问题,研究者提出,若假设随机项
和
服从Gumbel分布(而非上面提到的正态分布),就可以得到一个性质和Probit模型类型、但解析更为方便的模型——这就是二项Logit模型。Fig.1. 标准正态分布的累积分布函数
Gumbel分布
Gumbel分布是一种极值型分布,常被用于极端事件的估计和预测。比如某水文站,每天观测某条河道的水位,连续观测了50年;如果单独对河道每年的最高水位进行建模,就可以考虑用Gumbel分布。除此之位,Gumbel分布还被应用于地震、洪水等极端自然灾害现象的预测。
记参数为的
、
的Gumbel分布为
,其概率密度函数(PDF)可以表示为:
(5)
下图2显示了当参数
和
取不同的值时,
所对应的概率密度函数的图形。从图中可以看出,
是位置系数(Gumbel分布的众数是
),
是尺度系数——与Gumbel分布的离散性有关(Gumbel分布的方差是
)。Fig.2. Gumbel分布
、
时所对应的Gumbel分布称之为标准Gumbel分布;
的概率分布为:
(6)
其所对应的累积分布函数(CDF)为:
(7)
从图3中可以看出:标准Gumbel分布与标准正态分布的形状大体上接近,但Gumbel分布不是对称的,其分布呈现一定的偏态。另外,Gumbel分布尾巴要比标准正态分布更肥一点。Fig.3. 标准Gumbel分布和标准正态分布
Logistic分布
在推导二项Logit模型的表达式之前,再介绍另外一个分布:Logistic分布。
随机变量
服从Logistic分布是指
具有下列分布函数和密度函数:
(8)
(9)
其中,
为位置参数,
为形状参数。为方便起见,我们将参数为
、
的Logistic分布记为
。
下图4给出了参数
和
取不同的值时所对应的Logistic分布的概率密度函数(PDF)。从图中可以看出,曲线在
附近增长速度比较快,两端增长速度比较慢。形状参数
的值越小,曲线在
附近增长得越快。当
、
时,称为标准Logistic分布;其所对应的分布函数和密度函数分别为:
(10)
(11)Fig.4. Logistic分布
Logit模型的推导
先给出一条重要性质:如果随机变量
和
均服从Gumbel分布,且
、
之间相互独立,则
服从Logistic分布。亦即,若:
、
之间相互独立
则:
根据上面的(3)式我们知道决策主体 n 选择方案 i 的概率
等价于:
在Logit模型中,我们就是假设随机效用部分
和
均服从Gumbel分布,且
、
之间相互独立。根据上面的性质,
便服从参数为0、1的Logistic分布。于是上面的式子可以进一步改写成:
(12)
分子分母同时乘以
可得:
(13)
式中
、
表示方案i、j的效用中的确定性的部分。前面提到过,效用的确定性部分可以表示成多个自变量的线性组合,即:
最终,在二项Logit模型中,决策者 n 选择方案 i 的概率可以表示为:
(14)
(14)式即为二项Logit模型的表达式。图5给出了仅有一个自变量时的二项Logit和二项Probit的图像:Fig.5. 二项Logit和二项Probit模型对比
【本篇完】
专栏文章列表(动态更新中...)
离散选择模型基础:
二项Logit/Probit:
多项Logit(MNL):
统计学相关:
关注【DCM笔记】公众号,私信作者获取相关文章中的 练习数据 和 代码:
二值logit模型的适用条件_你们要的二项Logit模型在这里——离散选择模型之八...相关推荐
- logit回归模型_你们要的二项Logit模型在这里——离散选择模型之八
前言:本文主要介绍如何以效用最大化理论为基础,推导出二项 Logit(Binary Logit)模型. 本文为系列离散选择模型(Discrete Choice Model, DCM)系列文章的第8篇. ...
- 非期望产出的sbm模型_线性模型 vs. Logistic模型——离散选择模型之二
前言:为什么因变量是分类变量的时候,我们会选择Logistic模型.而非最常见的线性回归模型?或者,换个说法:线性回归模型的劣势是什么?Logistic模型的优势又是什么?--针对这些问题,本文为您详 ...
- logit模型应用实例_最大似然估计(上)——离散选择模型之十
原创文章,如需转载请联系作者! 希望这篇文章能讲清楚什么是"最大似然估计". 通过前文的推理,我们已经得到了二项Probit和二项Logit的模型表达式.在二项Probit模型中, ...
- 效用最大化准则:离散选择模型的核心(二项Logit模型)——离散选择模型之九
效用最大化准则:离散选择模型的核心(二项Logit模型)--离散选择模型之九 (qq.com)
- 正确打开/解读Logit模型系数的方式——离散选择模型之四
正确打开/解读Logit模型系数的方式--离散选择模型之四 - 知乎 (zhihu.com)
- 离散选择模型(DCM)和深度神经网络(DNN)结合
前言:这篇文章是深度学习和传统离散选择模型的融合. 机器学习在交通运输领域中越来越多地被应用,但 DCM(discrete choice model, 离散选择模型)和 DNN(deep neural ...
- 离散选择模型(Discrete Choice model)
目录 1. 什么是离散选择模型? 1.1 基本概念 1.2 效用 1.3 离散选择模型的类型 2. 线性概率模型 3. Probit模型 3.1 效用最大化准则 4. Logit模型 4.1 Gumb ...
- python拟合离散数据_Logit模型拟合实战案例(Python)——离散选择模型之六
前言:本文详细介绍如何在Python中拟合Logit模型,包括数据准备.哑变量的处理.参数拟合结果解读等内容. 本文为系列离散选择模型(Discrete Choice Model, DCM)系列文章的 ...
- 离散选择模型之Gumbel分布
文章目录 Gumbel 分布 matlab 产生服从极值分布的相关函数 I类型极值分布(Gumbel分布) 广义极值分布 附录----[数据介绍](https://www.sohu.com/a/303 ...
最新文章
- alert在asp.net中如何使用??
- 1.2.3 OSI参考模型(2)
- java thumbnails 中心点_java Thumbnails 图片处理的使用
- Python--第2次平时作业
- JVM调优 dump文件怎么生成和分析
- 制作一个大风车加载条
- 性能测试篇 :Jmeter HTTP代理服务器录制压力脚本
- Linux硬链接和符号链接(转)
- JavaScript正则表达式 1
- Win10家庭版开启远程桌面
- java新手怎么用if alse_关于java:为什么“F”+“alse”不是==“False”?
- 工作3年进阿里,取得P7职位,需要怎样的技术能力?(面试题附答案)
- 香港流行乐黄金二十年——经典歌手(音乐人)全面回顾(四)
- 如何玩转淘宝直通车?提高转化率?
- 内核驱动 (二)Linux按键驱动分析
- ios 裁剪框大小_ios 图片裁剪修改尺寸的方法总结
- python从0到1_python从0到1--9 函数
- 嵌入式Linux磁盘(硬盘、SD卡)读写性能测试
- NO.54——基于scrapy的P站爬虫
- 【转】投资从入门到精通,七本经典书籍