一、离散选择模型（Discrete Choice Model, DCM）

常见的DCM模型：二项Logit（Binary Logit）、多项Logit（Multi-nominal Logit）、广义Logit（Generalized Logit）、条件Logit（Conditional Logit）、层式Logit（Nested Logit）、有序Logit/Probit（Ordered Logit/Probit）、混合Logit（Mixed Logit）等

拟合离散选择模型的软件：SAS、NLOGIT、Stata、Python、R、Matlab等

Daniel McFadden丹尼尔·麦克法登：在离散选择模型研究方面的贡献而被授予2000年的诺贝尔经济学奖

线性回归模型是分析相关关系最常用模型，因变量为离散时进行拟合时会违背线性回归模型的一些假设条件，

区别主要在于：

线性模型中的因变量是连续的，而离散模型（如logit）中的因变量是离散的；
线性模型描述了自变量和因变量之间的线性关系，而Logit模型描述的是非线性关系。

1.1用途

离散选择行为即因变量不是一个连续的变量：（品牌选择、定性影响因素分析（天气条件等）、出行方式选择）

1.2基本要素

一个基本的选择过程（Choice Process）包含一下4个要素：

1.2.1：决策者（Decision Maker）即做出选择行为的主体

决策者自身的属性会对选择的结果产生影响

调查、研究用户/消费者的选择行为时需要收集受访者的个人社会经济状况的资料

年龄、性别、收入、工作类型

1.2.2：备选方案集（Alternatives）通常会有多个方案供决策者选择（出行方式选择：飞机或高

铁）

通用方案集（Universal Choice Set）

可行方案集（Feasible Choice Set）

实际考虑的方案集（Consideration Choice Set）

1.2.3：各个方案的属性（Attributes of Alternatives）备选方案自身属性中影响决策者的因素称之为一个属性（Attributes），通常会建立指标体系

不同的方案属性描述了各个方案在不同的维度上可以提供给人们的效用（Utility）

“效用最大化”是最为常见的决策准则

方案在不同属性上的差异，决策者提供一个选择的空间

1.2.4：决策准则（Decision Rules）不同的决策者在做出方案选择时的行为准则存在差异。

优势准则（Dominance Rule）	不同维度上分别存在优势难以选择
下限准则（Satisfactory Rule）	利用“下限准则”进行决策时可能最终会产生多个选择结果
多重排序准则（Lexicographic Rule）	属性按重要程度从高到低进行排列，不断循环删选
效用最大化准则（Utility Maximization Rule）	不同属性建立权重（每个方案属性类别、权属性重一样，属性值不同）

1.3离散选择模型的类型

选择是可以根据需要，符合条件即可

备选方案的数量	二项选择模型（Binomial choice models）	备选方案只有两个选项：是、否
备选方案的数量	多项选择模型（Multinomial choice models）	备选方案数量为3个或3个以上
备选方案的特征	无序离散选择模型（Unordered DCM）	存在等级程度能见度：极好、好、一般、较差
备选方案的特征	有序离散选择模型（Ordered DCM）	无等级程度

1.4随机效用变量 ε

Probit模型	随机效用变量 ε 服从正态分布
Logit模型	随机效用变量 ε 服从Logistic分布
二项Logit模型	服从Gumbel分布

1.5数据计量尺度

Nominal Scale分类数据（名义尺度、名义数据、定类数据等）	分类数据只对数据进行分类处理，但是没有序次关系
Ordinal Scale，定序数据（顺序尺度、序列数据、等级数据等）	序数据比分类数据高一个层次，它不仅对数据进行分类，而且还排序定序数据之间可以比较大小；但是，加减乘除等运算不能运用在定序数据中
Interval Scale，定距数据（间隔尺度、定距尺度、等距数据等）	定距数据比定序数据又高一个层次，数据的差具有意义定距数据表示具有相同差异的有序单位，比如年份等除了能比较大小外，定距数据之间可以相加、相减，其结果仍然有意义定距数据可以加减，但不能乘除或计算比值，许多描述性和推理性统计学不能应用于定距数 (定距数据没有一个“真零”，定距数据中的“零值”通常都是人为规定的——公元元年是以相传的耶稣基督诞生年作为元年算起。）
Ratio Scale，定比数据（比例尺度、比例数据、等比数据等）	定比数据是最高层次的测量尺度，既有测量单位，也有绝对零点。定比数据中的“0”就是表示“没有”

Multi-nominal Logit——多类别Logit模型

Ordered Logit——有序Logit模型

二项Logit（Binary Logit）——Bi-nomial Distribution模型

二、Logit模型

1，关于概率

概率（Probability）	p（A）=A事件发生的次数/所有事情发生的次数	掷骰子为例。掷出点数为6的概率为1/6	p（A）在0-1之间
几率、可能性、胜率（Odds）	Odds=A事件发生的次数/非A事件发生的次数	掷骰子为例。掷出点数为6的Odds为1/5	Odds理论下假设甲乙二人掷骰子对赌；若甲出1块钱赌掷到6点，乙需要投注5块钱才能保证公平。
Odds和概率(P)之间关系	Odds=p/(1-p) Odds=A事件发生的概率/非A事件发生的概率		概率等于0.5的时候，Odds等于1
优势比Odds Ratio	相对优势的概念

2，Logit理解

Logit =Odds的对数	logit=log（it）=log（odds） =log（p/(1-p)）
	对Odds取自然对数(，就可以将概率P从范围（0,1）映射到 $\left (- \infty ,+\infty \right )$
	取对数后函数没有上下限，符合回归模型的假设，可以采用线性回归建模

	Logit 模型的回归系数 $\beta _{1},\beta _{2},...,\beta _{n}$ 如果 $x_{1}$ 是连续变量， $x_{1}$ 增加一个值，logit增加 $\beta _{1}$ ，odd变为原来的 $e^{^{\beta _{1}}}$ 倍

3、二项Logit模型（Binary Logit）

基于基于效用最大化准则：决策者 n 选择方案 i 和 j ，对应的效用为Ui和Uj，如果 $U_{i}>U_{j},$ ，选取ui 即决策者n选择i的概率等价于 $U_{i}>U_{j},$ 发生的概率 $P_{n}(i)=P(u_{in}>u_{jn}) =P(V_{in}+ \varepsilon _{in}>V_{jn}+ \varepsilon _{jn}) =P( \varepsilon _{jn}< \varepsilon _{in}+V_{in}- \varepsilon _{jn})$ $V_{in},V_{jn}$ 是效用，可获得,确定的 $\varepsilon _{in},\varepsilon _{jn}$ 是随即项，不可获得，不确定的
影响决策的是方案之间效用的相对差值
二项Logit模型中，决策者 n 选择方案 i 的概率可以表示为
随机效用变量 ε 服从Gumbel分布	Gumbel分布是一种极值型分布，常被用于极端事件的估计和预测，如地震、洪水等极端自然灾害现象的预测
	Gumbel分布不是对称的，其分布呈现一定的偏态
如果随机变量 εin 和εjn 均服从Gumbel分布，且 εin 与εjn 之间相互独立，则 εin-εjn 服从Logistic分布

4，多项Logit模型， Multi-nominal Logit

基于基于效用最大化准则：决策者 n 有k个选择方案，对应的效用为 $U_{kn}$ ，

即决策者n选择i的概率等价于 $U_{in}>U_{kn}.k=1,2,...,k$ 发生的概率

$P_{n}(i)=P(u_{in}>u_{1n}) \bigcap P(u_{in}>u_{2n}) \bigcap .. \bigcap P(u_{in}>u_{kn})$

记为：

$P_{n}(i)=P(U_{in}>U_{Kn})$

$P_{n}(i)=P(U_{in}>U_{kn})= P(V_{in}+ \varepsilon _{in}>V_{kn}+ \varepsilon _{kn}) =P( \varepsilon _{kn}< \varepsilon _{in}+V_{in}- \varepsilon _{kn})$

注：此时为一组不等式，表示K组比较同时发生的概率

注意事件之间相互独立：即为多项Logit模型的IIA特性，Independent of Irrelevant Alternative，

用X表示决策主体n的相关属性： $V_{in}=\beta _{0}+\beta _{1} x_{1n}+...+\beta _{n} x_{pn}$

多项Logit模型常见形式

IIA特性：无关方案的独立性：随机项的i.i.d（ independent identically distributied，独立同分布）

在MNL模型中

任意两个方案被选中的概率之比只和方案本身的属性有关，属性效用分为明确部分+随机部分

假定所有方案的随机项 $\varepsilon$ 相互独立且均服从相同的Gumbel分布

由于随机项中经常包含未观测到的指标

常常导致随机项之间并不独立，存在一定关联

典型案例“红/蓝公交悖论”

IIA假设作为强假设，实际方案中效用往往随机项并不独立，利用MNL模型导致与实际存在偏差

hausman specification test：豪斯曼检验

比较所有样本基础上获得的参数估计值与剔除所选方案的样本后得到的参数估计值：没有显著差别，则通过假设，IIA假设成立

没有通过，需要使用其他模型（嵌入式logit，混合logit）

数据处理
个人属性——
方案属性

2.4 嵌入式logit（Nested Logit ）

参考：

1，DCM笔记 - 知乎 (zhihu.com)https://www.zhihu.com/column/logit

Logit模型和Logistic模型相关推荐

用java建立多项式logit模型_请问logit模型和logistic模型是不是一样的？
序言在现有的统计教科书中,一般都有logistic回归模型的内容.然而,在这些教科书中,logistic回归往往不是作为中心内容,缺乏关于这种方法的详尽讨论.有关专著在国外很少,国内尚无.国外的一些 ...
Logit模型和Logistic模型的区别
别人已经写好了,保存一下! https://zhuanlan.zhihu.com/p/30659982
ologit模型与logit_Logit模型和Logistic模型有什么区别？
之前在<Logit究竟是个啥?--离散选择模型之三>一文中提过,Logit应该理解成Log-it,这里的it指的是Odds("胜率",等于P/1-P).一个Logit变 ...
机器学习笔记——3 logistic模型和probit模型基本原理，从哲学视角谈谈统一二者的潜变量模型
logistic模型和probit模型基本原理,从哲学视角谈谈统一二者的潜变量模型监督学习的两种类别在监督学习中,根据标签值的类型可以将其分为两类: 一类是定量数据,其分为计量型和计数型,这种可以 ...
情感分析的描述、基于词袋模型和word2vec模型的情感分析实现
情感分析的描述.基于词袋模型和word2vec模型的情感分析实现以购物评论为例: # 读入原始数据集 import pandas as pddfpos = pd.read_excel('../dat ...
R语言广义加性模型（GAMs：Generalized Additive Model）建模：数据加载、划分数据、并分别构建线性回归模型和广义线性加性模型GAMs、并比较线性模型和GAMs模型的性能
R语言广义加性模型(GAMs:Generalized Additive Model)建模:数据加载.划分数据.并分别构建线性回归模型和广义线性加性模型GAMs.并比较线性模型和GAMs模型的性能目录
utxo模型_什么是UTXO？简析账户/余额模型和UTXO模型
在比特币社区内,有一种这样的说法:其实并没有比特币,有的只是UTXO.还有一种说法是:如果理解了UTXO,你就理解了比特币. 这两种说法虽然都有不同程度的夸张,但足以体现UTXO之于比特币的重要性.既 ...
【word2vec】篇三：基于Negative Sampling 的 CBOW 模型和 Skip-gram 模型
系列文章: [word2vec]篇一:理解词向量.CBOW与Skip-Gram等知识 [word2vec]篇二:基于Hierarchical Softmax的 CBOW 模型和 Skip-gram 模 ...
【word2vec】篇二：基于Hierarchical Softmax的 CBOW 模型和 Skip-gram 模型
文章目录 CBOW 模型基本结构目标函数梯度计算 Skip-gram 模型基本结构梯度计算优缺点分析系列文章: [word2vec]篇一:理解词向量.CBOW与Skip-Gram等知识 ...
基于 OData 模型和 JSON 模型的 SAP UI5 表格控件行项目的添加和删除实现
这是 Jerry 2021 年的第 62 篇文章,也是汪子熙公众号总共第 339 篇原创文章. 龟虽寿曹操神龟虽寿,犹有竟时:腾蛇乘雾,终为土灰.老骥伏枥,志在千里:烈士暮年,壮心不已.盈缩之期,不但 ...

Logit模型和Logistic模型