Logit模型和Logistic模型
一、离散选择模型(Discrete Choice Model, DCM)
常见的DCM模型:二项Logit(Binary Logit)、多项Logit(Multi-nominal Logit)、广义Logit(Generalized Logit)、条件Logit(Conditional Logit)、层式Logit(Nested Logit)、有序Logit/Probit(Ordered Logit/Probit)、混合Logit(Mixed Logit)等 |
拟合离散选择模型的软件:SAS、NLOGIT、Stata、Python、R、Matlab等 |
Daniel McFadden丹尼尔·麦克法登:在离散选择模型研究方面的贡献而被授予2000年的诺贝尔经济学奖 |
线性回归模型是分析相关关系最常用模型,因变量为离散时进行拟合时会违背线性回归模型的一些假设条件, 区别主要在于:
|
1.1用途
离散选择行为即因变量不是一个连续的变量:(品牌选择、定性影响因素分析(天气条件等)、出行方式选择)
1.2基本要素
一个基本的选择过程(Choice Process)包含一下4个要素:
1.2.1:决策者(Decision Maker)即做出选择行为的主体
决策者自身的属性会对选择的结果产生影响 |
调查、研究用户/消费者的选择行为时需要收集受访者的个人社会经济状况的资料 |
年龄、性别、收入、工作类型 |
1.2.2:备选方案集(Alternatives)通常会有多个方案供决策者选择(出行方式选择:飞机或高
铁)
通用方案集(Universal Choice Set) |
可行方案集(Feasible Choice Set) |
实际考虑的方案集(Consideration Choice Set) |
1.2.3:各个方案的属性(Attributes of Alternatives)备选方案自身属性中影响决策者的因素称之为一个属性(Attributes),通常会建立指标体系
不同的方案属性描述了各个方案在不同的维度上可以提供给人们的效用(Utility) |
“效用最大化”是最为常见的决策准则 |
方案在不同属性上的差异,决策者提供一个选择的空间 |
1.2.4:决策准则(Decision Rules)不同的决策者在做出方案选择时的行为准则存在差异。
优势准则 (Dominance Rule) |
不同维度上分别存在优势难以选择 |
下限准则 (Satisfactory Rule) |
利用“下限准则”进行决策时可能最终会产生多个选择结果 |
多重排序准则 (Lexicographic Rule) |
属性按重要程度从高到低进行排列,不断循环删选 |
效用最大化准则 (Utility Maximization Rule) |
不同属性建立权重(每个方案属性类别、权属性重一样,属性值不同) |
1.3离散选择模型的类型
选择是可以根据需要,符合条件即可
备选方案的数量 | 二项选择模型(Binomial choice models) | 备选方案只有两个选项:是、否 |
多项选择模型(Multinomial choice models) | 备选方案数量为3个或3个以上 | |
备选方案的特征 | 无序离散选择模型(Unordered DCM) |
存在等级程度 能见度:极好、好、一般、较差 |
有序离散选择模型(Ordered DCM) | 无等级程度 |
1.4随机效用变量 ε
Probit模型 | 随机效用变量 ε 服从正态分布 |
Logit模型 | 随机效用变量 ε 服从Logistic分布 |
二项Logit模型 | 服从Gumbel分布 |
1.5数据计量尺度
Nominal Scale分类数据 (名义尺度、名义数据、定类数据等) |
|
Ordinal Scale,定序数据 (顺序尺度、序列数据、等级数据等) |
|
Interval Scale,定距数据 (间隔尺度、定距尺度、等距数据等) |
|
Ratio Scale,定比数据 (比例尺度、比例数据、等比数据等) |
|
Multi-nominal Logit——多类别Logit模型
Ordered Logit——有序Logit模型
二项Logit(Binary Logit)——Bi-nomial Distribution模型
二、Logit模型
1,关于概率
概率(Probability) | p(A)=A事件发生的次数/所有事情发生的次数 | 掷骰子为例。掷出点数为6的概率为1/6 | p(A)在0-1之间 |
几率、可能性、胜率(Odds) | Odds=A事件发生的次数/非A事件发生的次数 | 掷骰子为例。掷出点数为6的Odds为1/5 | Odds理论下假设甲乙二人掷骰子对赌;若甲出1块钱赌掷到6点,乙需要投注5块钱才能保证公平。 |
Odds和概率(P)之间关系 |
Odds=p/(1-p) Odds=A事件发生的概率/非A事件发生的概率 |
概率等于0.5的时候,Odds等于1 | |
优势比Odds Ratio | 相对优势的概念 |
2,Logit理解
Logit =Odds的对数 |
logit=log(it)=log(odds) =log(p/(1-p)) |
|
对Odds取自然对数(,就可以将概率P从范围(0,1)映射到 | ||
取对数后函数没有上下限,符合回归模型的假设,可以采用线性回归建模 |
||
Logit 模型的回归系数 如果 是连续变量,增加一个值,logit增加,odd变为原来的倍 |
3、二项Logit模型(Binary Logit)
基于基于效用最大化准则:决策者 n 选择方案 i 和 j ,对应的效用为Ui和Uj,如果,选取ui
即决策者n选择i的概率等价于发生的概率 是效用,可获得,确定的 是随即项,不可获得,不确定的 |
|
影响决策的是方案之间效用的相对差值 | |
二项Logit模型中,决策者 n 选择方案 i 的概率可以表示为 | |
随机效用变量 ε 服从Gumbel分布 | Gumbel分布是一种极值型分布,常被用于极端事件的估计和预测,如地震、洪水等极端自然灾害现象的预测 |
Gumbel分布不是对称的,其分布呈现一定的偏态 | |
如果随机变量 εin 和εjn 均服从Gumbel分布,且 εin 与εjn 之间相互独立,则 εin-εjn 服从Logistic分布 |
4,多项Logit模型, Multi-nominal Logit
基于基于效用最大化准则:决策者 n 有k个选择方案,对应的效用为, 即决策者n选择i的概率等价于发生的概率 记为: 注:此时为一组不等式,表示K组比较同时发生的概率 |
|
注意事件之间相互独立:即为多项Logit模型的IIA特性,Independent of Irrelevant Alternative, | |
用X表示决策主体n的相关属性: 多项Logit模型常见形式 |
IIA特性:无关方案的独立性:随机项的i.i.d( independent identically distributied,独立同分布) | |
在MNL模型中 任意两个方案被选中的概率之比只和方案本身的属性有关,属性效用分为明确部分+随机部分 假定所有方案的随机项相互独立且均服从相同的Gumbel分布 |
由于随机项中经常包含未观测到的指标 常常导致随机项之间并不独立,存在一定关联 典型案例“红/蓝公交悖论” |
IIA假设作为强假设,实际方案中效用往往随机项并不独立,利用MNL模型导致与实际存在偏差 | |
hausman specification test:豪斯曼检验 比较所有样本基础上获得的参数估计值与剔除所选方案的样本后得到的参数估计值:没有显著差别,则通过假设,IIA假设成立 没有通过,需要使用其他模型(嵌入式logit,混合logit) |
数据处理 | |
个人属性—— | |
方案属性 |
2.4 嵌入式logit(Nested Logit )
参考:
1,DCM笔记 - 知乎 (zhihu.com)https://www.zhihu.com/column/logit
Logit模型和Logistic模型相关推荐
- 用java建立多项式logit模型_请问logit模型和logistic模型是不是一样的?
序言 在现有的统计教科书中,一般都有logistic回归模型的内容.然而,在这些教科书中,logistic回归往往不是作为中心内容,缺乏关于这种方法的详尽讨论.有关专著在国外很少,国内尚无.国外的一些 ...
- Logit模型和Logistic模型的区别
别人已经写好了,保存一下! https://zhuanlan.zhihu.com/p/30659982
- ologit模型与logit_Logit模型和Logistic模型有什么区别?
之前在<Logit究竟是个啥?--离散选择模型之三>一文中提过,Logit应该理解成Log-it,这里的it指的是Odds("胜率",等于P/1-P).一个Logit变 ...
- 机器学习笔记——3 logistic模型和probit模型基本原理,从哲学视角谈谈统一二者的潜变量模型
logistic模型和probit模型基本原理,从哲学视角谈谈统一二者的潜变量模型 监督学习的两种类别 在监督学习中,根据标签值的类型可以将其分为两类: 一类是定量数据,其分为计量型和计数型,这种可以 ...
- 情感分析的描述、基于词袋模型和word2vec模型的情感分析实现
情感分析的描述.基于词袋模型和word2vec模型的情感分析实现 以购物评论为例: # 读入原始数据集 import pandas as pddfpos = pd.read_excel('../dat ...
- R语言广义加性模型(GAMs:Generalized Additive Model)建模:数据加载、划分数据、并分别构建线性回归模型和广义线性加性模型GAMs、并比较线性模型和GAMs模型的性能
R语言广义加性模型(GAMs:Generalized Additive Model)建模:数据加载.划分数据.并分别构建线性回归模型和广义线性加性模型GAMs.并比较线性模型和GAMs模型的性能 目录
- utxo模型_什么是UTXO?简析账户/余额模型和UTXO模型
在比特币社区内,有一种这样的说法:其实并没有比特币,有的只是UTXO.还有一种说法是:如果理解了UTXO,你就理解了比特币. 这两种说法虽然都有不同程度的夸张,但足以体现UTXO之于比特币的重要性.既 ...
- 【word2vec】篇三:基于Negative Sampling 的 CBOW 模型和 Skip-gram 模型
系列文章: [word2vec]篇一:理解词向量.CBOW与Skip-Gram等知识 [word2vec]篇二:基于Hierarchical Softmax的 CBOW 模型和 Skip-gram 模 ...
- 【word2vec】篇二:基于Hierarchical Softmax的 CBOW 模型和 Skip-gram 模型
文章目录 CBOW 模型 基本结构 目标函数 梯度计算 Skip-gram 模型 基本结构 梯度计算 优缺点分析 系列文章: [word2vec]篇一:理解词向量.CBOW与Skip-Gram等知识 ...
- 基于 OData 模型和 JSON 模型的 SAP UI5 表格控件行项目的添加和删除实现
这是 Jerry 2021 年的第 62 篇文章,也是汪子熙公众号总共第 339 篇原创文章. 龟虽寿曹操神龟虽寿,犹有竟时:腾蛇乘雾,终为土灰.老骥伏枥,志在千里:烈士暮年,壮心不已.盈缩之期,不但 ...
最新文章
- Mac 技术篇-修改默认的python版本,mac最新版Python3.7.4的安装配置
- VS2012+WDK8.0搭建WDF驱动开发环境
- jQuery操作json
- Mysql(12)——inner join的用法
- 读卡距离和信号强度两方面来考虑
- oracle过滤数据,过滤数据 (Oracle Solaris Studio 12.2:性能分析器)
- office 转 pdf文件
- easyui的tree节点的获取和选中
- NLP学习—14.Pointer Generator Network(指针)及代码实现
- vue控制台报错Duplicate keys detected: 'xxxxx'. This may cause an update error.解决方案
- Cesium:添加按钮与原生按钮样式相同
- oracle怎么同步时间设置,【oracle数据库获取当前时间】
- 中国天气预报网城市对应代码
- 计算机sumifs函数怎么操作,excel中SUMIFS函数的公式语法及使用方法教程
- zend_Zend认证工程师
- EduCoder-Web程序设计基础-html5—结构元素-第3关:figure元素和figcaption元素的应用
- 不让玩游戏的小娃娃随机考试系统
- julius开源语音识别引擎
- 简单几个步骤,通过github搭建浪漫的表白网页
- 用 supabase实时数据库 实现 协作
热门文章
- 傅里叶变换、拉普拉斯变换、Z 变换的联系是什么?为什么要进行这些变换?
- 南京邮电大学计算机复试心得,南京邮电大学13年电路与系统考研复试心得小结...
- python爬取京东商品_Python爬取京东的商品分类与链接
- 爬虫日记(7):用urllib和beautifulsoup来实战抓取新闻
- UTF-8转换为GBK编码
- 如何将OFD文件转成Word?教你2种实用方法
- matlab中std2的公式,STD函数的内部计算公式
- 交互设计—超越人机交互(第5版)
- ssh远程连接windows
- DSP原理学习笔记--第十四章--DSP算法及其实现