从logit变换到logistic模型

  • logit变换
  • 几率
  • logistic模型

前面我们知道对数函数和对数函数的一些基本性质,也许你会问,为什么要引入对数函数?而且还是一个基本初等函数?这就要从logit变换说起。

logit变换

我们在研究某一结果(y)与一系列因素(x1,x2,⋯,xn)(x_1,x_2,\cdots,x_n)(x1​,x2​,⋯,xn​)之间的关系的时候,最直白的想法是建立因变量和自变量的多元线性关系
y=α1x1+α2x2+⋯+αnxny=\alpha_1x_1+\alpha_2x_2+\cdots +\alpha_nx_ny=α1​x1​+α2​x2​+⋯+αn​xn​
如果结果的刻画是一个数值型的话还可以解释成某因素xix_ixi​变化了多少导致结果yyy也变化了多少,如果结果(y)是用来刻画结果是否(0-1)发生?或者更一般的来刻画结果(y)发生的概率(0~1)呢?这时候因素xix_ixi​变化导致结果(y)的变化恐怕微乎其微。实际生活中,我们知道某些关键因素会直接导致结果的发生,如亚马逊雨林一只蝴蝶翅膀偶尔振动,也许两周后就会引起美国德克萨斯州的一场龙卷风。于是,需要让线性关系发生变化,使得因素的变化,结果也会跟着发生很大变化,这时候,人们想到了logit变换

从对数函数图像来看,其在(0,1)之间的因变量的变化是很大的,也就是说自变量的变化会导致因变量的巨大变化,这就符合了微小变动带来巨大变化的效果,于是让因变量取对数,有下面式子

log(y)=α1x1+α2x2+⋯+αnxnlog(y)=\alpha_1x_1+\alpha_2x_2+\cdots +\alpha_nx_nlog(y)=α1​x1​+α2​x2​+⋯+αn​xn​

虽然上式解决了因变量随因素变化的敏感性问题,同时也约束了y的取值范围为(0,+∞)(0,+\infty )(0,+∞)。但是一件事情发生与否,更应该是调和对称的,也就是说一件事发生与不发生有对立性,结果可以走向必然发生(概率为1),也可以走向必然不发生(概率为0),而等式左边的取值范围不仅限于(0,+∞)(0,+\infty )(0,+∞),于是,又引进了几率。

几率

几率(odd)是指事件发生的概率与不发生的概率之比,假设事件 A发生的概率为p,不发生的概率为1-p,那么事件A的几率为
odd(A)=p1−podd(A)=\frac{p}{1-p}odd(A)=1−pp​

几率恰好反应了某一事件两个对立面,具有很好的对称性,下面我们再来看一下概率和几率的关系

首先,我们看到概率从0.01不断增大到0.99,几率也从0.01随之不断变大到99,两者具有很好的正相关系,我们对p向两端取极限有

lim⁡p→0+(p1−p)=0\lim\limits _ {p \to 0^+}(\frac{p}{1-p})=0p→0+lim​(1−pp​)=0

lim⁡p→1−(p1−p)=+∞\lim\limits _ {p \to 1^-}(\frac{p}{1-p})=+\inftyp→1−lim​(1−pp​)=+∞

于是,几率的取值范围就在(0,+∞)(0,+\infty)(0,+∞),这符合我们之前的假设。

logistic模型

正因为概率和几率有如此密切对等的关系,于是想能不能用几率来代替概率,这样既能满足因素对结果的敏感性,又能满足对称性 ,便有了下面式子
log(p1−p)=α1x1+α2x2+⋯+αnxnlog(\frac{p}{1-p}) = \alpha_1x_1+\alpha_2x_2+\cdots +\alpha_nx_nlog(1−pp​)=α1​x1​+α2​x2​+⋯+αn​xn​
现在,我们稍微改一改,让等式左边对数变成自然对数ln,等式右边改成向量乘积形式,便有
ln(p1−p)=αXln(\frac{p}{1-p})=\alpha Xln(1−pp​)=αX
其中α=(α1,α2,⋯,αn)\alpha=(\alpha_1,\alpha_2,\cdots,\alpha_n)α=(α1​,α2​,⋯,αn​),X=(x1,x2,⋯,xn)TX=(x_1,x_2,\cdots,x_n)^TX=(x1​,x2​,⋯,xn​)T。
我们解得
p=eαX1+eαXp=\frac{e^{\alpha X}} {1+ e^{\alpha X}}p=1+eαXeαX​
这就是我们常见的logistic模型,图像如下

我们看到logistic函数图像是一条S型曲线,又名sigmoid曲线,以(0,0.5)为堆成中心,曲线在中心位置变化速度最快,在两端的变化速率较慢。

参考文献

1,对数函数
2,python绘制对数函数
3,如何理解logistic函数
4,logit究竟是个啥?

从logit变换到logistic模型相关推荐

  1. 用java建立多项式logit模型_请问logit模型和logistic模型是不是一样的?

    序言 在现有的统计教科书中,一般都有logistic回归模型的内容.然而,在这些教科书中,logistic回归往往不是作为中心内容,缺乏关于这种方法的详尽讨论.有关专著在国外很少,国内尚无.国外的一些 ...

  2. Logit模型和Logistic模型的区别

    别人已经写好了,保存一下! https://zhuanlan.zhihu.com/p/30659982

  3. ologit模型与logit_Logit模型和Logistic模型有什么区别?

    之前在<Logit究竟是个啥?--离散选择模型之三>一文中提过,Logit应该理解成Log-it,这里的it指的是Odds("胜率",等于P/1-P).一个Logit变 ...

  4. 二元logistic模型案例_二元逻辑回归的简介与操作演示

    二元逻辑回归介绍 定义 Logistic回归主要用于因变量为分类变量(如是否等)的回归分析,自变量可以为分类变量,也可以为连续变量.它可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用 ...

  5. logistic模型原理与推导过程分析(2)

    二项逻辑回归模型 既然logistic回归把结果压缩到连续的区间(0,1),而不是离散的0或者1,然后我们可以取定一个阈值,通常以0.5为阈值,如果计算出来的概率大于0.5,则将结果归为一类(1),如 ...

  6. logistic模型原理与推导过程分析(1)

    从线性分类器谈起 给定一些数据集合,他们分别属于两个不同的类别.例如对于广告数据来说,是典型的二分类问题,一般将被点击的数据称为正样本,没被点击的数据称为负样本.现在我们要找到一个线性分类器,将这些数 ...

  7. 运用Logistic模型实现客户流失预警分析

    在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...

  8. 非期望产出的sbm模型_线性模型 vs. Logistic模型——离散选择模型之二

    前言:为什么因变量是分类变量的时候,我们会选择Logistic模型.而非最常见的线性回归模型?或者,换个说法:线性回归模型的劣势是什么?Logistic模型的优势又是什么?--针对这些问题,本文为您详 ...

  9. 从朴素贝叶斯的角度推导logistic模型

    从朴素贝叶斯的角度推导logistic模型 文章结构预览 1.朴素贝叶斯算法的理解 2.logistic模型简介 3.从朴素贝叶斯的角度解释为什么logistic模型的sigmoid函数可以表示概率 ...

最新文章

  1. 【windows】cmd中的help无法使用的解决方法
  2. java自定义异常及异常的抛出
  3. HTTP:HTTP的server and client详细攻略
  4. PyCharm3.0默认快捷键
  5. 配置虚拟目录的方式(Linux下/windows下)
  6. Auto.js Pro如何连接VS Code插件
  7. hadoop 2.7.2 + zookeeper 高可用集群部署
  8. 【OS学习笔记】三十七 保护模式十:中断和异常的处理与抢占式多任务对应的汇编代码----主引导扇区代码
  9. python解压加密zip文件_Python:解压缩前检测一个zip文件否为加密,两种算法。
  10. python数据分析模块包括_数据开发必会 | Python数据分析模块
  11. JSP指示元素%@ % 与指示类型
  12. vuex commit 模块_一分钟上手Vuex
  13. iOS音频播放 (一):概述 转
  14. ActiveReportsJS 2.2.1 中文特殊版
  15. 数据结构常见的八大排序算法(详细整理)
  16. libreelec投屏_低配置主机安装Kodi操作系统 - LibreELEC
  17. Navicat for MySQL 视图创建使用方法以及如何查看数据表创建语句
  18. tplink怎么进去_怎么进入TP-Link路由器设置界面? | 192路由网
  19. 【WLAN从入门到精通-基础篇】第1期——WLAN定义和基本架构
  20. C++ 左值引用和右值引用

热门文章

  1. scroll-view的横向滚动
  2. L1-047. 装睡
  3. 牛客网 手机按键(模拟、清华机试)
  4. CPU漏洞利用全过程
  5. RM-139C万能遥控器电视机设置
  6. 常用awk命令(转)
  7. godspeed机器人_机器人总动员?经典 及其它
  8. 不与心术不正的人交往
  9. ffmpeg 音频混流--命令与代码说明
  10. 2021-05-11 Matlab遗传算法工具箱的使用及实例(非线性规划)