1.概念

逻辑斯蒂回归又称为“对数几率回归”,虽然名字有回归,但是实际上却是一种经典的分类方法,其主要思想是:根据现有数据对分类边界线(Decision Boundary)建立回归公式,以此进行分类。

2.特点

1. 优点:计算代价不高,具有可解释性,易于实现。不仅可以预测出类别,而且可以得到近似概率预测,对许多需要利用概率辅助决策的任务很有用。

2. 缺点:容易欠拟合,分类精度可能不高。

3. 适用数据类型:数值型和标称型数据。

3.逻辑斯蒂分布

逻辑斯蒂分布的分布函数和密度函数如下:

其中,是位置参数,为形状参数。

逻辑斯蒂分布在不同的的情况下,其概率密度函数的图形:

逻辑斯蒂分布在不同的的情况下,其概率分布函数的图形:

逻辑斯蒂分布函数的图形是一条S形曲线(sigmoid curve),该曲线以点为中心对称,即满足:

曲线在中心附近增长速度较快,在两端增长速度较慢。形状参数的值越小,曲线在中心附近增长得越快。

时,逻辑斯蒂概率分布函数就是我们逻辑斯蒂回归函数

4.逻辑斯蒂回归模型

对于分类问题,我们想要一个函数能够通过所有的输入预测出类别。

考虑较为简单的二分类情况,给定一个数据集,其中,

从线性回归模型产生的预测值,为了分类,需要将转换为0/1值。此时可以采用单位阶跃函数进行到0/1的映射:

当预测值时,将其判为正例;当预测值时,将其判为负例。

但该函数不连续,为了便于后续计算,我们希望得到一个连续可微的近似替代函数,因此我们选取了对数几率函数(logistic regression)作为替代函数,对数几率函数是一种sigmoid函数:

            (1)

这样,就可以将任意输入映射到区间内,实现由值到概率的转换。为便于讨论,使,其中,此时就成为了就成为了就成为了,代入(1)中得到:

          (2)

(2)可以变换为:

          (3)

若将视为样本为正例的可能性,则视为样本为反例的可能性。两者的比值称为“几率(odds)”,一个事件的几率就是指该事件发生的概率与该事件不发生的概率的比值,反映了作为正例的相对可能性。对几率取对数得到对数几率(log odds,亦称logit)。即(2)实际上是用线性回归模型的预测结果去逼近真实标记的对数几率。

此时,若将(2)的中视为类后验概率(就是说,对于样本点的x,可以用S形函数的结果来当做该点属于类别1的概率),则(3)可重写为:

          (4)

显然可以得到我们希望学得的逻辑斯蒂模型:

          (5)

          (6)

,则。将(5),(6)整合称为一般形式,得到在已知参数和数据的情况下,为预测值的条件概率:

          (7)

将(7)连乘,得到已知参数和数据的情况下,为预测值的条件概率。这个条件概率在数值上等于likelihood(W | X,Y),也就是在已知现有数据的条件下,W是真正参数的概率。似然函数为:

          (8)

由于乘法难解,通过取对数可以将乘法转换为加法,简化计算。对数似然函数为:

          (9)

似然函数表示样本成为真实的概率,似然函数越大越好,此时我们可以用梯度上升法求最大值,也可以引入一个负号转换为梯度下降法来求解。

代价函数为:

          (10)

5. 梯度下降法求参数

逻辑斯蒂回归学习中通常采用的方法是梯度下降法及拟牛顿法,下面介绍逻辑斯蒂回归中梯度下降法求参数。

求偏导:

          (11)

因此,在使用梯度下降法求解时,每次迭代地更新公式为:

        (12)

参考文献:

1.《机器学习》第三章对数几率回归——周志华

2.  逻辑回归(logistic regression)的本质 - 极大似然估计

3.  逻辑回归推导

4.  LR回归(Logistic回归)

【机器学习】逻辑斯蒂回归原理推导与求解相关推荐

  1. 逻辑斯蒂回归原理及其概率计算

    目录 逻辑斯蒂回归 原理过程 预测函数 原理代码实现 例子 最大似然估计 原理 逻辑斯蒂回归概率计算 导包 手动计算 多分类概率计算 逻辑斯蒂回归 利用Logistics回归进行分类的主要思想是:根据 ...

  2. 【机器学习】逻辑斯蒂回归原理

    逻辑斯蒂函数 引入: 在线性感知器算法中,我们使用了一个f(x)=x函数,作为激励函数,而在逻辑斯蒂回归中,我们将会采用sigmoid函数作为激励函数,所以它被称为sigmoid回归也叫对数几率回归( ...

  3. 机器学习-逻辑斯蒂回归(Logistic Regression)

    注:内容转自https://github.com/NLP-LOVE/ML-NLP/tree/master/Machine%20Learning,略有修改. 目录 逻辑 1. 什么是逻辑斯蒂回归 2. ...

  4. 逻辑斯蒂回归原理(二分类、多分类)

    文章目录 逻辑斯蒂分布 二项逻辑回归模型 模型参数估计 多项逻辑斯蒂回归 逻辑斯蒂分布 逻辑斯蒂分布假设X是连续随机变量,且分布函数.密度函数如下: F(x)=P(X⩽x)=11+exp⁡(−(x−μ ...

  5. 逻辑斯蒂回归 逻辑回归_逻辑回归简介

    逻辑斯蒂回归 逻辑回归 Logistic regression is a classification algorithm, which is pretty popular in some commu ...

  6. 回归分析(三)二项逻辑斯蒂回归模型

    回归分析(三)二项逻辑斯蒂回归   学了一段时间突然又遇到逻辑斯蒂回归,结果发现已经忘完了,所以今天重新梳理一下. (1)逻辑斯蒂分布   先看一下逻辑斯蒂分布函数F(x)F(x)F(x),其概率密度 ...

  7. 逻辑斯蒂回归(logistic regression)原理小结

    逻辑斯蒂回归(logistic regression)原理小结 1. 模型函数 2. 损失函数 3. 学习算法 4. 加正则项的逻辑斯蒂回归 5. 多项逻辑斯蒂回归 6. 模型综合评价 7. 二分类 ...

  8. 细讲逻辑斯蒂回归与朴素贝叶斯、最大熵原理的爱恨交织(长文)

    好早之前就发现逻辑斯蒂回归好像和朴素贝叶斯里面的后验概率公式还有最大似然.信息熵.交叉熵.伯努利分布.回归分析.几率(odds)等等有着千丝万缕CZFZ(错综复杂).PSML(扑朔迷离)的关系.一直感 ...

  9. 机器学习(四)——逻辑斯蒂回归(Logistic Regression)

    机器学习(四)--逻辑斯蒂回归(Logistic Regression) 一.算法简介 1.1 概念 二.Logistic回归理论推导 2.1 Logistic回归 2.1.1 参数向量θ 2.2 梯 ...

最新文章

  1. 远程控制 vc++实现
  2. EDM营销中HTML邮件设计方法和技巧
  3. visual studio 添加链接文件
  4. ML之RF:基于RF算法实现案例(数据集samtrain.csv、samval.csv、samtest.csv)
  5. bzoj 2705: [SDOI2012]Longge的问题——欧拉定理
  6. psql客户端乱码问题
  7. ASP.NET 5 入门 (3) – Logging
  8. arm搭建云手机教程_教你从0开始部署阿里云服务器,阿里云服务器搭建网站教程...
  9. MySQL的基础操作命令_mysql的基本操作命令
  10. 春晚魔术,醉翁之意不在酒
  11. 使用ApiPost按顺序传参及测试多个接口
  12. Axure 软件自带的图标元件Icons无法显示的问题解决方法
  13. Biotion-PEG-Mal,Maleimide-PEG-Biotin,生物素聚乙二醇马来酰亚胺分子量
  14. 计算机地图制图期末考试题,计算机地图制图原理思考题.doc
  15. Logcat的操作使用方法
  16. 购买你的青春和一切ZT
  17. 我是如何将Pluto作为library分享到jCenter
  18. 用计算机画图教案评价,小学四年级信息技术优秀教学设计及评析《电脑图案设计师》...
  19. ie下“无法将这个证书验证到一个受信赖的证书颁发机构”问题解决
  20. 物联网与大数据(四)大数据技术 物联网操作系统

热门文章

  1. c++中transform函数的应用
  2. PLM,是一个英文缩写,有2个含义,一是表示产品生命周期管理(product lifecycle management,PLM),...
  3. 总结一下使用Emgucv的经验和经历
  4. NFS服务器的配置与管理
  5. scrapy框架讲解
  6. 必读论文 | 卷积神经网络百篇经典论文推荐
  7. vue在创建项目时不小心选上代码校验选项(linter/ESlint)后,如何关掉?
  8. CDA LEVELⅠ2021新版模拟题二(附答案)
  9. php无法获取操作系统信息,如何获取操作系统信息
  10. J-flash工具使用教程