回归是一种极易理解的模型,就相当于y=f(x),表明自变量x与因变量y的关系。最常见问题有如医生治病时的望、闻、问、切,之后判定病人是否生病或生了什么病,其中的望闻问切就是获取自变量x,即特征数据,判断是否生病就相当于获取因变量y,即预测分类。

逻辑回归模型

最简单的回归是线性回归,在此借用Andrew NG的讲义,有如图1.a所示,X为数据点——肿瘤的大小,Y为观测值——是否是恶性肿瘤。通过构建线性回归模型,如hθ(x)所示,构建线性回归模型后,即可以根据肿瘤大小,预测是否为恶性肿瘤hθ(x)≥.05为恶性,hθ(x)<0.5为良性。

线性回归示例图

然而线性回归的鲁棒性很差,例如在图1.b的数据集上建立回归,因最右边噪点的存在,使回归模型在训练集上表现都很差。这主要是由于线性回归在整个实数域内敏感度一致,而分类范围,需要在[0,1]。逻辑回归就是一种减小预测范围,将预测值限定为[0,1]间的一种回归模型,其回归方程与回归曲线如图2所示。逻辑曲线在z=0时,十分敏感,在z>>0或z<<0处,都不敏感,将预测值限定为(0,1)。

逻辑回归公式及示例图

逻辑回归其实仅为在线性回归的基础上,套用了一个逻辑函数。对于多元逻辑回归,可用如下公式似合分类:

对于训练数据集,特征数据x={x1, x2, … , xm}和对应的分类数据y={y1, y2, … , ym}。构建逻辑回归模型f(θ),最典型的构建方法便是应用极大似然估计。首先,对于单个样本,其后验概率为:

那么,极大似然函数为:

log似然是:

da

逻辑回归实现

from sklearn.inear model import LogistiRegression
clf = LogisticRegression0
clfit(train. feature,label)
clf.predict(predict feature)

梯度下降

求逻辑回归模型f(θ),等价于:

采用梯度下降法:

从而迭代θ至收敛即可:

逻辑回归模型的优缺点

逻辑回归优点

①逻辑回归的算法已经比较成熟,预测较为准确

②模型求出的系数易于理解,便于解释,尤其在银行业,80%的预测是使用逻辑回归

③结果是概率值

④训练快

逻辑回归缺点

当然它也有缺点,分类较多的y都不是很适用;对于自变量的多重共线性比较敏感,所以需要利用因子分析或聚类分析来选择代表性的自变量;另外预测结果呈现S型,两端概率变化小,中间概率变化大比较敏感,导致很多区间的变量的变化对目标概率的影响没有区分度,无法确定阙值。

回归算法———逻辑回归相关推荐

  1. python逻辑回归的主要参数_python机器学习(六)回归算法-逻辑回归

    逻辑回归 同步更新在个人网站:http://www.wangpengcufe.com/machinelearning/pythonml-pythonml6/ 一.概述 1.1.概念 是一种名为&quo ...

  2. Machine Learning | (4) Scikit-learn的分类器算法-逻辑回归

    Machine Learning | 机器学习简介 Machine Learning | (1) Scikit-learn与特征工程 Machine Learning | (2) sklearn数据集 ...

  3. 使用聚类算法(Kmeans)进行数据降维并作为分类算法逻辑回归(logistic Regression)的数据预处理步骤实战

    使用聚类算法(Kmeans)进行数据降维并作为分类算法逻辑回归(logistic Regression)的数据预处理步骤实战 目录

  4. 逻辑回归算法_算法逻辑回归

    logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域.例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等.以胃癌病 ...

  5. 阿龙学堂-算法-逻辑回归

    logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域.例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等.以胃癌病 ...

  6. 机器学习算法--逻辑回归原理介绍

    一.逻辑回归基本概念 1. 什么是逻辑回归 逻辑回归就是这样的一个过程:面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数,然后测试验证我们这个求解的模型的好坏. Log ...

  7. 逻辑回归二分类算法python_机器学习第七周--二分类算法逻辑回归

    一.Logistic分类算法 逻辑回归(Logistic Regression, LR)是传统机器学习中的一种分类模型,由于算法的简单和高效,解释性好以及容易扩展等优点,被广泛应用于点击率预估(CTR ...

  8. Python机器学习算法 — 逻辑回归(Logistic Regression)

    逻辑回归--简介 逻辑回归(Logistic Regression)就是这样的一个过程:面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数,然后测试验证我们这个求解的模型 ...

  9. 分类问题常用算法——逻辑回归原理

    逻辑回归模型算是机器学习的一种基本方法,但也有很多细节.本篇文章从原理入手,力求化繁为简,如有错漏,烦请指正. 什么是逻辑回归: 逻辑回归是一种分类模型.给定输入X, 可以将Y的条件概率P(Y|X)形 ...

最新文章

  1. 寒武纪上市:AI芯片和普通芯片有何不同?全球AI芯片公司大全都在这里了
  2. [HDOJ4588]Count The Carries(数学,规律)
  3. mysql常用sql语句优化
  4. Bzoj3628: [JLOI2014]天天酷跑
  5. 新炬首架梁铭图:从70万字SRE神作提炼出7千字精华与君共勉
  6. vim 文本编辑器_Vim Windows安装指南–如何在PC上的PowerShell中运行Vim文本编辑器
  7. Redis缓存异常的容错实现方法( .net)
  8. 两table水平滚动条级联滚动(同步滚动)。 table1放标题,table2放内容。
  9. win7下装ubuntu双系统
  10. KbmMW 4.30.00 发布
  11. RFID第二版答案-第六章
  12. python二元函数图像在线绘制_Python之Numpy:二元函数绘制/三维数据可视化/3D
  13. 朴新教育澄清破产传闻:债务重组是最有利方案 公司继续经营
  14. Altium Designer 17及以上版本快速画出Keep-Out layer层以便于覆铜操作
  15. Hexo博客使用腾讯云CDN加速及优化
  16. diode示例1silvaco仿真流程
  17. JAVA并发类包介绍
  18. 计算机信息安全技术学习资料汇总
  19. 小鸟云:浅谈5 种典型的云原生架构反模式
  20. 腾讯云 对象存储Java文件上传 学习资料整理

热门文章

  1. 软件测试自动化工具_用于软件测试的最佳免费自动化工具
  2. 《草根自媒体达人运营实战》一一1.3 各种自媒体平台及优缺点
  3. 怎么打开华硕电脑计算机功能,华硕笔记本小键盘怎么开(笔记本电脑虚拟键盘怎么打开)...
  4. qt使用assimp加载模型_iOS使用assimpKit加载FBX模型步骤详解
  5. docker一键部署springboot项目(三)
  6. 镜像服务器有什么作用,镜像文件、镜像服务器是什么意思
  7. delphi 整理的常用函数
  8. 网络工程师2017上半年上午试题答案
  9. python kivy 控件(小部件)的属性集合
  10. 解决OneDrive卸载后重新安装无法启动或闪退的问题