Logistic回归模型

主题思想

是一个分类模型,通过对数据的分类边界线建立回归公式,从而实现分类。

激活函数

将连续的数值转化成0或1的输出。

Heaviside函数(阶梯跳跃函数):

  • 0到1的跳跃过程不平滑


Sigmoid函数:

  • 0到1的渐变过程平滑


Logistic回归模型实现过程:

  1. 将样本特征值与回归系数相乘
  2. 再将所有特征值与回归系数的乘积相加
  3. 最后将加和代入sigmoid函数
  4. 输出一个范围在0-1之间的值
  5. 结果大于0.5的样本归入1类,小于0.5的归入0类

Logistic回归模型公式:

Logistic损失函数:对数似然损失函数

即:

梯度下降法

  • 无约束多元函数极值求解方法
  • 一种常用的机器学习参数求解方法
  • 通过迭代得到最小化的损失函数所对应的模型参数

基本思路:

  • 在求解目标函数E(a) 的最小值时,a沿着梯度下降的方向不断变化求解最小值

什么是梯度:

假设优化目标是求解函数E(a)的最小值

  • 参数a的梯度为函数E(a)的偏导数
  • 因此a的迭代公式为:

    其中阿尔法为步长

什么是步长:

  • 步长是梯度下降迭代的速度控制器
  • 步长调小:收敛速度慢
  • 步长太大:可能跳过函数最小值,导致发散

参数求解:梯度下降法
循环a和b:

设置循环次数或者阈值,当达到循环次数或者两次的值小于阈值时,迭代终止。

惩罚模型

惩罚(正则化)定义: 通过在模型损失函数中增加一个正则项(惩罚项)来限制模型的复杂度

惩罚项: 一般来说都是一个随着模型复杂度增加而增加的单调递增函数

惩罚项(正则化)的形式:
假设一个模型的损失函数为:

则加了惩罚项的损失函数为

优化目标则变成

正则化的优化目标:求解参数使得模型的误差最小,同时模型的复杂度最低

惩罚项(正则化)的目的:通过降低模型的复杂度,从而防止过拟合,提高模型的泛化能力

解释一:

  • 奥卡姆剃刀原理
  • 解释:能够用简单的方法达到很好的项目,就没有必要使用复杂的方法
  • 原理推广:如果简单的模型就能够达到很好的预测效果,就没有必要选择复杂的模型

解释二:

  • 在模型中使用更多的自变量,一般情况下都会提升模型在训练数据集上的表现,但同时也会提高模型的复杂度,降低模型在验证集上的泛化能力,造成过拟合。

常用的惩罚项(正则化)

以线性回归模型的损失函数为例,假设线性回归模型需要求解的参数为列向量A,数据集中有N个样本

  • L1正则系数:lasso回归

    (所有参数绝对值之和)
  • L2正则系统:ridge回归

    (所有参数平方的和再开方)

常用的惩罚项(正则项)特性

L1正则系数:lasso回归

  • L1是模型各个参数的绝对值之和
  • L1可以将特征参数约束到0,因此L1会趋向于产生少量的特征,而其他的特征都是0
  • L1也因此具有特征筛选的功能(被筛除的特征特征参数为0)
  • L1通过融入少量的特征来防止过拟合

L2正则系统:ridge回归

  • L2是模型各个参数的平方和的开方值
  • L2只能减少特征参数值,让参数接近0,但不能将参数约束到0
  • L2通过减少特征的参数值来防止过拟合

Logistic回归模型和惩罚模型相关推荐

  1. R语言基于glmnet构建Logistic回归模型使用L1正则化并可视化系数及最佳lambda值

    R语言基于glmnet构建Logistic回归模型使用L1正则化并可视化系数及最佳lambda值 Glmnet主要用于拟合广义线性模型.筛选可以使loss达到最小的正则化参数lambda.该算法非常快 ...

  2. 解读Logistic回归模型

    一.logistic回归的由来 logistic回归在百度百科是这样定义的: logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领 ...

  3. 多项logistic回归系数解释_因变量无序多分类资料的logistic回归

    转自个人微信公众号[Memo_Cleon]的统计学习笔记:因变量无序多分类资料的logistic回归. 因变量为无序多分类资料,或者因变量虽为有序多分类但不满足比例优势假定(平行性检验P>0.0 ...

  4. 有序分类logistic回归-R语言

    有序分类logistic回归 正如字面理解,包含两个方面:一是有序性,如调研中常用的满意度常用李克特量表,即有序的因变量:二是logistic分类,如1代表优秀.2代表良好.3代表一般等等. 因变量为 ...

  5. logistic回归预测_使用Logistic回归的suv购买预测

    logistic回归预测 In this blog-post ,I will go through the process of creating a machine learning model f ...

  6. logistic回归 如何_第七章:利用Python实现Logistic回归分类模型

    免责声明:本文是通过网络收集并结合自身学习等途径合法获取,仅作为学习交流使用,其版权归出版社或者原创作者所有,并不对涉及的版权问题负责.若原创作者或者出版社认为侵权,请联系及时联系,我将立即删除文章, ...

  7. Softmax回归——logistic回归模型在多分类问题上的推广

    Softmax回归 Contents [hide] 1 简介 2 代价函数 3 Softmax回归模型参数化的特点 4 权重衰减 5 Softmax回归与Logistic 回归的关系 6 Softma ...

  8. logistic回归模型python_【机器学习速成宝典】模型篇03逻辑斯谛回归【Logistic回归】(Python版)...

    目录 一元线性回归.多元线性回归.Logistic回归.广义线性回归.非线性回归的关系 什么是极大似然估计 逻辑斯谛回归(Logistic回归) 多类分类Logistic回归 Python代码(skl ...

  9. 乳腺癌细胞数据分析Logistic回归模型

    Breast_cancer_cells & Logistic_Regression 数据集以及源代码资源包: 链接:https://pan.baidu.com/s/1VIjTjtSa1Jngq ...

最新文章

  1. git报错: LF will be replaced by CRLF
  2. 怎么操作会导致MySQL锁表
  3. 梯度下降和随机梯度下降_梯度下降和链链接系统
  4. 安全使用计算机事例,计算机安全案例分析.ppt
  5. python多线程结束线程_Python线程– Python多线程
  6. 微信小程序下拉刷新功能--onPullDownRefresh
  7. Unity渲染(四):Shader着色器基础入门之获取当前屏幕贴图
  8. windows10打开natapp.exe 报Error: oppen NUL: The system cannot find the file specified.
  9. 云原生 - 自建数据库与云数据库RDS性能优势分析,值不值得购买?
  10. 2023软件测试最难求职季,哪些测试技能更容易拿到offer?
  11. 小萝莉说Crash(一):Unrecognized selector sent to instance xxxx
  12. hdu 2066 一个人的旅行 (多源最短路 )
  13. python安装lap_AP 升级到 LAP,或 LAP 降到 AP 的方法
  14. StringUtils的使用
  15. 【初等概率论】 02
  16. 最简单的方法!UEFI引导+GPT分区安装win10+Ubuntu16.04双系统
  17. Maven tomcat7:run 配置
  18. 无人机动力电池充放电说明
  19. android程序设计魔方矩阵,【图片】【记录】零基础用c4droid写一个3D魔方软件_c4droid吧_百度贴吧...
  20. LogStash 原理和使用(十六)

热门文章

  1. CCNA认证试题一(附答案和解析)中文版(一)
  2. C++ 哈希表基本用法
  3. ApplicationContext和Bean的初始化和销毁
  4. 做个mp3播放器mciSendString()用法【转】
  5. Linux下的.ko文件
  6. 分享几个冷门软件,但很好用
  7. chrome打字卡的问题
  8. 蒙特卡洛树和alpha go
  9. 测鬼记(下)之职场日记——坎坷不安(6月23日)
  10. 大数据必须框架-Azkaban