Logistic回归模型和惩罚模型
Logistic回归模型
主题思想
是一个分类模型,通过对数据的分类边界线建立回归公式,从而实现分类。
激活函数
将连续的数值转化成0或1的输出。
Heaviside函数(阶梯跳跃函数):
- 0到1的跳跃过程不平滑
Sigmoid函数:
- 0到1的渐变过程平滑
Logistic回归模型实现过程:
- 将样本特征值与回归系数相乘
- 再将所有特征值与回归系数的乘积相加
- 最后将加和代入sigmoid函数
- 输出一个范围在0-1之间的值
- 结果大于0.5的样本归入1类,小于0.5的归入0类
Logistic回归模型公式:
Logistic损失函数:对数似然损失函数
即:
梯度下降法
- 无约束多元函数极值求解方法
- 一种常用的机器学习参数求解方法
- 通过迭代得到最小化的损失函数所对应的模型参数
基本思路:
- 在求解目标函数E(a) 的最小值时,a沿着梯度下降的方向不断变化求解最小值
什么是梯度:
假设优化目标是求解函数E(a)的最小值
- 参数a的梯度为函数E(a)的偏导数
- 因此a的迭代公式为:
其中阿尔法为步长
什么是步长:
- 步长是梯度下降迭代的速度控制器
- 步长调小:收敛速度慢
- 步长太大:可能跳过函数最小值,导致发散
参数求解:梯度下降法
循环a和b:
设置循环次数或者阈值,当达到循环次数或者两次的值小于阈值时,迭代终止。
惩罚模型
惩罚(正则化)定义: 通过在模型损失函数中增加一个正则项(惩罚项)来限制模型的复杂度
惩罚项: 一般来说都是一个随着模型复杂度增加而增加的单调递增函数
惩罚项(正则化)的形式:
假设一个模型的损失函数为:
则加了惩罚项的损失函数为:
优化目标则变成:
正则化的优化目标:求解参数使得模型的误差最小,同时模型的复杂度最低
惩罚项(正则化)的目的:通过降低模型的复杂度,从而防止过拟合,提高模型的泛化能力
解释一:
- 奥卡姆剃刀原理
- 解释:能够用简单的方法达到很好的项目,就没有必要使用复杂的方法
- 原理推广:如果简单的模型就能够达到很好的预测效果,就没有必要选择复杂的模型
解释二:
- 在模型中使用更多的自变量,一般情况下都会提升模型在训练数据集上的表现,但同时也会提高模型的复杂度,降低模型在验证集上的泛化能力,造成过拟合。
常用的惩罚项(正则化)
以线性回归模型的损失函数为例,假设线性回归模型需要求解的参数为列向量A,数据集中有N个样本
- L1正则系数:lasso回归
(所有参数绝对值之和) - L2正则系统:ridge回归
(所有参数平方的和再开方)
常用的惩罚项(正则项)特性:
L1正则系数:lasso回归
- L1是模型各个参数的绝对值之和
- L1可以将特征参数约束到0,因此L1会趋向于产生少量的特征,而其他的特征都是0
- L1也因此具有特征筛选的功能(被筛除的特征特征参数为0)
- L1通过融入少量的特征来防止过拟合
L2正则系统:ridge回归
- L2是模型各个参数的平方和的开方值
- L2只能减少特征参数值,让参数接近0,但不能将参数约束到0
- L2通过减少特征的参数值来防止过拟合
Logistic回归模型和惩罚模型相关推荐
- R语言基于glmnet构建Logistic回归模型使用L1正则化并可视化系数及最佳lambda值
R语言基于glmnet构建Logistic回归模型使用L1正则化并可视化系数及最佳lambda值 Glmnet主要用于拟合广义线性模型.筛选可以使loss达到最小的正则化参数lambda.该算法非常快 ...
- 解读Logistic回归模型
一.logistic回归的由来 logistic回归在百度百科是这样定义的: logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领 ...
- 多项logistic回归系数解释_因变量无序多分类资料的logistic回归
转自个人微信公众号[Memo_Cleon]的统计学习笔记:因变量无序多分类资料的logistic回归. 因变量为无序多分类资料,或者因变量虽为有序多分类但不满足比例优势假定(平行性检验P>0.0 ...
- 有序分类logistic回归-R语言
有序分类logistic回归 正如字面理解,包含两个方面:一是有序性,如调研中常用的满意度常用李克特量表,即有序的因变量:二是logistic分类,如1代表优秀.2代表良好.3代表一般等等. 因变量为 ...
- logistic回归预测_使用Logistic回归的suv购买预测
logistic回归预测 In this blog-post ,I will go through the process of creating a machine learning model f ...
- logistic回归 如何_第七章:利用Python实现Logistic回归分类模型
免责声明:本文是通过网络收集并结合自身学习等途径合法获取,仅作为学习交流使用,其版权归出版社或者原创作者所有,并不对涉及的版权问题负责.若原创作者或者出版社认为侵权,请联系及时联系,我将立即删除文章, ...
- Softmax回归——logistic回归模型在多分类问题上的推广
Softmax回归 Contents [hide] 1 简介 2 代价函数 3 Softmax回归模型参数化的特点 4 权重衰减 5 Softmax回归与Logistic 回归的关系 6 Softma ...
- logistic回归模型python_【机器学习速成宝典】模型篇03逻辑斯谛回归【Logistic回归】(Python版)...
目录 一元线性回归.多元线性回归.Logistic回归.广义线性回归.非线性回归的关系 什么是极大似然估计 逻辑斯谛回归(Logistic回归) 多类分类Logistic回归 Python代码(skl ...
- 乳腺癌细胞数据分析Logistic回归模型
Breast_cancer_cells & Logistic_Regression 数据集以及源代码资源包: 链接:https://pan.baidu.com/s/1VIjTjtSa1Jngq ...
最新文章
- git报错: LF will be replaced by CRLF
- 怎么操作会导致MySQL锁表
- 梯度下降和随机梯度下降_梯度下降和链链接系统
- 安全使用计算机事例,计算机安全案例分析.ppt
- python多线程结束线程_Python线程– Python多线程
- 微信小程序下拉刷新功能--onPullDownRefresh
- Unity渲染(四):Shader着色器基础入门之获取当前屏幕贴图
- windows10打开natapp.exe 报Error: oppen NUL: The system cannot find the file specified.
- 云原生 - 自建数据库与云数据库RDS性能优势分析,值不值得购买?
- 2023软件测试最难求职季,哪些测试技能更容易拿到offer?
- 小萝莉说Crash(一):Unrecognized selector sent to instance xxxx
- hdu 2066 一个人的旅行 (多源最短路 )
- python安装lap_AP 升级到 LAP,或 LAP 降到 AP 的方法
- StringUtils的使用
- 【初等概率论】 02
- 最简单的方法!UEFI引导+GPT分区安装win10+Ubuntu16.04双系统
- Maven tomcat7:run 配置
- 无人机动力电池充放电说明
- android程序设计魔方矩阵,【图片】【记录】零基础用c4droid写一个3D魔方软件_c4droid吧_百度贴吧...
- LogStash 原理和使用(十六)