前言

目前这个方法还没有一个正规的中文名,如果从lasso这个单词讲的话,叫套索。那么套索是啥呢,就是套马脖子的东西,见下图:

就是拿这个东西把动物脖子套住,不要它随便跑。lasso 回归就是这个意思,就是让回归系数不要太大,以免造成过度拟合(overfitting)。所以呢,lasso regression是个啥呢,就是一个回归,并且回归系数不要太大。

具体的实现方式是加了一个L1正则的惩罚项。

拉普拉斯分布

在概率论与统计学中,拉普拉斯分布是以皮埃尔-西蒙·拉普拉斯的名字命名的一种连续概率分布。由于它可以看作是两个不同位置的指数分布背靠背拼接在一起,所以它也叫作双指数分布。两个相互独立同概率分布指数随机变量之间的差别是按照指数分布的随机时间布朗运动,所以它遵循拉普拉斯分布。

如果随机变量的概率密度函数为:

那么它就是拉普拉斯分布。记为:

其中,是位置参数,是尺度参数。

与正态分布有一些差别。在均值处变化的相当迅速。

数字特征:

MAP概率推导

推导方式与贝叶斯线性回归类似贝叶斯线性回归(最大后验估计+高斯先验)

对于线性回归,有

记误差,则

对参数的分布加入先验分布信息(注不加任何先验就是普通的线性回归),

可以得到MAP方程:

取对数得:

上面的所有都应改为,记的集合。

等价于:

至此,我们已经通过MAP最大后验估计加上对于参数的Laplace先验分布得到了带L1正则项的线性回归目标函数。

正则项的意义

对于上面的目标函数,我们还可以写成以下这种带约束条件的形式:

妙处就在这个地方,在第一范数的约束下,一部分回归系数刚好可以被约束为0。这样的话,就达到了特征选择的效果。至于为什么大家可以看看下图 (在岭回归(L2正则在干嘛!)中有介绍过了)。

不再详细解释了,如果有需要可以参阅之前的博客。

L1正则项不可导的梯度下降方法

对于凸函数不可导的情形,如L1正则项在0点处不可导,我们可以使用坐标下降法或者次梯度方法。

参考文章:

Sparsity and Some Basics of L1 Regularization

Lasso回归的坐标下降法推导

【机器学习】Lasso回归(L1正则,MAP+拉普拉斯先验)相关推荐

  1. [机器学习]Lasso,L1范数,及其鲁棒性

    前言:本文包括以下几个方面, 1. 介绍Lasso,从最初提出Lasso的论文出发,注重动机: 2. L1和L2范数的比较,注重L1的稀疏性及鲁棒性: 3. 从误差建模的角度理解L1范数 1. las ...

  2. 机器学习 Lasso回归算法

    Lasso回归算法: 坐标轴下降法与最小角回归法小结 前面的文章对线性回归做了一个小结,文章在这: 线性回归原理小结.里面对线程回归的正则化也做了一个初步的介绍.提到了线程回归的L2正则化-Ridge ...

  3. 机器学习--Lasso回归(LassoRegression)

    机器学习–LassoRegression 基本概念 Lasso 是拟合稀疏系数的线性模型. 它在一些情况下是有用的,因为它倾向于使用具有较少参数值的情况,有效地减少给定解决方案所依赖变量的数量. 在线 ...

  4. [机器学习-原理篇]学习之线性回归、岭回归、Lasso回归

    线性回归.岭回归.Lasso回归 前言 一,线性回归--最小二乘 二,Lasso回归 三,岭回归 四, Lasso回归和岭回归的同和异 五, 为什么 lasso 更容易使部分权重变为 0 而 ridg ...

  5. 线性回归——lasso回归和岭回归(ridge regression)

    目录 线性回归--最小二乘 Lasso回归和岭回归 为什么 lasso 更容易使部分权重变为 0 而 ridge 不行? References 线性回归很简单,用线性函数拟合数据,用 mean squ ...

  6. 多元线性回归算法: 线性回归Linear Regression、岭回归Ridge regression、Lasso回归、主成分回归PCR、偏最小二乘PLS

    0. 问题描述 输入数据:X=(x1,x2,....,xm)\mathbf{X} = (x_1, x_2,...., x_m)X=(x1​,x2​,....,xm​), 相应标签 Y=(y1,y2,. ...

  7. LASSO和L1正则包liblinear,glmnet使用和对比

    LASSO算法有很多包,今天我就两个常用包liblinear和glmnet做一下分析,并给出我做分类的例子. liblinear LIBLINEAR是一个简单的求解大规模规则化线性分类和回归的软件包. ...

  8. 线性回归、Lasso回归、岭回归预测北京PM2.5浓度

    一.项目背景 北京PM2.5浓度回归分析训练赛 1.数据   数据主要包括2010年1月1日至2014年12月31日间北京pm2.5指数以及相关天气指数数据.   数据分为训练数据和测试数据,分别保存 ...

  9. Ridge和Lasso回归

    上周看了看回归方面的知识,顺便复(xue)习一下Ridge(岭回归)和Lasso回归(套索回归).瞅到了一篇英文博客讲得不错,翻译一下 本文翻译自 Ridge and Lasso Regression ...

最新文章

  1. oracle全局索引 前缀索引_Oracle 分区索引介绍和实例演示
  2. 计算机网络7层协议模型,计算机网络(一) OSI七层模型及TCP/IP dubbo协议
  3. 控制-频域操作-傅里叶级数和傅里叶变换
  4. struts2 中文乱码问题
  5. LQ训练营(C++)学习笔记_枚举算法
  6. java method_JAVA Method的解析
  7. 一文带你全面认识Excel催化剂系列功能
  8. mysql前一天_mysql查询当天,前一天,一周,一个月
  9. [bzoj 3594] [Scoi2014]方伯伯的玉米田
  10. React 是如何成为跨越前端开发鸿沟的桥梁?
  11. 个人工作总结10(冲刺二)
  12. 51nod 1134最长递增子序列
  13. 峰度和偏度在金融数据分析中有何应用_做数据分析,为什么要学统计学?
  14. shell实现txt转换excel
  15. 四川婚姻登记捷宇SC10T高拍仪技术规格说明书
  16. 没有对比就没有伤害:《明日之后》竟成最良心国产末日手游?
  17. 已解决 阿里云盘 应用网络状况不佳,扫码,用账号登录,用手机号登录都不可以
  18. android_文件下载
  19. 【Uni-App】点击分享,生成海报带二维码,保存到本地图片,写入文字
  20. spring注解方式整合Dubbo源码解析

热门文章

  1. android settext 参数,Android TextView.setTextColor()的参数设置方式
  2. 自网站服务器,教你如何配置自的网站服务器.doc
  3. python基于rsa的数字签名实现_青岛宽客聚会期权定价公式基于python的实现
  4. WAMPSerrver集成环境的下载安装
  5. nw.js启动时白屏
  6. Icon class生成器(Python)
  7. 前端那些年----Webstream快捷键备忘(mac)
  8. 使用 Python 5 年后,我转向了Go
  9. SpringCloud F.RC2 整合Zipkin简单步骤
  10. elasticsearch 6.1.1 transport jar