1 线性回归

假设有数据有:
T={(x(1),y(1)),(x(2),y(2)),...,(x(m),y(m))}T=\{(x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),...,(x^{(m)},y^{(m)})\}T={(x(1),y(1)),(x(2),y(2)),...,(x(m),y(m))}
       其中x(i)={x1(i),x2(i),...,xn(i)},yi∈Rx^{(i)}=\{x^{(i)}_1,x^{(i)}_2,...,x^{(i)}_n\},y^i \in Rx(i)={x1(i)​,x2(i)​,...,xn(i)​},yi∈R。线性回归采用一个高维的线性函数来尽可能的拟合所有数据点,最简单的想法就是最小化函数值与真实值误差的平法,即:
J(θ)=12∑i=1m(hθ(x(i))−y(i))2J(\theta)=\frac{1}{2}\sum^m_{i=1}(h_{\theta}(x^{(i)})-y^{(i)})^2J(θ)=21​i=1∑m​(hθ​(x(i))−y(i))2
       其中线性函数如下:
hθ(x(i))=∑j=1nθjxj(i)=θTx(i)h_{\theta}(x^{(i)})=\sum_{j=1}^n\theta_jx_j^{(i)}=\theta^Tx^{(i)}hθ​(x(i))=j=1∑n​θj​xj(i)​=θTx(i)
       构建好线性回归模型的目标函数后,接下来就是求解目标函数的最优解,常用的梯度优化方法都可以使用。另外,线性回归也可以从最小二乘法的角度来看,下面先将样本表示向量化,X∈Rn∗m,Y∈RmX \in R^{n*m},Y \in R^mX∈Rn∗m,Y∈Rm那么目标函数向量化形式如下:
J(θ)=12(θTX−YT)(θTX−YT)TJ(\theta)=\frac{1}{2}(\theta^TX-Y^T)(\theta^TX-Y^T)^TJ(θ)=21​(θTX−YT)(θTX−YT)T
       可以看出目标函数是一个凸二次规划问题,其最优解在导数为0处取到:
∂J(θ)∂θ=θXXT−XY=>θ=(XXT)−1XY\frac{\partial J(\theta)}{\partial \theta}=\theta XX^T-XY=>\theta =(XX^T)^{-1}XY∂θ∂J(θ)​=θXXT−XY=>θ=(XXT)−1XY
       值得注意的上式中存在计算矩阵的逆,一般来讲当样本数大于数据维度时,矩阵可逆,可以采用最小二乘法求得目标函数的闭式解。当数据维度大于样本数时,矩阵线性相关,不可逆。此时最小化目标函数解不唯一,且非常多,出于这样一种情况,我们可以考虑奥卡姆剃刀准则来简化模型复杂度,使其不必要的特征对应的w为0。所以引入正则项使得模型中w非0个数最少。当然,岭回归,lasso回归的最根本的目的不是解决不可逆问题,而是防止过拟合。

2 岭回归和Lasso回归

岭回归的目标函数在一般的线性回归的基础上加入了正则项,在保证最佳拟合误差的同时,使得参数尽可能的“简单”,使得模型的泛化能力强(即不过分相信从训练数据中学到的知识)。正则项一般采用二范数,使得模型更具有泛化性。
       Lasso回归采用一范数来约束,使参数非零个数最少。而Lasso和岭回归的区别很好理解,在优化过程中,最优解为函数等值线与约束空间的交集,正则项可以看作是约束空间。可以看出二范的约束空间是一个球形,而一范的约束空间是一个方形,这也就是二范会得到很多参数接近0的值,而一范则尽可能非零参数最少。
       值得注意的是线性模型的表示能力有限,但是并不一定表示线性模型只能处理线性分布的数据。这里有两种常用的线性模型非线性化。对于上面的线性函数的构造,我们可以看出模型在以x0,x1,...,xnx_0,x_1,...,x_nx0​,x1​,...,xn​的坐标上是线性的,但是并不表示线性的模型就一定只能用于线性分布问题上。假如我们只有一个特征x0x_0x0​,而实际上回归值是y=x02y=x_0^2y=x02​,我们同样可以采用线性模型,因为我们完全可以把输入空间映射到高维空间(x13,x12,x11)(x_1^3,x_1^2,x_1^1)(x13​,x12​,x11​),其实这也是核方法以及PCA空间变换的一种思想,凡是对输入空间进行线性,非线性的变换,都是把输入空间映射到特征空间的思想,所以只需要把非线性问题转化为线性问题即可。另外一种是局部线性思想,即对每一个样本构建一个加权的线性模型。

3 局部加权线性回归

考虑到线性回归的表示能力有限,可能出现欠拟合现象。局部加权线性回归为每一个待预测的点构建一个加权的线性模型。其加权的方式是根据预测点与数据集中点的距离来为数据集中的点赋权重,当某点距离预测点较远时,其权重较小,反之较大。由于这种权重的机制引入使得局部加权线性回归产生了一种局部分段拟合的效果。由于该方法对于每一个预测点构建一个加权线性模型,都要重新计算与数据集中所有点的距离来确定权重值,进而确定针对该预测点的线性模型,计算成本高,同时为了实现无参估计来计算权重,需要存储整个数据集。

参考连接

参考

线性回归、岭回归和Lasso回归相关推荐

  1. 一文读懂线性回归、岭回归和Lasso回归

    (图片由AI科技大本营付费下载自视觉中国) 作者 | 文杰 编辑 | yuquanle 本文介绍线性回归模型,从梯度下降和最小二乘的角度来求解线性回归问题,以概率的方式解释了线性回归为什么采用平方损失 ...

  2. 【机器学习】正则化的线性回归 —— 岭回归与Lasso回归

    python风控评分卡建模和风控常识(博客主亲自录制视频教程) https://study.163.com/course/introduction.htm?courseId=1005214003&am ...

  3. lasso回归_一文读懂线性回归、岭回归和Lasso回归

    (图片由AI科技大本营付费下载自视觉中国) 作者 | 文杰 编辑 | yuquanle 本文介绍线性回归模型,从梯度下降和最小二乘的角度来求解线性回归问题,以概率的方式解释了线性回归为什么采用平方损失 ...

  4. python 最小二乘回归 高斯核_「机器学习」一文读懂线性回归、岭回归和Lasso回归...

    点击上方蓝色字体,关注AI小白入门哟 作者 | 文杰 编辑 | yuquanle 本文介绍线性回归模型,从梯度下降和最小二乘的角度来求解线性回归问题,以概率的方式解释了线性回归为什么采用平方损失,然后 ...

  5. [机器学习-实践篇]学习之线性回归、岭回归、Lasso回归,tensorflow实现的线性回归

    线性回归.岭回归.Lasso回归 前言 1.线性回归 2. 岭回归 3. Lasso回归 4. tensorflow利用梯度下降实现的线性回归 前言 本章主要介绍线性回归.岭回归.Lasso回归,te ...

  6. [机器学习-原理篇]学习之线性回归、岭回归、Lasso回归

    线性回归.岭回归.Lasso回归 前言 一,线性回归--最小二乘 二,Lasso回归 三,岭回归 四, Lasso回归和岭回归的同和异 五, 为什么 lasso 更容易使部分权重变为 0 而 ridg ...

  7. 机器学习总结(一):线性回归、岭回归、Lasso回归

    机器学习总结(一):线性回归.岭回归.Lasso回归 参考网址:https://blog.csdn.net/hzw19920329/article/details/77200475 主要是岭回归(脊回 ...

  8. 应用预测建模第六章-线性回归-预测化合物溶解度练习-R语言(多元线性回归,稳健回归,偏最小二乘回归,岭回归,lasso回归,弹性网)

    模型:多元线性回归,稳健回归,偏最小二乘回归,岭回归,lasso回归,弹性网 语言:R语言 参考书:应用预测建模 Applied Predictive Modeling (2013) by Max K ...

  9. 机器学习——线性回归衍生(过拟合、正则化、岭回归和LASSO回归)

    过拟合.正则化.岭回归.LASSO回归 为什么会出现线性回归的衍生方法--正规方程法的局限 过拟合 模型复杂度 过拟合的概念 防止过拟合的办法 正则化 岭回归(Ridge Regression) 1. ...

最新文章

  1. win10下安装Ubuntu后,启动时没有win10选项解决方法
  2. android动态设置冷启动图片拉伸变形,Android冷启动时间优化
  3. 我看360与酷派的“爱情”之争
  4. vue-自主研发非父子关系组件之间通信的问题
  5. IIS - 用户 NT AUTHORITY\NETWORK SERVICE 登录失败解决方法
  6. GC之7大垃圾收集器详解(下)
  7. SQLServer:用户自定义数据类型用法
  8. WordPress电影资源下载主题:zmovie
  9. U盘写保护,不能被格式化
  10. 自定义Drawable 实现图片圆角、圆形、椭圆形
  11. 为了入职蚂蚁金服,鬼知道我经历了什么.. 蚂蚁金服架构师面经
  12. Yii Framework 开发教程(36) Zii组件-DatePicker示例
  13. 鸿蒙系统充电动画,荣耀智慧屏首发抢先体验:电视只是小功能,鸿蒙系统才是真亮点...
  14. #三分法判断单峰函数最值#附加例题LA 5009
  15. echarts折线图无数据断开解决方法
  16. 网络营销实战课-好用的工具推荐
  17. 镀铬亮条怎么修复_汽车镀铬亮条生锈腐蚀怎么办如何修复
  18. java基于geotools实现的几何图形坐标系转换通用工具类,geotools几何坐标转换,java几何坐标转换
  19. dnf服务器维护中 启动游戏失败,dnf1月29日启动游戏失败怎么办 dnf提示客户端版本非法解决方法...
  20. asp.net医疗器械销售系统

热门文章

  1. 如何进行生产环境作业监控
  2. 操作系统常用缩写总结
  3. DS18B20高精度温度传感器,使用介绍【400字】【原创】
  4. php 正三角塔,以色列,耶路撒冷的中心地段,三角塔楼 / 里伯斯金
  5. Linux 手动修改屏幕分辨率
  6. Tomcat启动时卡在“ Deploying web application directory ”很久的解决方法
  7. 10月深圳礼品展即将启航 带你沉浸式逛展
  8. Arduino 常用函数参考文档
  9. JavaScript实现图片漂浮
  10. Chosen by god