1   LARS算法简介
    Efron于2004年发表在Annals of Statistics的文章LEAST ANGLE REGRESSION中提出LARS算法,其核心思想是提出一种新的solution path(求解路径),即在已经入选的变量中,寻找一个新的路径,使得在这个路径上前进时,当前残差与已入选变量的相关系数都是相同的,直到找出新的比当前残差相关系数最大的变量。从几何上来看,当前残差在那些已选入回归集的变量们所构成的空间中的投影,是这些变量的角平分线。
2   LARS算法思路
    以下算法出自The Elementsof Statistical Learning 书中第3章。
    Algorithm LeastAngle Regression.
    1. Standardizethe predictors to have mean zero and unit norm. Start withthe residual r = y y^, β1, β2, .. . , βp = 0.
    将样本中心化,标准化。残差向量 r = y – y^ ,系数β初始化为0.
    2.Find the predictor xj mostcorrelated with r.
    寻找与残差向量相关系数最大的样本变量

1.png (379 Bytes)

下载附件  保存到相册

2014-11-9 17:25 上传

.

    3.Move βj from0 towards its least-squares coefficient <xj , r>,until some othercompetitor xk hasas much correlation with the current residual asdoes xj .
    系数

2.png (385 Bytes)

下载附件  保存到相册

2014-11-9 17:26 上传

沿最小二乘解的方向增大,直到另一个样本变量

3.png (387 Bytes)

下载附件  保存到相册

2014-11-9 17:34 上传

与残差的相关系数与当前的一样大。

    4.Move βj and βk  in the directiondefined by their joint least squares coefficient ofthe current residual on (xj , xk),until some other competitor xl hasas much correlation with the current residual.
    改变 βjβk,使游走点改变前进路径,沿着

6.png (508 Bytes)

下载附件  保存到相册

2014-11-9 17:34 上传

的角平分线方向继续移动,直到其他变量X与残差r的相关系数与当前系数一样大。

    5.Continue in this way until all p predictorshave been entered. After min(N − 1, p)steps, we arrive at the full least-squares solution.
    继续沿着这种方式前进,直到所有的p个变量都已经加入活动集。
    最终,所有变量都被选中,且残差向量r垂直于所以变量,求得最小二乘解。
3   LARS算法的几何意义
    Suppose Ak is the activeset of variables at the beginning of the kth step, and let βAk be thecoefficient vector for these variables at this step; there will be k −1 nonzerovalues, and the one just entered will be zero. If rk= yXAkβAkis the currentresidual, then the direction for this step is

5.png (1.5 KB)

下载附件  保存到相册

2014-11-9 17:34 上传


    假设样本共有3个3维变量(即矩阵中n=p=3),其中Y是因变量,是两个三维因变量。
    作图解释LARS算法的集合意义:
(1)
    Ak表示已选变量集合,在第1步中,选取与rk相关系数最大的变量(假设是X1)此时Ak集合中只有一个变量;
    rk= yXakβAk,表示当前变量集合下的残差向量;
    沿向量X1的路径前进,X1与残差rk的相关系数逐渐减小。

7.png (12.65 KB)

下载附件  保存到相册

2014-11-9 17:34 上传

(2)
当残差向量rk与X1的相关系数减少至与rk与X2的相关系数相等时,将X2加入Ak集合。此时XAk就是向量X1、X2所张成的平面。
此时需要重新选择solution path(求解路径)。Efron在文章中提出了一种找出满足LARS条件的solution path的解法。
    solution path需要使得已选入模型变量和当前残差的相关系数均相等。因此这样的路径选择它的方向很显然就是

8.png (885 Bytes)

下载附件  保存到相册

2014-11-9 17:34 上传

的指向(因为

9.png (1.17 KB)

下载附件  保存到相册

2014-11-9 17:34 上传

的元素都相同,保证了LARS的要求。

【注】此式中的X′即表示

10.png (390 Bytes)

下载附件  保存到相册

2014-11-9 17:34 上传

11.png (13.77 KB)

下载附件  保存到相册

2014-11-9 17:34 上传

    综上,δk 是指在加入新的变量X后,X与Y的残差的相关系数的估计,也就是图中角δk的余弦函数。(样本已经过中心化、标准化处理)
    The coefficientprofile then evolves as βAk (α) = βAk+α · δk. Exercise 3.23 verifies that the directions chosen in this fashion dowhat is claimed: keep the correlations tied and decreasing. If the fit vectorat the beginning of this step is ˆfk, then itevolves as ˆfk(α) = fk+ α · uk, where uk= XAkδk is the new fit direction. The name “least angle” arisesfrom a geometrical interpretation of this process; uk makes thesmallest (and equal) angle with each of the predictors in Ak (Exercise 3.24).
    以上一段说明了LARS中“最小角”的几何含义:
    所选路径必须保证已选入模型变量和当前残差的相关系数均最小且相等。因此需要选择旧路径与新变量夹角的角平分线方向作为新的路径方向。
4   Lasso 简介
    Lasso estimate的提出是Tibshirani在1996年JRSSB上的一篇文章Regressionshrinkage and selection via lasso。所谓lasso,其全称是least absolute shrinkage and selection operator。其想法可以用如下的最优化问题来表述:
    在限制了

12.png (842 Bytes)

下载附件  保存到相册

2014-11-9 17:34 上传

≤t的情况下,求使得残差平

13.png (633 Bytes)

下载附件  保存到相册

2014-11-9 17:34 上传

达到最小的回归系数的估值。

    Lasso estimate具有shrinkage和selection两种功能。关于selection功能,Tibshirani提出,当t值小到一定程度的时候,lasso estimate会使得某些回归系数的估值是0,这确实是起到了变量选择的作用。当t不断增大时,选入回归模型的变量会逐渐增多,当t增大到某个值时,所有变量都入选了回归模型,这个时候得到的回归模型的系数是通常意义下的最小二乘估计。从这个角度上来看,lasso也可以看做是一种逐步回归的过程。
5   用LARS求解Lasso回归
     如下图显示LAR和Lasso的轨迹图十分相似,它们选取变量一致,都以最小二乘为目的方向,系数也一致。

14.png (45.35 KB)

下载附件  保存到相册

2014-11-9 17:34 上传

    从几何角度解释二者相似的原因:

15.png (92.42 KB)

下载附件  保存到相册

2014-11-9 17:34 上传

5.2   两者的差异
    两者的差异在于LAR没有考虑Lasso的限制条件:

16.jpg (3.96 KB)

下载附件  保存到相册

2014-11-9 17:34 上传

    因此在当系数穿越0时会超出条件,LAR不理会限制条件会继续沿着路径前进,而Lasso会顾虑限制条件,改变方向,从而在L1继续增大时β2暂时仍为0,直至条件允许。

17.png (65.46 KB)

下载附件  保存到相册

2014-11-9 17:34 上传

6  一种修正的LARS算法
    Efron提出了一种修正的LARS算法,可以用修正的LARS算法来求解所有的lasso estimates。下面我介绍一下这种修正的LARS算法。
首先假设我们已经完成了几步LARS steps。这时候,我们已经有了一个回归变量集,我们记这个回归变量集为XA。这个集合就对应着一个对于Y的估计,我们记为μ^A。这个估值对应着一个lasso方法对于响应的估值(这里我认为LARS估值和lasso估值应该是一样的),lasso的估值,对应着回归系数的lasso估值,回归系数向量的lasso估值我们记为β^。
    为了继续进行下一步,我们先给出一个向量的表达式,然后再解释一下它

18.png (1.58 KB)

下载附件  保存到相册

2014-11-9 17:34 上传

    XAwA就是LARS算法的在当前回归变量集下的solution path。那么我们可以把wA作为β的proceed的path。Efron定义了一个向量d^,这个向量的元素是sjwj,其中sj是入选变量xj与当前残差的相关系数的符号,也是βj^的符号。对于没有入选的变量,他们对应在d^中的元素为0。也就是对应着μ(r)=Xβ(r),我们有

19.png (1.02 KB)

下载附件  保存到相册

2014-11-9 17:34 上传

    将LARS的solution path对应到lasso estimate的path上,这种对应的想法非常值得借鉴。
    很显然,βj(r)会在

20.png (829 Bytes)

下载附件  保存到相册

2014-11-9 17:34 上传

处变号。那么对于我们已经有的lasso estimateβ(r),它中的元素会在最小的的那个大于0的rj处变号。我们记之为rˉ。如果没有rj大于0,那么rˉ就记为无穷大。

    对于LARS本身而言,在已经有了如今的回归变量集和当前残差的基础上,我们就会有条solution path,在这个solution path上proceed的最大步记为r^.通过比较r^和rˉ就会有进一步的想法。Efron的文章证明了如果rˉ小于r^,则对应于LARS估计的那个βj(r)不会成为一个lasso estimation。(这个是因为当前残差和对应变量的相关系数的符号一定是和该变量的系数符号一致才行)。在这种情况下,我们就不能继续在LARS的solution path上继续前进了,为了利用LARS算法求得lasso estimate,Efron提出把rˉ所对应的那个rj所对应的xj从回归变量中去掉。去掉之后再计算当前残差和当前这些变量集之间的相关系数,从而确定一条新的solution path,继续进行LARS step。这样进行下去,可以通过LARS算法得到所有的lasso estimate。
    这个对于LARS的lasso修正算法,被Efron称作“one at a time”条件,也就是每一步都要增加或删掉一个变量。下图显示了用修正了的LARS算法求lasso estimate的过程。
7  参考资料
    1.  统计之都.LARS算法简介.郝智恒
    http://cos.name/2011/04/an-introduction-to-lars/
    2. 统计之都.修正的LARS算法和lasso.郝智恒
    http://cos.name/2011/04/modified-lars-and-lasso/
    3.  练数成金.画图解释LAR算法的一系列向量的几何意义. jojo267187000
    http://f.dataguru.cn/thread-324126-1-1.html
    4. 练数成金.机器学习第三周第二题. RealFace
    http://www.dataguru.cn/forum.php?mod=viewthread&tid=271335
    By Solomon
    2014年11月9日星期日

LARS算法的几何意义相关推荐

  1. LARS回归算法的几何意义

    LARS算法的几何意义 1. LARS算法简介 Efron于2004年发表在Annals of Statistics的文章LEAST ANGLE REGRESSION中提出LARS算法,其核心思想是提 ...

  2. lasso,lars算法详细推导过程-数学

    首发于程序员的伪文艺 关注专栏写文章 从Lasso开始说起 李新春 既可提刀立码,行遍天下:又可调参炼丹,卧于隆中. ​关注他 317 人赞同了该文章 Lasso是Least Absolute Shr ...

  3. ML之PLiR之LARS:利用LARS算法求解ElasticNet回归类型(包括类别编码+属性重要程度排序)问题(实数值年龄预测)

    ML之PLiR之LARS:利用LARS算法求解ElasticNet回归类型(包括类别编码+属性重要程度排序)问题(实数值年龄预测) 目录 输出结果 设计思路 核心代码 输出结果 设计思路 核心代码 x ...

  4. ML之分类预测之LARS:利用回归工具将二分类转为回归问题并采用LARS算法构建分类器

    ML之分类预测之LARS:利用回归工具将二分类转为回归问题并采用LARS算法构建分类器 目录 输出结果 设计思路 代码实现 输出结果 ['V10', 'V48', 'V44', 'V11', 'V35 ...

  5. ML之PLiR之LARS:利用LARS算法求解ElasticNet回归类型问题(实数值评分预测)

    ML之PLiR之LARS:利用LARS算法求解ElasticNet回归类型问题(实数值评分预测) 目录 设计思路 输出结果 1.LARS 2.10-fold cross validation 实现代码 ...

  6. 最小角回归 LARS算法包的用法以及模型参数的选择(R语言 )

    Lasso回归模型,是常用线性回归的模型,当模型维度较高时,Lasso算法通过求解稀疏解对模型进行变量选择.Lars算法则提供了一种快速求解该模型的方法.Lars算法的基本原理有许多其他文章可以参考, ...

  7. LARS 算法简介-机器学习

    https://cosx.org/2011/04/modified-lars-and-lasso/ 查看全文 http://www.taodudu.cc/news/show-64111.html 相关 ...

  8. LARS算法探究LOL比赛各数据对胜负的影响

    昨天搞完二叉决策树刷了一会儿玩加赛事,发现他们给出了lck,eu,na和入围赛的数据,刚好最近刚学完惩罚线性回归机器学习模型,就着手打算一边学着书上的模型一边用这个职业赛场的数据看看lol比赛背后的输 ...

  9. 速神经网络的训练算法LARS/LAMB工作原理 --UC Berkeley在读博士生尤洋

    为什么深度学习很慢? 如果我们利用并行计算,怎样才能完美的利用大量的processor? 为什么large batch size会引起精度降低? 新优化器 参考: 快速神经网络的训练算法 --UC B ...

最新文章

  1. 对‘pthread_create’未定义的引用_驾驭香辣调味油制作的巧劲,这三组香料组合拳劲道十足,容易引用...
  2. 爬虫简单入门:第一个简单爬虫
  3. 6-3 逆序数据建立链表
  4. WebRTC十周年、Space X成功对接国际空间站、TikTok复制品Zynn或有快手支持|Decode the Week...
  5. Win7 x64 PL/SQL 连接 Oralce 提示 Could not initialize %ORACLE_HOME%\bin\oci.dll
  6. .net core 使用RSA获取私钥证书并签名
  7. 亚马逊消费者业务宣布永久关闭 Oracle 数据库,去O新进展;华为发布最新5G全系列解决方案;苹果正研究新设备“智能戒指”……...
  8. python网球比赛模拟_【Python】以模块化做比赛模拟
  9. netty权威指南第三版_Hadoop权威指南(第二版及第三版)
  10. CentOS 7安装Gnome GUI 图形界面
  11. linux 存文件格式,windows保存的文件传输到linux中格式转换
  12. [深度学习] 池化层函数及其逆过程函数
  13. 最强联合!北大清华互相开放本科课程(附课程名单)
  14. 动易 转 html5,动易系统所有标签解释5
  15. 如何有效提升软件测试质量?
  16. nexus下载安装和创建maven私库
  17. NTC热敏电阻阻值-温度对照表
  18. 服务器固件测试--PCI设备的介绍(集成网卡和外插网卡)
  19. ps的cc版本安装包以及破解包
  20. CSS3nbsp;Transitionnbsp;Transformnbsp;Animat…

热门文章

  1. 虚拟机vmare安装CentOS7详细教程
  2. Unity 编辑器开发实战【Custom Editor】- 为UI视图制作动画编辑器
  3. ENVE5.3安装与汉化(一次性安装成功附安装包)
  4. 使用C# 创建windows 服务
  5. Web应用程序 [/XXX_war_exploded] 注册了JDBC驱动程序 [com.mysql.cj.jdbc.Driver],但在Web应用程序停止时无法注销它。
  6. 真正手把手教你玩转Git
  7. Learning AV Foundation(三)AVAudioRecorder
  8. Nginx + uWSGI + Python + Django搭建一款只属于自己的壁纸网站
  9. php 判断是否汉字
  10. D2. Two Hundred Twenty One (hard version)