拓端tecdat|r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现
原文链接:http://tecdat.cn/?p=3795
原文出处:拓端数据部落公众号
介绍
Glmnet是一个通过惩罚最大似然来拟合广义线性模型的包。正则化路径是针对正则化参数λ的值网格处的套索或弹性网络罚值计算的。该算法速度极快,可以利用输入矩阵中的稀疏性x。它符合线性,逻辑和多项式,泊松和Cox回归模型。可以从拟合模型中做出各种预测。它也可以适合多响应线性回归。
相关 视频:Lasso回归、岭回归等正则化回归数学原理及R语言实例
Lasso回归、岭回归等正则化回归数学原理及R语言实例
glmnet算法采用循环坐标下降法,它连续优化每个参数上的目标函数并与其他参数固定,并反复循环直至收敛。该软件包还利用强大的规则来有效地限制活动集。由于高效的更新和技术,如热启动和主动集合收敛,我们的算法可以非常快地计算解决方案路径。
该代码可以处理稀疏的输入矩阵格式,以及系数的范围约束。其核心glmnet是一组Fortran子程序,它们使执行速度非常快。
该软件包还包括用于预测和绘图的方法以及执行K倍交叉验证的功能。
首先,我们加载glmnet包:
library(glmnet)## Loading required package: Matrix## Loaded glmnet 1.9-9
包中使用的默认模型是高斯线性模型或“最小二乘”,我们将在本节中演示。我们加载一组预先创建的数据用于说明。用户可以加载自己的数据,也可以使用保存在工作区中的数据。
load("QuickStartExample.RData")
该命令从该保存的R数据档案中加载输入矩阵x和响应向量y。
我们使用最基本的呼叫来适应模型glmnet。
fit=glmnet(x,y)
“适合”是类的一个对象,glmnet它包含拟合模型的所有相关信息以供进一步使用。我们不鼓励用户直接提取组件。相反,提供对象,如各种方法plot,print,coef和predict,使我们能够更优雅执行这些任务。
我们可以通过执行plot函数来显示系数:
MSE 测试集
我们看到lasso(alpha=1)在这里做的最好。我们也看到,使用的lambda的范围与alpha不同。
系数上限和下限
这些是最近添加的增强模型范围的功能。假设我们想要拟合我们的模型,但将系数限制为大于-0.7且小于0.5。这是很容易通过实现upper.limits和lower.limits参数:
惩罚因素
该参数允许用户对每个系数应用单独的惩罚因子。其每个参数的默认值为1,但可以指定其他值。特别是,任何penalty.factor等于零的变量都不会受到惩罚!让[ 数学处理错误]vĴ表示[ 数学处理错误]的惩罚因子Ĵ变量。罚款期限变为[ 数学处理错误] 请注意,惩罚因子在内部重新调整为与nvars相加。
当人们对变量有先验知识或偏好时,这非常有用。在很多情况下,一些变量可能非常重要,以至于一直想要保持这些变量,这可以通过将相应的惩罚因子设置为0来实现:
拓端tecdat|r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现相关推荐
- 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险
最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...
- 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测
最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...
- 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系
最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...
- 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例
最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...
- 1071svm函数 r语言_如何利用R语言中的rpart函数建立决策树模型
决策树是根据若干输入变量的值构造出一个适合的模型,以此来预测输出变量的值,并用树形结构展示出来.决策树主要有两个类别:分类树和回归树.分类树主要针对离散的目标变量,回归树则针对连续的目标变量.R语言中 ...
- r语言中c函数错误,R语言中c()函数与paste()函数的区别说明
c()函数:将括号中的元素连接起来,并不创建向量 paste()函数:连接括号中的元素 例如 c(1, 2:4),结果为1 2 3 4 paste(1, 2:4),结果为"1 2" ...
- r语言中的shiny教程_如何使用Shiny在R中编写Web应用程序
r语言中的shiny教程 新年快乐! 这个月我忙于撰写一些较大的文章,因此请在接下来的几周内查找这些文章. 对于本月的Nooks和Crannies,我想简要指出一个我一直在用它进行自我教育的出色R库. ...
- R语言中if语句使用方法之超详细教程
在R语言中,if属于一种分支结构,即根据某个条件执行相关的语句.R中的if语句与else配合主要有3种结构. 单个if语句 if(cond) {expr} 其它语句 即当括弧中的cond条件为TRUE ...
- R语言中GCC编译的问题(续)
这篇文章承接R语言中GCC编译的问题,这篇文章主要解决我在Linux系统上安装"expm"出现的问题. 出现的问题 这个问题非常的有趣,因为我在两台服务器分别安装同一个包,其中一台 ...
- r语言中paste函数_R中的paste()函数-简要指南
r语言中paste函数 Using the paste() function in R will be straight and simple. In this tutorial let's see ...
最新文章
- /dev/urandom
- 理性解读中国科技实力:不震惊式吹捧,也不全盘抹杀
- 用Unity3D实现简单的井字棋小游戏
- POJ - 3268 Silver Cow Party(最短路)
- 单片机与PC机一样都是计算机,51单片机与PC机通信资料
- web安全之XSS基础-常见编码科普
- LeetCode 892. 三维形体的表面积
- java 删除.svn_使用JAVA的程序删除项目中的SVN目录
- Java图书管理系统
- CISA,CISM,CISSP证书区别及cisp,oscp,osce,che简介
- 【重识云原生】第四章云网络第二节——相关基础知识准备
- 基于STM32C8T6的蓝牙PS4遥控小车手柄
- 用svn上的文件,覆盖本地文件
- 早期/天使科技投资逻辑
- java抽奖活动_java抽奖思路
- java木马_Java校验上传图片文件是否含有木马的两种方式
- AI面临产业大考:落地虽难,但产业化路径已日渐清晰
- 安装算量软件哪个速度快效率高?
- Word粘贴参考文献格式问题
- Unity计算着色器 01
热门文章
- OCS 2007 R2搭建准备虚机及快照
- 中国将在大连建立下一个硅谷
- 【超参数】深度学习中 number of training epochs,iteration,batch-size
- 对应点集配准的四元数法(ICP算法中的一个关键步骤)
- 完全分布式安装Hadoop,Hive,Hbase,Hwi,Zookeeper
- 对通用查询组件初始化组织过滤条件
- 前端工程精粹(二):静态资源管理与模板框架
- IIS配置aspnet常见为题
- 通过刷bios的方式在win8.1平板上启动windows phone模拟器
- CentOS 5.4安装rar