R语言机器学习系列-决策树回归代码
在模型构建部分,二分类模型与回归模型大致相似,主要在rpart函数中多了parms参数可以设置,其值是一个list,其中可以指定分裂规则,将其设定为gini则构建CART决策树,将其设定为information则构建ID3决策树;还可以指定损失函数的权重,这个在遇到训练集样本不平衡的情况时比较有用,具体可以看下帮助文档。
初始决策树构建好之后,后剪枝、输出变量重要性、树形图的操作均与回归部分类似。
得到最后的决策树二分类模型之后,先预测训练集样本的概率,然后计算ROC,绘制ROC曲线,并依据约登法则确定最佳概率分界点,然后依据预测概率和分界点即可得到预测类别,最后实际类别和预测类别比较即可得到混淆矩阵。后续用于测试集可以得到预测概率和预测类别。
关于依据约登法则得到最佳概率分界点的步骤,可以跳过,即直接用0.5作为分界点;也可以用单独的验证集来确定。实际操作中,各种都有,大家自行把握。
# 构建模型
set.seed(42) # 固定交叉验证结果
fit_dt_cls <- rpart(
form_cls,
data = traindata,
method = "class", # 分类模型
parms = list(split = "gini"), # 分裂规则
control = rpart.control(cp = 0.001) # 复杂度参数
)
# 原始分类树
fit_dt_cls
# 复杂度相关数据
printcp(fit_dt_cls)
plotcp(fit_dt_cls, upper = "splits")
# 后剪枝
fit_dt_cls_pruned <- prune(
R语言机器学习系列-决策树回归代码相关推荐
- r语言svr模型_使用R语言建立一个决策树回归模型
决策树是一种简单但使用广泛的分类算法,根据目标变量的类型,决策树分为分类决策树(目标变量为因子型)与回归决策树(目标变量为连续数值型).在这里,我们使用R建议一个回归决策树模型. 决策树简单介绍 对于 ...
- R语言机器学习系列-随机森林回归代码解读
回归问题指的是因变量或者被预测变量是连续性变量的情形,比如预测身高体重的具体数值是多少的情形.整个代码大致可以分为包.数据.模型.预测评估4个部分,接下来逐一解读. 1.包部分,也就是加载各类包,包括 ...
- R语言机器学习篇——决策树
参考书籍:陈强.机器学习及R应用.北京:高等教育出版社,2020 "决策树"算法是一种非参数方法,它本质上也是一种"近邻"方法,因此本章分别介绍运用于回归问题以 ...
- R 回归 虚拟变量na_工具amp;方法 | R语言机器学习包大全(共45个包)
机器学习,是一门多学科交叉的人工智能领域的分析技术,它使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测. 目前,常见机器学习的研究方向主要包括决策树.随机森林.神经网络.贝叶斯学习和支 ...
- R语言机器学习Caret包(Caret包是分类和回归训练的简称)、数据划分、数据预处理、模型构建、模型调优、模型评估、多模型对比、模型预测推理
R语言机器学习Caret包(Caret包是分类和回归训练的简称).数据划分.数据预处理.模型构建.模型调优.模型评估.多模型对比.模型预测推理 目录
- R语言广义线性模型Logistic回归案例代码
R语言广义线性模型Logistic回归案例代码 在实际应用中,Logistic模型主要有三大用途: 1)寻找危险因素,找到某些影响因变量的"坏因素",一般可以通过优势比发现危险因素 ...
- r语言中残差与回归值的残差图_独家 | 手把手教你用R语言做回归后的残差分析(附代码)-阿里云开发者社区...
作者:Abhijit Telang 翻译:张睿毅 校对:丁楠雅 文章来源:微信公众号 数据派THU 本文介绍了做残差分析的方法及其重要性,以及利用R语言实现残差分析. 在这篇文章中,我们通过探索残差分 ...
- R语言机器学习与大数据可视化暨Python文本挖掘与自然语言处理核心技术研修
中国通信工业协会通信和信息技术创新人才培养工程项目办公室 通人办[2017] 第45号 "R语言机器学习与大数据可视化"暨"Python文本挖掘与自然语言处理" ...
- “R语言机器学习与大数据可视化”暨“Python文本挖掘与自然语言处理”核心技术高级研修班的通知
中国通信工业协会通信和信息技术创新人才培养工程项目办公室 通人办[2017] 第45号 "R语言机器学习与大数据可视化"暨"Python文本挖掘与自然语言处理" ...
- R语言rpartb包树回归模型构建:基于前列腺prostate数据集
R语言rpartb包树回归模型构建:基于前列腺prostate数据集 决策树是一种机器学习的方法.决策树的生成算法有ID3, C4.5和C5.0等.决策树是一种树形结构,其中每个内部节点表示一个属性上 ...
最新文章
- GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)
- 三天打工生活终于结束了
- Linux字符界面操作进阶
- 前端篇--------1.css学习笔记
- 基于语言模型的少样本学习 / 深度学习优化器基准测试 | 本周值得读
- 使用U盘安装Windows Server2008
- Linux运维实战之DNS的高级配置(转发器、视图等)
- 基于asp.net2 C#开发MapServer
- Android滑动到顶部悬停
- Linux电源管理(1)_整体架构
- 容差分析相关的计算公式
- 【车间调度】改进的帝国企鹅算法求解车间调度问题【含Matlab源码 2041期】
- 证券行业智慧化转型思考
- 教外谈(3):C/C++实现本地搜索引擎
- 2022国赛数学建模思路 - 案例:集成算法AdaBoost
- 35页危化品安全管理平台解决方案2022版
- 唤醒计算机教案,智慧课堂教学软件常态化丨镇江中山路实验小学用 智慧“唤醒”课堂...
- 【文献阅读】Proximal Policy Optimization Algorithms
- python处理心电图_【技术博客】Python玩转信号处理与机器学习入门
- 学习单片机的准备工作