在模型构建部分,二分类模型与回归模型大致相似,主要在rpart函数中多了parms参数可以设置,其值是一个list,其中可以指定分裂规则,将其设定为gini则构建CART决策树,将其设定为information则构建ID3决策树;还可以指定损失函数的权重,这个在遇到训练集样本不平衡的情况时比较有用,具体可以看下帮助文档。

初始决策树构建好之后,后剪枝、输出变量重要性、树形图的操作均与回归部分类似。

得到最后的决策树二分类模型之后,先预测训练集样本的概率,然后计算ROC,绘制ROC曲线,并依据约登法则确定最佳概率分界点,然后依据预测概率和分界点即可得到预测类别,最后实际类别和预测类别比较即可得到混淆矩阵。后续用于测试集可以得到预测概率和预测类别。

关于依据约登法则得到最佳概率分界点的步骤,可以跳过,即直接用0.5作为分界点;也可以用单独的验证集来确定。实际操作中,各种都有,大家自行把握。

# 构建模型
set.seed(42) # 固定交叉验证结果
fit_dt_cls <- rpart(
  form_cls,
  data = traindata,
  method = "class", # 分类模型
  parms = list(split = "gini"), # 分裂规则
  control = rpart.control(cp = 0.001) # 复杂度参数
)
# 原始分类树
fit_dt_cls
# 复杂度相关数据
printcp(fit_dt_cls)
plotcp(fit_dt_cls, upper = "splits")
# 后剪枝
fit_dt_cls_pruned <- prune(

R语言机器学习系列-决策树回归代码相关推荐

  1. r语言svr模型_使用R语言建立一个决策树回归模型

    决策树是一种简单但使用广泛的分类算法,根据目标变量的类型,决策树分为分类决策树(目标变量为因子型)与回归决策树(目标变量为连续数值型).在这里,我们使用R建议一个回归决策树模型. 决策树简单介绍 对于 ...

  2. R语言机器学习系列-随机森林回归代码解读

    回归问题指的是因变量或者被预测变量是连续性变量的情形,比如预测身高体重的具体数值是多少的情形.整个代码大致可以分为包.数据.模型.预测评估4个部分,接下来逐一解读. 1.包部分,也就是加载各类包,包括 ...

  3. R语言机器学习篇——决策树

    参考书籍:陈强.机器学习及R应用.北京:高等教育出版社,2020 "决策树"算法是一种非参数方法,它本质上也是一种"近邻"方法,因此本章分别介绍运用于回归问题以 ...

  4. R 回归 虚拟变量na_工具amp;方法 | R语言机器学习包大全(共45个包)

    机器学习,是一门多学科交叉的人工智能领域的分析技术,它使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测. 目前,常见机器学习的研究方向主要包括决策树.随机森林.神经网络.贝叶斯学习和支 ...

  5. R语言机器学习Caret包(Caret包是分类和回归训练的简称)、数据划分、数据预处理、模型构建、模型调优、模型评估、多模型对比、模型预测推理

    R语言机器学习Caret包(Caret包是分类和回归训练的简称).数据划分.数据预处理.模型构建.模型调优.模型评估.多模型对比.模型预测推理 目录

  6. R语言广义线性模型Logistic回归案例代码

    R语言广义线性模型Logistic回归案例代码 在实际应用中,Logistic模型主要有三大用途: 1)寻找危险因素,找到某些影响因变量的"坏因素",一般可以通过优势比发现危险因素 ...

  7. r语言中残差与回归值的残差图_独家 | 手把手教你用R语言做回归后的残差分析(附代码)-阿里云开发者社区...

    作者:Abhijit Telang 翻译:张睿毅 校对:丁楠雅 文章来源:微信公众号 数据派THU 本文介绍了做残差分析的方法及其重要性,以及利用R语言实现残差分析. 在这篇文章中,我们通过探索残差分 ...

  8. R语言机器学习与大数据可视化暨Python文本挖掘与自然语言处理核心技术研修

    中国通信工业协会通信和信息技术创新人才培养工程项目办公室 通人办[2017] 第45号 "R语言机器学习与大数据可视化"暨"Python文本挖掘与自然语言处理" ...

  9. “R语言机器学习与大数据可视化”暨“Python文本挖掘与自然语言处理”核心技术高级研修班的通知

    中国通信工业协会通信和信息技术创新人才培养工程项目办公室 通人办[2017] 第45号 "R语言机器学习与大数据可视化"暨"Python文本挖掘与自然语言处理" ...

  10. R语言rpartb包树回归模型构建:基于前列腺prostate数据集

    R语言rpartb包树回归模型构建:基于前列腺prostate数据集 决策树是一种机器学习的方法.决策树的生成算法有ID3, C4.5和C5.0等.决策树是一种树形结构,其中每个内部节点表示一个属性上 ...

最新文章

  1. GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)
  2. 三天打工生活终于结束了
  3. Linux字符界面操作进阶
  4. 前端篇--------1.css学习笔记
  5. 基于语言模型的少样本学习 / 深度学习优化器基准测试 | 本周值得读
  6. 使用U盘安装Windows Server2008
  7. Linux运维实战之DNS的高级配置(转发器、视图等)
  8. 基于asp.net2 C#开发MapServer
  9. Android滑动到顶部悬停
  10. Linux电源管理(1)_整体架构
  11. 容差分析相关的计算公式
  12. 【车间调度】改进的帝国企鹅算法求解车间调度问题【含Matlab源码 2041期】
  13. 证券行业智慧化转型思考
  14. 教外谈(3):C/C++实现本地搜索引擎
  15. 2022国赛数学建模思路 - 案例:集成算法AdaBoost
  16. 35页危化品安全管理平台解决方案2022版
  17. 唤醒计算机教案,智慧课堂教学软件常态化丨镇江中山路实验小学用 智慧“唤醒”课堂...
  18. 【文献阅读】Proximal Policy Optimization Algorithms
  19. python处理心电图_【技术博客】Python玩转信号处理与机器学习入门
  20. 学习单片机的准备工作

热门文章

  1. PLSQL使用教程(一):同步表结构和表数据
  2. YDOOK:STM32: 芯片在线需求选型工具
  3. 生信技能树linux虚拟机,Linux 20题-生信技能树
  4. OpenCV——Haar特征
  5. 2022年电子考研经验分享,本科双非,一志愿南航,调剂国科大上岸
  6. Linux基础知识大全(持续更新)
  7. 测试人员必掌握的测试文档
  8. 《css世界》中深藏不露的width:auto;总结
  9. 2022年中式烹调师(技师)考试题库及答案
  10. vb.net读取写入EXCEl的终极方法-NOPI。