决策树回归

首先采用rpart包的rpart函数训练决策树模型,需要指定公式、数据集,将模型设定为回归模型,也就是将method设定为anova,最后是控制参数,主要是一些控制决策树生长的预剪枝参数,包括设定树的深度、叶子节点样本量、复杂度参数等,具体可以查阅函数帮助文档。

其次输出前述模型的结果,即初始树,同时输出复杂度相关表格和图形。依据这些表格和图形可以确定一个最佳的cp值,进而进行下一步后剪枝。经过后剪枝的决策树,也就是我们最后确定下来的决策树模型,用于后续的输出和预测。

最后输出决策树相关的图形,包括变量重要性条形图、树形图。

# 训练模型
# rpart参考文档
set.seed(42) # 固定交叉验证结果
fit_dt_reg <- rpart(
  form_reg, # formula
  data = traindata,
  method = "anova", # 回归
  # 回归模型无parms参数
  control = rpart.control(cp = 0.005)
)
# 原始回归树
fit_dt_reg
# 复杂度相关数据
printcp(fit_dt_reg)
plotcp(fit_dt_reg)# 后剪枝
fit_dt_reg_pruned <- prune(fit_dt_reg, cp = cp1SE)
print(fit_dt_reg_pruned)
summary(fit_dt_reg_pruned)# 变量重要性数值
fit_dt_reg_pruned$variable.importance
# 变量重要性图示
varimpdata <-
  data.frame(importance = fit_dt_reg_pruned$variable.importance)
g

R语言实战应用精讲50篇(三十一)-R语言实现决策树(附R语言代码)相关推荐

  1. R语言实战应用精讲50篇(十三)-如何使用JAVA调用R语言,两种语言的完美结合

    前言 为什么要用java调用R? Java作为一个非常流行的编程语言,具有功能强大和简单易用两个特征.Java语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员以优雅的思维方式进 ...

  2. R语言实战应用精讲50篇(十一)-单因素方差分析 | 事后两两多重比较 | 趋势方差分析

    示例 关于Excel数据指标分析,已经上传到个人资源,以下是链接,需要的小伙伴可自取. Excel数据分析工具库(t检验.Z检验.方差分析.回归.协方差.相关系数.双样本方差分析) https://d ...

  3. R语言实战应用精讲50篇(十六)--如何实现文字云可视化

    前言 本文跟大家分享R语言信息可视化--文字云. R语言可以轻松处理信息可视化,并且很早就有专用的信息可视化包--WordCloud. 以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支 ...

  4. R语言实战应用精讲50篇(十八)-R语言实现分词、词频与词云案例解析

    前言 我真的超爱R语言,原因之一就是R有许多已经写好."开箱即用"的程序包可以直接拿来用:要知道,程序包减少了多少工作量.当然,其他语言也有类似的包,但是貌似没那么多.没那么细.这 ...

  5. R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程

    1. 数据分析的开端,Tidyverse? tidyverse 是一个清晰的 R 包集合,在数据操作.探索和可视化领域提供统一的数据科学解决方案,这些解决方案具有共同的设计理念.它是由 RStudio ...

  6. R语言实战应用精讲50篇(二十九)-R语言算法应用案例:路径路网轨迹绘图分析(英国自行车数据库)

    本文主要介绍R包 PCT , 其目标是提高 Propensity to Cycle Too (PCT) 生成的数据的可访问性和可重复性,托管在 www.pct.bike 上. 英格兰和威尔士的自行车使 ...

  7. R语言实战应用精讲50篇(十五)-R语言如何实现数据的导入导出操作

    1.使用键盘输入数据 在导入数据比较少的时候,我们使用这种方法.R中的函数 edit() 会自动调用一个允许手动输入数据的文本编辑器.具体步骤如下: (1) 创建一个空数据框(或矩阵) ,其中变量名和 ...

  8. R语言实战应用精讲50篇(九)-正态分布的检验

    前言 关于Excel数据指标分析,已经上传到个人资源,以下是链接,需要的小伙伴可自取. Excel数据分析工具库(t检验.Z检验.方差分析.回归.协方差.相关系数.双样本方差分析) https://d ...

  9. R语言实战应用精讲50篇(七)-因子

    关于Excel数据指标分析,已经上传到个人资源,以下是链接,需要的小伙伴可自取. Excel数据分析工具库(t检验.Z检验.方差分析.回归.协方差.相关系数.双样本方差分析) https://down ...

  10. R语言实战应用精讲50篇(三)-多重线性回归系列之模型评估与诊断应用案例

    前言 回归模型对数据的拟合性怎么样,有没有异常点,各自变量间存不存在多重共线? 本文进行拟合优度的评估.异常点(离群值.高杠杆值.强影响点)的识别与多重共线的诊断. 模型评估与诊断 (1)模型拟合优度 ...

最新文章

  1. js的Prototype属性 解释及常用方法
  2. 仓库管理员怎样做台账_工作日志之仓库管理员与会计之间的对接工作
  3. Tomcat 相关配置
  4. 【 iOS 应用开发 】 UIKit 控件 ( 代码生成控件 | UIView 属性方法 | Storyboard | Bundle | Property List | 动画 | 图片内存优化 )
  5. 一个关于用户体验的思考
  6. 使用阿里云智能翻译接口案例——CSDN博客
  7. Java语法基础,课后实践
  8. 图像滤镜艺术---Wave滤镜
  9. java服务器 protobuf_服务器端用PHP,客户端用JAVA,通过protobuf互相通信[原创] | 学步园...
  10. 14款CSS3图片层叠切换动画
  11. 分组数据方差公式_用Excel算分组方差《excel怎么求分组的数据的标准差》
  12. curl常用命令的使用
  13. 实现Office文档的在线查看等功能
  14. 快递业大动作!京东已收购德邦快递?最新回应
  15. Web安全之Sql注入漏洞
  16. linux 774是什么权限,7.6 Linux用户与文件权限操作实例
  17. c语言define需要分号骂,C语言中define的用法
  18. 中小学青少年编程创意机器人相关技术等级考试资料(含下载链接)
  19. 2018年程序员涨薪必备——24本经典纸质书
  20. 数字孪生城市框架与发展建议

热门文章

  1. 一、Spring Boot整合redies
  2. 南方cass快捷键命令修改在哪_南方cass快捷键大全_南方cass快捷键命令大全_好特教程...
  3. Java 大白话讲解设计模式之 -- 建造者(Builder)模式
  4. 如何修改云服务器连接密码错误,如何修改云服务器连接密码
  5. java如何进行性能调优,Java性能调优常用方法
  6. 非极大值抑制(Non-Maximum-Suppression)
  7. python全栈教程 pdf_马哥python全栈+爬虫+高端自动化课程大纲 (2018版) 全套视频教程【MP4】【65.22GB】...
  8. python全栈马哥_马哥2018python全栈+爬虫+高端自动化,资源教程下载
  9. spring定时器的使用
  10. 文献阅读(19)ISSCC 2020