原文链接:http://tecdat.cn/?p=24956

原文出处:拓端数据部落公众号

绘制分类或回归树的基本方法的 rpart() 函数只是调用 plot。然而,总的来说,结果并不漂亮。事实证明,一段时间以来,有一种更好的方法来绘制 rpart() 树。

我们可以大概浏览下如何实现,并且进一步研究。


# 绘制分类树图library(rpart) # 流行的决策树算法
library(party) # 替代决策树算法
library(partykit) # 将rpart对象转换为二叉树
data# 获取一些数据# 绘制大树
frm <- as.form
tee1 <- rpart
#
plot# 绘图很混乱
text
#
pr# 将对树进行绘图
vale=3 # 缩短变量名称# 对树进行交互式修剪
pp$obj # 以交互方式修剪树形
pp # 显示新的树木
#
#-------------------------------------------------------------------
rpart# 一个更合理的树
prp# 一个快速绘图
fayRpPot# 一个来自rattle的花式绘图
#
#-------------------------------------------------------------------
# 绘制一棵用RevoScaleR构建的树
# 构建一个模型公式
names
X <- as.vector
frm <- as.form
# 运行模型
DTree
# 绘制树形图
prp
faRaPlt

数据描述

Hill, LaPan, Li和Haney(2007)开发了模型来预测高含量屏幕中哪些细胞被很好地分割。该数据由2019年的119次成像测量组成。最初的分析使用1009个进行训练,1010个作为测试集(见称为案例的一栏)。

详细内容

结果类别包含在一个名为Class的因子变量中,水平为 "PS "表示分割不良,"WS "表示分割良好。

论文中使用的原始数据可以在Biomedcentral网站上找到。caret < 4.98的版本包含原始数据。现在的版本是经过修改的。首先,一些预测因子的几个离散版本(后缀为 "状态")被删除。第二,有几个最小值为0的倾斜预测因子(将受益于某种转换,如对数)。在这些字段中加入了1的常量值。AvgIntenCh2、FiberAlign2Ch3、FiberAlign2Ch4、SpotFiberCountCh4和TotalIntenCh2。

修剪和绘制树

加载数据后,脚本构建 rpart() 分类树。使用 plot() 绘制树会产生一些覆盖文本的黑云,这是您尝试绘制一棵大树所期望的典型结果。但是,pp() 在绘制树并仅使用默认设置显示其结构方面做得非常好。并且,使用指示 pr() 缩写变量名称的参数使绘图更具可读性。

接下来的几行代码展示了 pp() 的交互式修剪功能。分配对象 new.tree.1 的行 产生一个“实时”树图。使用鼠标修剪树,点击“退出”并重新绘制,您将得到一个相当不错的树顶部绘图。这是将树顶部的清晰图片获取到报告中的巧妙方法。

修剪后绘制更美观的树

tree.2,一个更合理的树,是仅仅接受rpart的结果。首先,使用默认设置使用 pp() 绘制这棵树,然后在下一行中,绘制该树。

此函数只是 pp() 函数的包装,但易于用于绘制分类树,并且是美学如何促进交流的一个很好的例子。每个节点框显示分类、该节点上每个类的概率(即以该节点为条件的类的概率)以及该节点使用的观察百分比。请注意虚线的使用如何倾向于强调节点而不是树本身,以及底部的叶子排列如何帮助查看者猜测节点框中的百分比表示到达每个节点的观察百分比节点。(底行增加到 100%)。

脚本的最后几行使用函数构造了一个树,用于构建具有大量数据集的分类和回归树模型。


最受欢迎的见解

1.从决策树模型看员工为什么离职

2.R语言基于树的方法:决策树,随机森林

3.python中使用scikit-learn和pandas决策树

4.机器学习:在SAS中运行随机森林数据分析报告

5.R语言用随机森林和文本挖掘提高航空公司客户满意度

6.机器学习助推快时尚精准销售时间序列

7.用机器学习识别不断变化的股市状况——隐马尔可夫模型的应用

8.python机器学习:推荐系统实现(以矩阵分解来协同过滤)

9.python中用pytorch机器学习分类预测银行客户流失

拓端tecdat|R语言分类回归决策树交互式修剪和更美观地可视化分析细胞图像分割数据集相关推荐

  1. 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...

  2. 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测

    最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...

  3. 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例

    最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...

  4. 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系

    最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...

  5. R语言logistic回归、判别分析(LDA)、多元自适应样条回归MARS分析案例:分析乳腺癌数据集明确细针穿刺肿瘤活检结果

    R语言logistic回归.判别分析(LDA).多元自适应样条回归MARS分析案例:分析乳腺癌数据集明确细针穿刺肿瘤活检结果 目录

  6. R语言高维数据的pca、 t-SNE算法降维与可视化分析案例报告

    维度降低有两个主要用例:数据探索和机器学习.它对于数据探索很有用,因为维数减少到几个维度(例如2或3维)允许可视化样本.然后可以使用这种可视化来从数据获得见解(例如,检测聚类并识别异常值).对于机器学 ...

  7. 数据分享|R语言逻辑回归、线性判别分析LDA、GAM、MARS、KNN、QDA、决策树、随机森林、SVM分类葡萄酒交叉验证ROC...

    全文链接:http://tecdat.cn/?p=27384 在本文中,数据包含有关葡萄牙"Vinho Verde"葡萄酒的信息(点击文末"阅读原文"获取完整代 ...

  8. R语言分类模型:逻辑回归模型LR、决策树DT、推理决策树CDT、随机森林RF、支持向量机SVM、Rattle可视化界面数据挖掘、分类模型评估指标(准确度、敏感度、特异度、PPV、NPV)

    R语言分类模型:逻辑回归模型LR.决策树DT.推理决策树CDT.随机森林RF.支持向量机SVM.Rattle可视化界面数据挖掘.分类模型评估指标(准确度.敏感度.特异度.PPV.NPV) 目录

  9. r语言svr模型_使用R语言建立一个决策树回归模型

    决策树是一种简单但使用广泛的分类算法,根据目标变量的类型,决策树分为分类决策树(目标变量为因子型)与回归决策树(目标变量为连续数值型).在这里,我们使用R建议一个回归决策树模型. 决策树简单介绍 对于 ...

  10. r语言解释回归模型的假设_模型假设-解释

    r语言解释回归模型的假设 Ever heard of model assumptions? What are they? And why are they important? A model is ...

最新文章

  1. 看看物联网架构,快速了解物联网
  2. python 制作gif-如何在线制作gif图片?
  3. SAP Spartacus翻译 i18n - internationalization 的工作原理
  4. nginx输出日志_ingressnginx持久化日志
  5. Typecho博客转移服务器,数据备份
  6. 解决UICollectionViewCell/UITableViewCell因重用机制导致的错乱问题
  7. 双缓冲(Double Buffer)原理和使用【转】
  8. lt;SCRIPT src=quot;../scripts/LoadWebOffice.jsquot;gt;lt;/SCRIPTgt;
  9. 【优化预测】基于matlab天牛须算法优化BP神经网络预测【含Matlab源码 1318期】
  10. 关于APP测试用例点
  11. 腾讯校招 针对找工作的小伙伴们
  12. 10php1c,很急的一個問題,請幫幫忙
  13. 软谋在线教育推荐好书(一)
  14. 关于Chrome播放视频黑屏解决办法。
  15. ROS系统MoveIt玩转双臂机器人系列(三)--利用controller控制实际机器人
  16. Ardupilot chibios IO固件,IO与FMU通信,固件下载(3)
  17. Jmeter(十一)参数化
  18. 梅科尔工作室-李舒婷-鸿蒙作业3
  19. JAV入门之IDEA的快捷键与辅助键 笔记(9)
  20. FS9401符合 Qi 标准的 5W无线充电接收IC

热门文章

  1. ASP.NET MVC中加载WebForms用户控件(.ascx)
  2. [Web开发] IE文档模式终极指南
  3. 从客户变成员工在租赁公司打工--我成为程序员所经历的(三)
  4. 3月25日 插值-样条插值
  5. PostgreSQL与MySQL的区别收集
  6. java中构造器的调用顺序
  7. Java基础知识2(字符串)
  8. Java集合之map 集合使用
  9. SAP 43亿美元收购Ariba 拓展云计算市场
  10. ld.so.conf.d配置文件