决策树分析

1.文档读取

data <- read.csv(file.choose(),header=TRUE) </cenetr>
View(data)

2.建立训练数据与测试数据

set.seed(12345)
select <- sample(1:nrow(data),nrow(data)*0.7)
train <- data[select,]
test <- data[-select,]

3、建立模型

library(rpart)
library(rpart.plot)CART.tree <- rpart(Class ~ ., data=train, control=rpart.control(minsplit=2, cp=0))
rpart.plot(CART.tree)

3、模型检验及评价

CART.Prediction <- predict(CART.tree, newdata=test, type='class')Results <- table(Prediction=CART.Prediction, Actual=test$Class)
ResultsCorrect_Rate <- sum(diag(Results)) / sum(Results)
Correct_Rate

4、查找CP并重组检测模型

CART.tree <- prune(CART.tree, cp=0.03)
rpart.plot(CART.tree)CART.Prediction <- predict(CART.tree, newdata=test, type='class')results <- table(Prediction=CART.Prediction, Actual=test$Class)
resultsCorrect_Rate <- sum(diag(results)) / sum(results)
Correct_Rate

问题区:

  1. set.seed(12345)

说明:在此模型中,关于随机种子数的设置会导致实验数据出现异同尽管随机种子在众多博客中只是标识性作用,但实质上在本分析中改变了模型的准确率

  1. 联系方式: crays_1995@foxmail.com

R语言——一秒决策树分析相关推荐

  1. 数据分享|R语言因子分析、相关性分析大学生兼职现状调查问卷数据可视化报告...

    全文链接:http://tecdat.cn/?p=31765 随着大学的普及教育,大学生就业形势变得更加困难,很多学生都意识到这个问题(点击文末"阅读原文"获取完整代码数据). 相 ...

  2. R语言Kaplan-Meier绘制生存分析、Log-rank假设检验、Cox回归曲线实战案例:恶性黑色素瘤的术后数据生存分析

    R语言Kaplan-Meier绘制生存分析.Log-rank假设检验.Cox回归曲线实战案例:恶性黑色素瘤的术后数据生存分析 目录

  3. R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析详解实战:拟合连续性自变量和事件风险之间的关系:基于survival包lung数据

    R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析详解实战:拟合连续性自变量和事件风险之间的关系:基于survival包lung数据 目录

  4. R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析:拟合连续性自变量和事件风险之间的关系并绘制直方图、平滑曲线、双Y轴于同一个图像中

    R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析:拟合连续性自变量和事件风险之间的关系并绘制直方图.平滑曲线.双Y轴于同一个图像中 目录

  5. R语言教程:生存分析

    生存分析处理预测特定事件将要发生的时间.它也被称为故障时间分析或分析死亡时间.例如,预测患有癌症的人将存活的天数或预测机械系统将失败的时间. 命名为survival的R语言包用于进行生存分析.此包包含 ...

  6. R语言基础数据分析—单因素方差分析

    有了试验数据,我们就需要进行数据的处理与分析,而在试验设计中,通常分为单因素试验或者双因素试验.试验中要考察的指标称为试验指标,影响试验指标的条件称为因素,因素所处的状态称为水平,若试验中只有一个因素 ...

  7. 【R语言文本挖掘】:分析单词和文档频率——TF-IDF

    [R语言文本挖掘]:分析单词和文档频率--TF-IDF

  8. r语言进行go富集分析_R语言-GO富集分析的超几何检验和可视化

    Gene Ontology 可分为分子功能(Molecular Function),生物过程(biological process)和细胞组成(cellular component)三个部分.蛋白质或 ...

  9. R语言画图的实例分析,坐标轴,图例等设置

    通过一个具体的案例对R语言的画图进行分析,主要包括辅助线的添加,plot()函数的基本参数设置,以及图例坐标轴的设置. 案例分析 ##数据的输入, dose  <- c(20, 30, 40, ...

最新文章

  1. golang计算单个协程占用内存
  2. python中a=a+2与a+=2的区别
  3. 16windows_16_combo组合框
  4. 2021 高考 成绩查询,精准预测!2021全国大学录取分数线表查询
  5. [工具] 解决sublime text运行javascript console无输出问题
  6. 八、VueJs 填坑日记之参数传递及内容页面的开发
  7. Zookeeper C 回调函数
  8. ZZULIOJ 1139: 输出最短字符串
  9. AWR 报告深度解读:Time Model Statistics 信息的计算和获取
  10. POJ 2553 The Bottom of a Graph
  11. mrst 实施编辑器 data流程
  12. 核心金融场景分布式事务
  13. 解密游走于法律边缘的爬虫技术
  14. 易优CMS插件大全-采集翻译发布插件
  15. android 7 语音助手,语音助手横评:iPhone 大战 Android 旗舰,谁更好用?
  16. Tomcat重启服务器
  17. 公司注册地址要注意,小心被拉“黑”,征信受影响
  18. 宝华计算机维修,唐山市路北区宝华计算机维修服务
  19. 企业越小越需要做股权激励
  20. 制作单词记录App(一)

热门文章

  1. python基础第五课--从字符串中打包和解包大整数(小白piao分享)
  2. Educoder 头歌【人工智能之决策树算法】
  3. oracle查看还原点,闪回还原点restore point
  4. Python多进程中的fork
  5. (程序员情感三部曲之三)程序员与女朋友相处之道
  6. MyBatis 所有的 jdbcType类型
  7. 南陵中学2021高考成绩查询,南陵中学2020年高考快讯(一)
  8. Linux Shell CentOS 查看Linux 操作系统 相关信息
  9. python os popen_python中的subprocess.Popen()使用详解
  10. 修改Chrome谷歌浏览器默认安装路径