R语言——一秒决策树分析
决策树分析
1.文档读取
data <- read.csv(file.choose(),header=TRUE) </cenetr>
View(data)
2.建立训练数据与测试数据
set.seed(12345)
select <- sample(1:nrow(data),nrow(data)*0.7)
train <- data[select,]
test <- data[-select,]
3、建立模型
library(rpart)
library(rpart.plot)CART.tree <- rpart(Class ~ ., data=train, control=rpart.control(minsplit=2, cp=0))
rpart.plot(CART.tree)
3、模型检验及评价
CART.Prediction <- predict(CART.tree, newdata=test, type='class')Results <- table(Prediction=CART.Prediction, Actual=test$Class)
ResultsCorrect_Rate <- sum(diag(Results)) / sum(Results)
Correct_Rate
4、查找CP并重组检测模型
CART.tree <- prune(CART.tree, cp=0.03)
rpart.plot(CART.tree)CART.Prediction <- predict(CART.tree, newdata=test, type='class')results <- table(Prediction=CART.Prediction, Actual=test$Class)
resultsCorrect_Rate <- sum(diag(results)) / sum(results)
Correct_Rate
问题区:
- set.seed(12345)
说明:在此模型中,关于随机种子数的设置会导致实验数据出现异同。尽管随机种子在众多博客中只是标识性作用,但实质上在本分析中改变了模型的准确率。
- 联系方式: crays_1995@foxmail.com
R语言——一秒决策树分析相关推荐
- 数据分享|R语言因子分析、相关性分析大学生兼职现状调查问卷数据可视化报告...
全文链接:http://tecdat.cn/?p=31765 随着大学的普及教育,大学生就业形势变得更加困难,很多学生都意识到这个问题(点击文末"阅读原文"获取完整代码数据). 相 ...
- R语言Kaplan-Meier绘制生存分析、Log-rank假设检验、Cox回归曲线实战案例:恶性黑色素瘤的术后数据生存分析
R语言Kaplan-Meier绘制生存分析.Log-rank假设检验.Cox回归曲线实战案例:恶性黑色素瘤的术后数据生存分析 目录
- R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析详解实战:拟合连续性自变量和事件风险之间的关系:基于survival包lung数据
R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析详解实战:拟合连续性自变量和事件风险之间的关系:基于survival包lung数据 目录
- R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析:拟合连续性自变量和事件风险之间的关系并绘制直方图、平滑曲线、双Y轴于同一个图像中
R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析:拟合连续性自变量和事件风险之间的关系并绘制直方图.平滑曲线.双Y轴于同一个图像中 目录
- R语言教程:生存分析
生存分析处理预测特定事件将要发生的时间.它也被称为故障时间分析或分析死亡时间.例如,预测患有癌症的人将存活的天数或预测机械系统将失败的时间. 命名为survival的R语言包用于进行生存分析.此包包含 ...
- R语言基础数据分析—单因素方差分析
有了试验数据,我们就需要进行数据的处理与分析,而在试验设计中,通常分为单因素试验或者双因素试验.试验中要考察的指标称为试验指标,影响试验指标的条件称为因素,因素所处的状态称为水平,若试验中只有一个因素 ...
- 【R语言文本挖掘】:分析单词和文档频率——TF-IDF
[R语言文本挖掘]:分析单词和文档频率--TF-IDF
- r语言进行go富集分析_R语言-GO富集分析的超几何检验和可视化
Gene Ontology 可分为分子功能(Molecular Function),生物过程(biological process)和细胞组成(cellular component)三个部分.蛋白质或 ...
- R语言画图的实例分析,坐标轴,图例等设置
通过一个具体的案例对R语言的画图进行分析,主要包括辅助线的添加,plot()函数的基本参数设置,以及图例坐标轴的设置. 案例分析 ##数据的输入, dose <- c(20, 30, 40, ...
最新文章
- golang计算单个协程占用内存
- python中a=a+2与a+=2的区别
- 16windows_16_combo组合框
- 2021 高考 成绩查询,精准预测!2021全国大学录取分数线表查询
- [工具] 解决sublime text运行javascript console无输出问题
- 八、VueJs 填坑日记之参数传递及内容页面的开发
- Zookeeper C 回调函数
- ZZULIOJ 1139: 输出最短字符串
- AWR 报告深度解读:Time Model Statistics 信息的计算和获取
- POJ 2553 The Bottom of a Graph
- mrst 实施编辑器 data流程
- 核心金融场景分布式事务
- 解密游走于法律边缘的爬虫技术
- 易优CMS插件大全-采集翻译发布插件
- android 7 语音助手,语音助手横评:iPhone 大战 Android 旗舰,谁更好用?
- Tomcat重启服务器
- 公司注册地址要注意,小心被拉“黑”,征信受影响
- 宝华计算机维修,唐山市路北区宝华计算机维修服务
- 企业越小越需要做股权激励
- 制作单词记录App(一)
热门文章
- python基础第五课--从字符串中打包和解包大整数(小白piao分享)
- Educoder 头歌【人工智能之决策树算法】
- oracle查看还原点,闪回还原点restore point
- Python多进程中的fork
- (程序员情感三部曲之三)程序员与女朋友相处之道
- MyBatis 所有的 jdbcType类型
- 南陵中学2021高考成绩查询,南陵中学2020年高考快讯(一)
- Linux Shell CentOS 查看Linux 操作系统 相关信息
- python os popen_python中的subprocess.Popen()使用详解
- 修改Chrome谷歌浏览器默认安装路径