library(openxlsx)
wine = read.xlsx("E:/时间趋势/winequality-red-2.xlsx")
#将数据集分为训练集和测试集,比例为7:3
train_sub = sample(nrow(wine),7/10*nrow(wine))
train_data = wine[train_sub,]
test_data = wine[-train_sub,]
library(pROC) #绘制ROC曲线
library(randomForest)
#数据预处理
train_data$Yield = as.factor(train_data$Yield)
test_data$Yield = as.factor(test_data$Yield)
wine_randomforest <- randomForest(Yield ~  Tmax+Tmin+AVRH+AVGT+SD+CWDI+P,data = train_data,ntree =500,mtry=3,importance=TRUE ,proximity=TRUE)
#查看变量的重要性
wine_randomforest$importance
varImpPlot(wine_randomforest, main = "variable importance",font = 2,lwd = 5,col = "red",col.axis = "blue",font.axis = 2,cex = 1,cex.axis = 5,pch = 16,cex.lab = 0.7,font.lab = 2)#对测试集进行预测
pre_ran <- predict(wine_randomforest,newdata=test_data)
#将真实值和预测值整合到一起
obs_p_ran = data.frame(prob=pre_ran,obs=test_data$Yield)
#输出混淆矩阵
table(test_data$Yield,pre_ran,dnn=c("真实值","预测值"))
#绘制ROC曲线
ran_roc <- roc(test_data$Yield,as.numeric(pre_ran))
plot(ran_roc, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2),grid.col=c("green", "red"), max.auc.polygon=TRUE,auc.polygon.col="skyblue", print.thres=TRUE,main='随机森林模型ROC曲线,mtry=3,ntree=500')

随机森林重要性排序-R相关推荐

  1. 机器学习算法-随机森林之决策树R 代码从头暴力实现(3)

    前文 (机器学习算法 - 随机森林之决策树初探(1)) 讲述了决策树的基本概念.决策评价标准并手算了单个变量.单个分组的Gini impurity.是一个基本概念学习的过程,如果不了解,建议先读一下再 ...

  2. 分类树/装袋法/随机森林算法的R语言实现

    原文首发于简书于[2018.06.12] 本文是我自己动手用R语言写的实现分类树的代码,以及在此基础上写的袋装法(bagging)和随机森林(random forest)的算法实现.全文的结构是: 分 ...

  3. 机器学习算法-随机森林之决策树R 代码从头暴力实现(2)

    前文(机器学习算法 - 随机森林之决策树初探(1))讲述了决策树的基本概念.决策评价标准并手算了单个变量.单个分组的Gini impurity.是一个基本概念学习的过程,如果不了解,建议先读一下再继续 ...

  4. python随机森林库_随机森林库:R和Python中的不同结果

    下面的代码用R和python训练一个随机森林模型.正如您所注意到的,R(1-0.27=0.73)中的精度要比Python中的(0.69)好.此外,特性在R和Python中的重要性是不同的.在 [EDI ...

  5. R语言实战应用精讲50篇(二十七)-R语言实现随机森林(附R语言代码)

    随机森林回归 回归问题指的是因变量或者被预测变量是连续性变量的情形,比如预测身高体重的具体数值是多少的情形.整个代码大致可以分为包.数据.模型.预测评估4个部分,接下来逐一解读. 1.包部分,也就是加 ...

  6. r语言随机森林_随机森林+时间序列(R语言版)

    参考自: https://www.statworx.com/at/blog/time-series-forecasting-with-random-forest/ https://www.r-blog ...

  7. R语言ggplot2 | 绘制随机森林重要性+相关性热图

  8. R语言︱决策树族——随机森林算法

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:有一篇<有监督学习选择深度学习 ...

  9. 随机森林计算特征重要性_随机森林中计算特征重要性的3种方法

    随机森林计算特征重要性 The feature importance describes which features are relevant. It can help with a better ...

最新文章

  1. solaris10修改IP
  2. 你朋友圈里的广告是怎么做到合你胃口的?
  3. pytho基础之文件处理
  4. Spring的单元测试
  5. 400W SOD-123封装 TVS管SMF4L系列 型号齐全
  6. css hack惯用手法
  7. python按时间分类数据_Pandas / Python – 按时间段分组数据
  8. c语言fin和fout用法,fin,fout提示第一次调用
  9. [QT][待解决问题]对话框ui载入卡顿问题
  10. 云物大智题库--人工智能
  11. win10 安装VB6详细安装教程及其中的坑
  12. 孙子问题-中国剩余定理
  13. 计算机辅助翻译与人工翻译论文,浅析计算机辅助翻译与纯人工翻译的利与弊
  14. 最强大脑记忆曲线(9)——按错误频率排序待听写内容
  15. Fishermen Gym - 101964E(二分+前缀数组)
  16. ant.vue富文本编辑器_基于Vue.js 2.0和shimo Docs样式的富文本编辑器
  17. 我的世界服务器查延迟指令,服务器新手服主必看指令
  18. 自己动手写工具(一)一个用Java8实现的内存级别的缓存
  19. AWS的KVS相关介绍
  20. 关于APP安装来源统计的分析

热门文章

  1. 二重积分问题、计算法则与注意事项汇总
  2. AttributeError: module ‘tensorflow_core.compat.v1‘ has no attribute ‘contrib‘
  3. oracle form set_block_property,ORACLEERP开发基础之OracleForms基础(二)
  4. 测试/开发程序员的成长之路,未来是你们的......
  5. 汉语编程的时代会到来吗?
  6. 如何用大数据构建精准用户画像?
  7. AWS EC2 云服务器 Red Hat Enterprise Linux Server release 7.4 (Maipo) vnc远程连接教程
  8. signature=3cb79ad68e1de6fcae23aede975d0e4e,考研二外法语易错题汇总
  9. 看了一篇别人的年终总结,感觉对自己的启发挺大的
  10. maven 打包把依赖jar打进去