油管上的关于xgboost的例子

rm(list = ls()) #清空空间#加载数据集
install.packages("modeldata")
library(modeldata)
data("stackoverflow")#区分x和y
library(plyr)
library(tidyverse)
y <- as.numeric(stackoverflow$Remote)-1
y
x <- stackoverflow %>% select(-Remote)
str(x)#将因子转化为哑变量
install.packages("fastDummies")
library(fastDummies)
z <- dummy_cols(x,remove_first_dummy = TRUE)
##上面的代码就是将country那一列拆成了很多列,这个数据中也只有country是字符了
x <- z %>% select(-Country)#setting the parameters
params <- list(set.seed=1502,eval_metric="auc",objective="binary:logistic")
#running xgboost
library(xgboost)
model <- xgboost(data=as.matrix(x),label = y,params = params,nrounds = 20,verbose = 1)#shap values
xgb.plot.shap(data = as.matrix(x),model=model,top_n = 5)
#画出了模型中排名前五的影响因素

R语言机器学习xgboost实例,油管上的关于xgboost的例子相关推荐

  1. R语言机器学习与大数据可视化暨Python文本挖掘与自然语言处理核心技术研修

    中国通信工业协会通信和信息技术创新人才培养工程项目办公室 通人办[2017] 第45号 "R语言机器学习与大数据可视化"暨"Python文本挖掘与自然语言处理" ...

  2. “R语言机器学习与大数据可视化”暨“Python文本挖掘与自然语言处理”核心技术高级研修班的通知

    中国通信工业协会通信和信息技术创新人才培养工程项目办公室 通人办[2017] 第45号 "R语言机器学习与大数据可视化"暨"Python文本挖掘与自然语言处理" ...

  3. 前馈神经网络_BP算法+R语言程序运行实例

    前馈神经网络_BP算法+R语言程序运行实例 目录 关于神经网络的介绍 前馈神经网络 应用到机器学习 参数学习 误差反向传播 程序实例(R语言) 前言 今天是小白学习神经网络的第一次博客文章,希望以后的 ...

  4. R 回归 虚拟变量na_工具amp;方法 | R语言机器学习包大全(共45个包)

    机器学习,是一门多学科交叉的人工智能领域的分析技术,它使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测. 目前,常见机器学习的研究方向主要包括决策树.随机森林.神经网络.贝叶斯学习和支 ...

  5. 《R语言机器学习:实用案例分析》——1.2节R的数据结构

    本节书摘来自华章社区<R语言机器学习:实用案例分析>一书中的第1章,第1.2节R的数据结构,作者[印度] 拉格哈夫·巴利(Raghav Bali)迪潘简·撒卡尔(Dipanjan Sark ...

  6. R语言︱机器学习模型评价指标+(转)模型出错的四大原因及如何纠错

    笔者寄语:机器学习中交叉验证的方式是主要的模型评价方法,交叉验证中用到了哪些指标呢? 交叉验证将数据分为训练数据集.测试数据集,然后通过训练数据集进行训练,通过测试数据集进行测试,验证集进行验证. 模 ...

  7. 【视频】什么是梯度下降?用线性回归解释和R语言估计GARCH实例

    全文链接:http://tecdat.cn/?p=23606 梯度下降是一种优化算法,能够为各种问题找到最佳解决方案(点击文末"阅读原文"获取完整代码数据). 梯度下降是什么? 梯 ...

  8. [R语言基础]——数据处理实例

    [R语言基础]--数据处理实例 前言 问题 Step1:建立数据框 Step2:计算综合得分 Step3:对学生进行评分 Step4:根据姓氏和名字排序 完整代码 前言 之前我们已经学习了R对数据预处 ...

  9. R语言机器学习Caret包(Caret包是分类和回归训练的简称)、数据划分、数据预处理、模型构建、模型调优、模型评估、多模型对比、模型预测推理

    R语言机器学习Caret包(Caret包是分类和回归训练的简称).数据划分.数据预处理.模型构建.模型调优.模型评估.多模型对比.模型预测推理 目录

  10. R语言ggplot2可视化在时间序列上标注出重点区域实战(突出特定的时间范围):highlight specific time ranges

    R语言ggplot2可视化在时间序列上标注出重点区域实战(突出特定的时间范围):highlight specific time ranges 目录

最新文章

  1. 线程池方式调用spring mvc的业务类的简单实例
  2. SAP FI 会计凭证过账bapi BAPI_ACC_DOCUMENT_POST
  3. Systemctl stop XXX 时间太长
  4. rxjs fromEvent的源代码实现分析
  5. 如何解决Binder泄漏问题
  6. .NET微信公众号开发系列 - 项目介绍
  7. antd 能自适应吗_我文笔不好,不太会写文章,能做好自媒体吗?
  8. crash工具解析_crash工具和x86-64汇编基础
  9. background 图片比例缩小_如何更精准控制背景图片?
  10. JDK8-u271/u272的jre和jdk/jre的文件有差异
  11. 【图像增强】基于matlab同态增晰图像增强【含Matlab源码 962期】
  12. 微信公众号授权登录(应用免登陆)
  13. 5GgNB和ng-eNB的主要功能
  14. windows服务器如何搭建网站,Windows系列服务器网站搭建详细过程
  15. C++ 线段树,树状数组
  16. 软件项目管理-——project 2019 专业版
  17. html/css简单描述
  18. 【学习日志】学习总结
  19. 真小白|一步步教你用Python抓取微信好友分析
  20. 教你生成超高逼格微信朋友圈

热门文章

  1. Unity - 撸一个简单版本的 四叉树 + 视锥cascaded,用于场景剔除
  2. 【3D模型分享】柴油机MMZ D-260柴油发动机
  3. 软件测试工程师--面试题
  4. 步数精灵v4.0霸占好友排行榜首位 安卓版
  5. Python常用模块15-python的configparser模块
  6. 《2019年中国互联网网络安全报告》发布,恶意程序攻击半数来自美国
  7. 超强的照片无损放大修复工具 SmartDeblur模糊照片变清晰工具
  8. QT5使用PCAN读取CAN数据
  9. 电脑长截屏工具 --- FastStone Capture 下载
  10. 谷歌浏览器截取长图 (不用安装插件)