搜索最优的xgb模型参数

from xgboost import XGBClassifier
from sklearn.model_selection import GridSearchCVX_train = np.random.randn(10,8)
y_train = np.concatenate([np.ones(5),np.zeros(5)],0)# 定义参数取值范围
parameters = {'learning_rate': [0.1, 0.2, 0.3, 0.4],'subsample': [0.6, 0.7, 0.8, 0.9,1.0],'colsample_bytree': [0.7, 0.8, 0.9, 1.0],'max_depth': [1, 2, 3, 5, 8],'n_estimators': [100, 200, 300, 500, 700]}
model = XGBClassifier(n_estimators=200)
clf = GridSearchCV(model, parameters, cv=3, scoring='roc_auc', verbose=1, n_jobs=-1)
clf = clf.fit(X_train, y_train)# 网格搜索后的最好参数为print(clf.best_params_)

使用xgb进行训练预测

import numpy as np
from xgboost import XGBClassifierX_train = np.random.randn(10,8)
y_train = np.concatenate([np.ones(5),np.zeros(5)],0)
X_test = np.random.randn(6,8)
y_test = np.concatenate([np.ones(3),np.zeros(3)],0)clf = XGBClassifier(objective='binary:logistic', colsample_bytree=0.8, learning_rate=0.2, max_depth=4, subsample=0.9, n_estimators=300, use_label_encoder=False)
clf.fit(X_train, y_train, early_stopping_rounds=50, eval_metric="auc", eval_set=[(X_test, y_test)], verbose=True)
train_predict = clf.predict(X_train)
yp = clf.predict_proba(X_test)  # [6,2] 第一列是预测为第一类的概率,第二列是预测为第二类的概率
print(yp)
print(clf.feature_importances_) # 输出 特征重要性

XGB的python实现相关推荐

  1. 模型法在评级中的应用

    金融机构对于会员管理.渠道.客户管理,基本都会涉及到一个评级的内容,通过评级我们可以知晓这些群体的特点,拟定具体画像,以及给不同的人群分类等等.常规上可以通过评分卡跑一个评分等级来评级,但并不是每个场 ...

  2. TACOS:一种用于准确预测细胞特异性长的非编码RNA亚细胞定位的新方法

    <TACOS:一种用于准确预测细胞特异性长的非编码RNA亚细胞定位的新方法> <TACOS: a novel approach for accurate prediction of ...

  3. python xgb模型 预测_Python 调用 PMML

    PMML(Predictive Model Markup Language全称是预测模型标记语言,好处在于PMML可以让模型部署环境脱离开发环境,实现跨平台部署,是PMML区别于其他模型部署方法最大的 ...

  4. python xgb模型 预测_如何使用XGBoost模型进行时间序列预测

    字幕组双语原文:如何使用XGBoost模型进行时间序列预测 英语原文:How to Use XGBoost for Time Series Forecasting 翻译:雷锋字幕组(Shangru) ...

  5. 独家 | 从基础到实现:集成学习综合教程(附Python代码)

    作者:AISHWARYA SINGH 翻译:和中华 校对:丁楠雅 本文约8000字,建议阅读10+分钟. 本文从基础集成技术讲起,随后介绍了高级的集成技术,最后特别介绍了一些流行的基于Bagging和 ...

  6. 手把手教你在Python中实现文本分类(附代码、数据集)

    作者: Shivam Bansal 翻译:申利彬 校对:丁楠雅 本文约2300字,建议阅读8分钟. 本文将详细介绍文本分类问题并用Python实现这个过程. 引言 文本分类是商业问题中常见的自然语言处 ...

  7. python 博弈论 库_SHAP:Python的可解释机器学习库

    SHAP介绍 可解释机器学习在这几年慢慢成为了机器学习的重要研究方向.作为数据科学家需要防止模型存在偏见,且帮助决策者理解如何正确地使用我们的模型.越是严苛的场景,越需要模型提供证明它们是如何运作且避 ...

  8. python数据处理_时间序列数据处理python 库

    [注]本人原创,最初发表于CSDN,后发布于知乎.为避免误会为抄袭,特此说明 由于我热衷于机器学习在时间序列中的应用,特别是在医学检测和分类中,在尝试的过程中,一直在寻找优质的Python库(而不是从 ...

  9. XGBoost参数调优完全指南(附Python代码)——转载

    转载自https://www.cnblogs.com/mfryf/p/6293814.html 译注:文内提供的代码和运行结果有一定差异,可以从这里下载完整代码对照参考.另外,我自己跟着教程做的时候, ...

最新文章

  1. Qt开发,图文详解Hello World全过程
  2. 使用中文输入法时对键盘事件的处理
  3. Activemq 安全机制以及稳定性研究
  4. 对IP专用(私有)地址的理解!
  5. 华为全面启航计算战略:“鲲鹏+昇腾”双引擎
  6. 火车进出站(POJ1363)
  7. win10分屏快捷键无法使用_Win10系统Win快捷键不能用怎么办_win10 Win快捷键无法使用如何解决-系统城...
  8. Java8新特性DateTime使用
  9. 最新EyouCMS发布工具
  10. Unity精华☀️Audio Mixer终极教程:用《双人成行》讲解它的用途
  11. 5分钟TypeScript入门
  12. colsure php_PHP_PHP中Closure类的使用方法及详解,Closure,匿名函数,又称为Anonym - phpStudy...
  13. 鸿蒙对比ios流畅,鸿蒙OS 2.0对比iOS 14:苹果流畅度完败?
  14. 【问】前台销售时卡顿
  15. Magento后台产品列表添加自定义属性
  16. CAD怎么添加打印机设备?CAD打印机添加步骤
  17. 折叠面板的改进【Amaze UI】
  18. 汇编指令学习(MOV,MOVSX,MOVZX,LEA,XCHG)
  19. 下级对上级回复已阅知_阅示、阅知、阅悉之间有什么区别
  20. Spring Data JPA-根据Repository接口关键字生成SQL

热门文章

  1. gcc、arm-linux-gcc和arm-elf-gcc的关系?
  2. 机器学习面试——分类算法SVM
  3. python连连看小游戏_利用Python制作一个连连看小游戏,边学边玩!
  4. React中添加class——借助第三方库classnames
  5. RIP协议及距离向量算法(详解)
  6. LeetCode 305. 岛屿数量 II(并查集)
  7. LeetCode 311. 稀疏矩阵的乘法
  8. 程序员面试金典 - 面试题 17.15. 最长单词(排序+递归)
  9. LeetCode 216. 组合总和 III(排列组合 回溯)
  10. LeetCode 200. 岛屿数量(图的遍历)