XGB的python实现
搜索最优的xgb模型参数
from xgboost import XGBClassifier
from sklearn.model_selection import GridSearchCVX_train = np.random.randn(10,8)
y_train = np.concatenate([np.ones(5),np.zeros(5)],0)# 定义参数取值范围
parameters = {'learning_rate': [0.1, 0.2, 0.3, 0.4],'subsample': [0.6, 0.7, 0.8, 0.9,1.0],'colsample_bytree': [0.7, 0.8, 0.9, 1.0],'max_depth': [1, 2, 3, 5, 8],'n_estimators': [100, 200, 300, 500, 700]}
model = XGBClassifier(n_estimators=200)
clf = GridSearchCV(model, parameters, cv=3, scoring='roc_auc', verbose=1, n_jobs=-1)
clf = clf.fit(X_train, y_train)# 网格搜索后的最好参数为print(clf.best_params_)
使用xgb进行训练预测
import numpy as np
from xgboost import XGBClassifierX_train = np.random.randn(10,8)
y_train = np.concatenate([np.ones(5),np.zeros(5)],0)
X_test = np.random.randn(6,8)
y_test = np.concatenate([np.ones(3),np.zeros(3)],0)clf = XGBClassifier(objective='binary:logistic', colsample_bytree=0.8, learning_rate=0.2, max_depth=4, subsample=0.9, n_estimators=300, use_label_encoder=False)
clf.fit(X_train, y_train, early_stopping_rounds=50, eval_metric="auc", eval_set=[(X_test, y_test)], verbose=True)
train_predict = clf.predict(X_train)
yp = clf.predict_proba(X_test) # [6,2] 第一列是预测为第一类的概率,第二列是预测为第二类的概率
print(yp)
print(clf.feature_importances_) # 输出 特征重要性
XGB的python实现相关推荐
- 模型法在评级中的应用
金融机构对于会员管理.渠道.客户管理,基本都会涉及到一个评级的内容,通过评级我们可以知晓这些群体的特点,拟定具体画像,以及给不同的人群分类等等.常规上可以通过评分卡跑一个评分等级来评级,但并不是每个场 ...
- TACOS:一种用于准确预测细胞特异性长的非编码RNA亚细胞定位的新方法
<TACOS:一种用于准确预测细胞特异性长的非编码RNA亚细胞定位的新方法> <TACOS: a novel approach for accurate prediction of ...
- python xgb模型 预测_Python 调用 PMML
PMML(Predictive Model Markup Language全称是预测模型标记语言,好处在于PMML可以让模型部署环境脱离开发环境,实现跨平台部署,是PMML区别于其他模型部署方法最大的 ...
- python xgb模型 预测_如何使用XGBoost模型进行时间序列预测
字幕组双语原文:如何使用XGBoost模型进行时间序列预测 英语原文:How to Use XGBoost for Time Series Forecasting 翻译:雷锋字幕组(Shangru) ...
- 独家 | 从基础到实现:集成学习综合教程(附Python代码)
作者:AISHWARYA SINGH 翻译:和中华 校对:丁楠雅 本文约8000字,建议阅读10+分钟. 本文从基础集成技术讲起,随后介绍了高级的集成技术,最后特别介绍了一些流行的基于Bagging和 ...
- 手把手教你在Python中实现文本分类(附代码、数据集)
作者: Shivam Bansal 翻译:申利彬 校对:丁楠雅 本文约2300字,建议阅读8分钟. 本文将详细介绍文本分类问题并用Python实现这个过程. 引言 文本分类是商业问题中常见的自然语言处 ...
- python 博弈论 库_SHAP:Python的可解释机器学习库
SHAP介绍 可解释机器学习在这几年慢慢成为了机器学习的重要研究方向.作为数据科学家需要防止模型存在偏见,且帮助决策者理解如何正确地使用我们的模型.越是严苛的场景,越需要模型提供证明它们是如何运作且避 ...
- python数据处理_时间序列数据处理python 库
[注]本人原创,最初发表于CSDN,后发布于知乎.为避免误会为抄袭,特此说明 由于我热衷于机器学习在时间序列中的应用,特别是在医学检测和分类中,在尝试的过程中,一直在寻找优质的Python库(而不是从 ...
- XGBoost参数调优完全指南(附Python代码)——转载
转载自https://www.cnblogs.com/mfryf/p/6293814.html 译注:文内提供的代码和运行结果有一定差异,可以从这里下载完整代码对照参考.另外,我自己跟着教程做的时候, ...
最新文章
- Qt开发,图文详解Hello World全过程
- 使用中文输入法时对键盘事件的处理
- Activemq 安全机制以及稳定性研究
- 对IP专用(私有)地址的理解!
- 华为全面启航计算战略:“鲲鹏+昇腾”双引擎
- 火车进出站(POJ1363)
- win10分屏快捷键无法使用_Win10系统Win快捷键不能用怎么办_win10 Win快捷键无法使用如何解决-系统城...
- Java8新特性DateTime使用
- 最新EyouCMS发布工具
- Unity精华☀️Audio Mixer终极教程:用《双人成行》讲解它的用途
- 5分钟TypeScript入门
- colsure php_PHP_PHP中Closure类的使用方法及详解,Closure,匿名函数,又称为Anonym - phpStudy...
- 鸿蒙对比ios流畅,鸿蒙OS 2.0对比iOS 14:苹果流畅度完败?
- 【问】前台销售时卡顿
- Magento后台产品列表添加自定义属性
- CAD怎么添加打印机设备?CAD打印机添加步骤
- 折叠面板的改进【Amaze UI】
- 汇编指令学习(MOV,MOVSX,MOVZX,LEA,XCHG)
- 下级对上级回复已阅知_阅示、阅知、阅悉之间有什么区别
- Spring Data JPA-根据Repository接口关键字生成SQL
热门文章
- gcc、arm-linux-gcc和arm-elf-gcc的关系?
- 机器学习面试——分类算法SVM
- python连连看小游戏_利用Python制作一个连连看小游戏,边学边玩!
- React中添加class——借助第三方库classnames
- RIP协议及距离向量算法(详解)
- LeetCode 305. 岛屿数量 II(并查集)
- LeetCode 311. 稀疏矩阵的乘法
- 程序员面试金典 - 面试题 17.15. 最长单词(排序+递归)
- LeetCode 216. 组合总和 III(排列组合 回溯)
- LeetCode 200. 岛屿数量(图的遍历)