GridSearchCV( )参数详情
GridSearchCV()是sklearn中的一个函数,专门调试参数的函数grid_search.
各个参数的含义:
class sklearn.model_selection.GridSearchCV(estimator, param_grid, scoring=None, fit_params=None,n_jobs=1, iid=True, refit=True, cv=None, verbose=0, pre_dispatch=‘2*n_jobs’, error_score=’raise’, return_train_score=’warn’)
1.estimator
选择使用的分类器,并且传入除需要确定最佳的参数之外的其他参数。
每一个分类器都需要一个scoring参数,或者score方法:
如estimator=RandomForestClassifier(
min_samples_split=100,
min_samples_leaf=20,
max_depth=8,
max_features=‘sqrt’,
random_state=10),
2.param_grid
需要最优化的参数的取值,值为字典或者列表,例如:
param_grid =param_test1,
param_test1 = {‘n_estimators’:range(10,71,10)}。
- scoring=None
模型评价标准,默认None,这时需要使用score函数;或者如scoring=‘roc_auc’,
根据所选模型不同,评价准则不同。字符串(函数名),或是可调用对象,
需要其函数签名形如:scorer(estimator, X, y);如果是None,则使用estimator的误差估计函数。
4.n_jobs=1
n_jobs: 并行数,int:个数,-1:跟CPU核数一致, 1:默认值
5.cv=None
交叉验证参数,默认None,使用三折交叉验证。指定fold数量,默认为3,也可以是yield产生训练/测试数据的生成器。
6.verbose=0, scoring=None
verbose:日志冗长度,int:冗长度,0:不输出训练过程,1:偶尔输出,>1:对每个子模型都输出。
7.pre_dispatch=‘2*n_jobs’
指定总共分发的并行任务数。当n_jobs大于1时,数据将在每个运行点进行复制,这可能导致OOM,
而设置pre_dispatch参数,则可以预先划分总共的job数量,使数据最多被复制pre_dispatch次
8.return_train_score=’warn’
如果“False”,cv_results_属性将不包括训练分数。
9.refit :默认为True,程序将会以交叉验证训练集得到的最佳参数,重新对所有可用的训练集与开发集进行,
作为最终用于性能评估的最佳模型参数。即在搜索参数结束后,用最佳参数结果再次fit一遍全部数据集。
10.iid:默认True,为True时,默认为各个样本fold概率分布一致,误差估计为所有样本之和,而非各个fold的平均。
进行预测的常用方法和属性
#运行网格搜索
grid.fit()
#给出不同参数情况下的评价结果
grid_scores_
#描述了已取得最佳结果的参数的组合
best_params_
#成员提供优化过程期间观察到的最好的评分
best_score_param_test1 ={'n_estimators':range(10,71,10)}
gsearch1= GridSearchCV(estimator =RandomForestClassifier(min_samples_split=100, min_samples_leaf=20,max_depth=8,max_features='sqrt',random_state=10), param_grid =param_test1,scoring='roc_auc',cv=5)
gsearch1.fit(X,y)
gsearch1.grid_scores_,
gsearch1.best_params_,
gsearch1.best_score_ '''
输出结果如下:
([mean: 0.80681, std:0.02236, params: {'n_estimators': 10},mean: 0.81600, std: 0.03275, params:{'n_estimators': 20},mean: 0.81818, std: 0.03136, params:{'n_estimators': 30},mean: 0.81838, std: 0.03118, params:{'n_estimators': 40},mean: 0.82034, std: 0.03001, params:{'n_estimators': 50},mean: 0.82113, std: 0.02966, params:{'n_estimators': 60},mean: 0.81992, std: 0.02836, params:{'n_estimators': 70}],
{'n_estimators': 60},
0.8211334476626017)
'''
#如果有transform,使用Pipeline简化系统搭建流程,将transform与分类器串联起来(Pipelineof transforms with a final estimator)pipeline= Pipeline([("features", combined_features), ("svm", svm)])
param_grid= dict(features__pca__n_components=[1, 2, 3], features__univ_select__k=[1,2], svm__C=[0.1, 1, 10]) grid_search= GridSearchCV(pipeline, param_grid=param_grid, verbose=10)
grid_search.fit(X,y)
print(grid_search.best_estimator_)
参考:https://blog.csdn.net/WxyangID/article/details/80397185
GridSearchCV( )参数详情相关推荐
- 荣耀70 Pro+什么时候发布 荣耀70 Pro+配置参数详情
荣耀数字系列一直都是主打线下的产品,在配置上不是很高,但随着荣耀70系列的曝光,这一系列的配置将有所改变,在性能配置上有很大的提升,那么,荣耀70 Pro+什么时候发布? 荣耀70 Pro+配置如何? ...
- Elasticsearch-analysis-pinyin7.6.0--可选参数详情
Elasticsearch-analysis-pinyin7.6.0--可选参数详情 •keep_first_letter启用此选项时,例如:刘德华> ldh,默认值:true •keep_se ...
- 自定义函数使用GridSearchCV参数寻优
自定义函数使用GridSearchCV参数寻优 GirdSearchCV and RandomizedSearchCV 自定义函数中使用GirdSearchCV GridSearchCV参数说明 Gr ...
- 红米9A android版本,红米9A配置参数-参数详情
红米9A一经上市就受到广大用户的喜欢,红米9a是一款入门级的手机"不是黑科技,但是良心机"是它的宣传语,那么在Redmi系列中拥有较高的性价比的"良心机"到底有 ...
- Mysql 配置文件 my.cnf 参数详情参考
Mysql 配置文件 my.cnf 参数详情参考 参考地址:https://blog.csdn.net/qq_42768234/article/details/110089078 其中有些参数有待查询 ...
- 华为荣耀5a是android几,荣耀5A配置怎么样 荣耀畅玩5A参数详情
6月12日下午,华为荣耀在北京召开新品发布会,正式发布了荣耀畅玩5系列5X.5C之后的第三款机型:荣耀5A,售价699元起.从发布会来看,荣耀5A性价比方面并不算特别抢眼,主要是在长续航.自拍方面表现 ...
- 苹果15手机价格和图片颜色 iphone15配置参数详情
苹果15手机价格和图片颜色 iPhone 15ProMax 价格: 128GB 1199美元 256GB 1299美元 512GB的1499美元 1TB 1699美元 颜色:太空灰.银色.金色,绯红色 ...
- gridsearchcv参数_使用python进行模型参数调优
from 1. 数据集分割 iris 2.参数调优 网格搜索+交叉验证 param_grid 我们发现上述代码中,grid_search.best_score_和scores.mean()的输出值不同 ...
- gridsearchcv参数_Python机器学习库Sklearn系列教程(21)-参数优化
(网格搜索GridSearchCV.随机搜索RandomizedSearchCV.hyperopt) 网格搜索GridSearchCV GridSearchCV用于系统地遍历多种参数组合,通过交叉验证 ...
- GridSearchCV 参数
GridSearchCV(estimator, param_grid, scoring=None, fit_params=None, n_jobs=1, iid=True, refit=True, c ...
最新文章
- 分享Kali Linux 2017年第二周镜像文件
- 如何获取java对象的字段名_Java如何获取类对象的字段?
- matlab函数参数命令,matlab函数文件中的输出参数如何不在命令窗口显示
- jenkins自动化打包部署
- Java LinkedList公共布尔提供(对象o)方法(带示例)
- Cocos2d-x 3.2:定时器的使用和原理探究(1)
- php判断浏览器和语言
- Precision、Recall、F计算:举例
- IDEA 2018.2.5最新版破解到2100年图解教程
- Ubuntu下载、安装golang编辑器
- macbook删除windows后合并磁盘分区
- c语言程序设计课设简单,北京工业大学C语言程序设计课设报告.docx
- html怎么把盒子做成超链接,把整个DIV变成超链接
- 【NPDP产品经理】发散思维让你的思维视野更广阔
- 国内外神经网络研究现状,神经网络的发展现状
- Okra框架(三) 搭建HTTP服务器
- ios 页面即将消失_20个即将推出的页面介绍及如何正确处理它们
- revit建模批量标高操作,简单的一匹。
- 计算机多媒体论文致谢,计算机专业论文致谢范文3篇
- Windows图标空白问题解决记录