GridSearchCV()是sklearn中的一个函数,专门调试参数的函数grid_search.

各个参数的含义:

class sklearn.model_selection.GridSearchCV(estimator, param_grid, scoring=None, fit_params=None,n_jobs=1, iid=True, refit=True, cv=None, verbose=0, pre_dispatch=‘2*n_jobs’, error_score=’raise’, return_train_score=’warn’)

1.estimator
选择使用的分类器,并且传入除需要确定最佳的参数之外的其他参数。
每一个分类器都需要一个scoring参数,或者score方法:
如estimator=RandomForestClassifier(
min_samples_split=100,
min_samples_leaf=20,
max_depth=8,
max_features=‘sqrt’,
random_state=10),

2.param_grid
需要最优化的参数的取值,值为字典或者列表,例如:
param_grid =param_test1,
param_test1 = {‘n_estimators’:range(10,71,10)}。

  1. scoring=None
    模型评价标准,默认None,这时需要使用score函数;或者如scoring=‘roc_auc’,
    根据所选模型不同,评价准则不同。字符串(函数名),或是可调用对象,
    需要其函数签名形如:scorer(estimator, X, y);如果是None,则使用estimator的误差估计函数。

4.n_jobs=1
n_jobs: 并行数,int:个数,-1:跟CPU核数一致, 1:默认值

5.cv=None

交叉验证参数,默认None,使用三折交叉验证。指定fold数量,默认为3,也可以是yield产生训练/测试数据的生成器。

6.verbose=0, scoring=None
verbose:日志冗长度,int:冗长度,0:不输出训练过程,1:偶尔输出,>1:对每个子模型都输出。

7.pre_dispatch=‘2*n_jobs’
指定总共分发的并行任务数。当n_jobs大于1时,数据将在每个运行点进行复制,这可能导致OOM,
而设置pre_dispatch参数,则可以预先划分总共的job数量,使数据最多被复制pre_dispatch次

8.return_train_score=’warn’
如果“False”,cv_results_属性将不包括训练分数。

9.refit :默认为True,程序将会以交叉验证训练集得到的最佳参数,重新对所有可用的训练集与开发集进行,
作为最终用于性能评估的最佳模型参数。即在搜索参数结束后,用最佳参数结果再次fit一遍全部数据集。

10.iid:默认True,为True时,默认为各个样本fold概率分布一致,误差估计为所有样本之和,而非各个fold的平均。

进行预测的常用方法和属性

#运行网格搜索
grid.fit()
#给出不同参数情况下的评价结果
grid_scores_
#描述了已取得最佳结果的参数的组合
best_params_
#成员提供优化过程期间观察到的最好的评分
best_score_param_test1 ={'n_estimators':range(10,71,10)}
gsearch1= GridSearchCV(estimator =RandomForestClassifier(min_samples_split=100,  min_samples_leaf=20,max_depth=8,max_features='sqrt',random_state=10),   param_grid =param_test1,scoring='roc_auc',cv=5)
gsearch1.fit(X,y)
gsearch1.grid_scores_,
gsearch1.best_params_,
gsearch1.best_score_  '''
输出结果如下:
([mean: 0.80681, std:0.02236, params: {'n_estimators': 10},mean: 0.81600, std: 0.03275, params:{'n_estimators': 20},mean: 0.81818, std: 0.03136, params:{'n_estimators': 30},mean: 0.81838, std: 0.03118, params:{'n_estimators': 40},mean: 0.82034, std: 0.03001, params:{'n_estimators': 50},mean: 0.82113, std: 0.02966, params:{'n_estimators': 60},mean: 0.81992, std: 0.02836, params:{'n_estimators': 70}],
{'n_estimators': 60},
0.8211334476626017)
'''
#如果有transform,使用Pipeline简化系统搭建流程,将transform与分类器串联起来(Pipelineof transforms with a final estimator)pipeline= Pipeline([("features", combined_features), ("svm", svm)])
param_grid= dict(features__pca__n_components=[1, 2, 3],  features__univ_select__k=[1,2],  svm__C=[0.1, 1, 10])  grid_search= GridSearchCV(pipeline, param_grid=param_grid, verbose=10)
grid_search.fit(X,y)
print(grid_search.best_estimator_)

参考:https://blog.csdn.net/WxyangID/article/details/80397185

GridSearchCV( )参数详情相关推荐

  1. 荣耀70 Pro+什么时候发布 荣耀70 Pro+配置参数详情

    荣耀数字系列一直都是主打线下的产品,在配置上不是很高,但随着荣耀70系列的曝光,这一系列的配置将有所改变,在性能配置上有很大的提升,那么,荣耀70 Pro+什么时候发布? 荣耀70 Pro+配置如何? ...

  2. Elasticsearch-analysis-pinyin7.6.0--可选参数详情

    Elasticsearch-analysis-pinyin7.6.0--可选参数详情 •keep_first_letter启用此选项时,例如:刘德华> ldh,默认值:true •keep_se ...

  3. 自定义函数使用GridSearchCV参数寻优

    自定义函数使用GridSearchCV参数寻优 GirdSearchCV and RandomizedSearchCV 自定义函数中使用GirdSearchCV GridSearchCV参数说明 Gr ...

  4. 红米9A android版本,红米9A配置参数-参数详情

    红米9A一经上市就受到广大用户的喜欢,红米9a是一款入门级的手机"不是黑科技,但是良心机"是它的宣传语,那么在Redmi系列中拥有较高的性价比的"良心机"到底有 ...

  5. Mysql 配置文件 my.cnf 参数详情参考

    Mysql 配置文件 my.cnf 参数详情参考 参考地址:https://blog.csdn.net/qq_42768234/article/details/110089078 其中有些参数有待查询 ...

  6. 华为荣耀5a是android几,荣耀5A配置怎么样 荣耀畅玩5A参数详情

    6月12日下午,华为荣耀在北京召开新品发布会,正式发布了荣耀畅玩5系列5X.5C之后的第三款机型:荣耀5A,售价699元起.从发布会来看,荣耀5A性价比方面并不算特别抢眼,主要是在长续航.自拍方面表现 ...

  7. 苹果15手机价格和图片颜色 iphone15配置参数详情

    苹果15手机价格和图片颜色 iPhone 15ProMax 价格: 128GB 1199美元 256GB 1299美元 512GB的1499美元 1TB 1699美元 颜色:太空灰.银色.金色,绯红色 ...

  8. gridsearchcv参数_使用python进行模型参数调优

    from 1. 数据集分割 iris 2.参数调优 网格搜索+交叉验证 param_grid 我们发现上述代码中,grid_search.best_score_和scores.mean()的输出值不同 ...

  9. gridsearchcv参数_Python机器学习库Sklearn系列教程(21)-参数优化

    (网格搜索GridSearchCV.随机搜索RandomizedSearchCV.hyperopt) 网格搜索GridSearchCV GridSearchCV用于系统地遍历多种参数组合,通过交叉验证 ...

  10. GridSearchCV 参数

    GridSearchCV(estimator, param_grid, scoring=None, fit_params=None, n_jobs=1, iid=True, refit=True, c ...

最新文章

  1. 分享Kali Linux 2017年第二周镜像文件
  2. 如何获取java对象的字段名_Java如何获取类对象的字段?
  3. matlab函数参数命令,matlab函数文件中的输出参数如何不在命令窗口显示
  4. jenkins自动化打包部署
  5. Java LinkedList公共布尔提供(对象o)方法(带示例)
  6. Cocos2d-x 3.2:定时器的使用和原理探究(1)
  7. php判断浏览器和语言
  8. Precision、Recall、F计算:举例
  9. IDEA 2018.2.5最新版破解到2100年图解教程
  10. Ubuntu下载、安装golang编辑器
  11. macbook删除windows后合并磁盘分区
  12. c语言程序设计课设简单,北京工业大学C语言程序设计课设报告.docx
  13. html怎么把盒子做成超链接,把整个DIV变成超链接
  14. 【NPDP产品经理】发散思维让你的思维视野更广阔
  15. 国内外神经网络研究现状,神经网络的发展现状
  16. Okra框架(三) 搭建HTTP服务器
  17. ios 页面即将消失_20个即将推出的页面介绍及如何正确处理它们
  18. revit建模批量标高操作,简单的一匹。
  19. 计算机多媒体论文致谢,计算机专业论文致谢范文3篇
  20. Windows图标空白问题解决记录

热门文章

  1. J2EE DAO模式解析(二)
  2. javascript技巧大全
  3. XJOI 3864 农村连接城市
  4. 信息安全政策(隔离与监控)
  5. python的版本会导致IBus设置(中文输入法)出错
  6. Hibernate 一对多连接表单向关联
  7. Android入门:EditText
  8. linux vi 编辑命令
  9. (Github)增强插件、脚本
  10. C编程语言中整型变量在内存中的存储形式介绍