这几天复习交叉验证的时候发现一个问题,学习资料中有些地方用的函数中cv=?,有些地方则用的cv=KFold(n_splits=?) 这个函数,就比如我用KNN模型做十折交叉验证:

model = sk_neighbors.KNeighborsClassifier(n_neighbors=5,n_jobs=1) #KNN分类
import sklearn.model_selection as sk_model_selection
accs=sk_model_selection.cross_val_score(model, iris_X, y=iris_y, scoring=None,cv=10, n_jobs=1)
print('交叉验证结果:',accs)

这里面第三行用的cv=10。然后在我的Titanic实战中:

kf = KFold(titanic.shape[0], n_splits=10, random_state=1, shuffle=False)

这里用kfold函数中的n_splits代表分十份。为什么呢???

我在StackExchange这个网站发现老外说的这些话:
When an integer is passed to the cv parameter of cross_val_score():

  • StratifiedKFold is used if the estimator is a classifier and y is either binary or multiclass.
  • In all other cases, KFold is used.

啥意思呢? 如果估计器是一个分类器,并且y是二进制或多类,则使用StratifiedKFold,如果是其他情况,就用KFold

这里的StratifiedKFold是啥?cv=StratifiedKFold(n_splits=10)其实就等价于cv=10
同样也有cv=KFold(n_splits=10)))

遵从这个标准,可以让结果变得更好!

交叉验证中cv=? 与 cv=KFold(n_splits=?)的区别相关推荐

  1. 交叉验证中n_jobs=-1并行运算

    scikit_learn包中的cross_val_score()是支持并行运算,但这并不是说只要让n_jobs=-1就能让CPU使用率接近100%.这要取决于交叉验证的折数cv,假如折数cv是n,这意 ...

  2. 【Python学习】 - sklearn学习 - 交叉验证中的常用函数

    首先调入库:from sklearn.model_selection import train_test_split train_test_split是交叉验证中常用的函数,功能是从样本中随机的按比例 ...

  3. 特征选择,归一化以及交叉验证中应当注意的问题

    特征选择.归一化以及交叉验证中应当注意的问题 前言 为什么要划分训练集,验证集和测试集? 是先做特征选择还是先划分 训练集-验证集-测试集? 是先做归一化还是先划分 训练集-验证集-测试集? 交叉验证 ...

  4. 通过交叉验证(Cross Validation)KFold绘制ROC曲线并选出最优模型进行模型评估、测试、包含分类指标、校准曲线、混淆矩阵等

    通过交叉验证(Cross Validation,CV)KFold绘制ROC曲线并选出最优模型进行模型评估.测试.包含分类指标.校准曲线.混淆矩阵等 Cross Validation cross val ...

  5. xgb.cv进行交叉验证

    模型评估的方法 留出法 留出法是将原数据集分成互斥的两组,一组作为训练集,另一组作为测试集 交叉验证发 交叉验证(cross-validation 简称cv)将数据集分为k等份,对于每一份数据集,其中 ...

  6. 深度盘点:详细介绍机器学习中的7种交叉验证方法!

    来源:机器学习社区 本文约3400字,建议阅读10分钟 本文与你分享7种最常用的交叉验证技术及其优缺点,提供了每种技术的代码片段. 在任何有监督机器学习项目的模型构建阶段,我们训练模型的目的是从标记的 ...

  7. 【机器学习】深度盘点:详细介绍 Python 中的 7 种交叉验证方法!

    在任何有监督机器学习项目的模型构建阶段,我们训练模型的目的是从标记的示例中学习所有权重和偏差的最佳值. 如果我们使用相同的标记示例来测试我们的模型,那么这将是一个方法论错误,因为一个只会重复刚刚看到的 ...

  8. 【机器学习】图解机器学习中的 12 种交叉验证技术

    今天我给大家盘点下机器学习中所使用的交叉验证器都有哪些,用最直观的图解方式来帮助大家理解他们是如何工作的. 数据集说明 数据集来源于kaggle M5 Forecasting - Accuracy[1 ...

  9. python基于训练集预测_Python中训练集/测试集的分割和交叉验证

    原标题:Python中训练集/测试集的分割和交叉验证 嗨,大家好!在上一篇关于Python线性回归的文章之后,我认为撰写关于切分训练集/测试集和交叉验证的文章是很自然的,和往常一样,我将对该主题进行简 ...

最新文章

  1. springMVC 拦截器
  2. 戏说肥哥系列之---买车
  3. python hello world程序编写_编写高质量代码 改善Python程序的91个建议
  4. 强人工智能还有多远?先用10到20年突破这5个数学问题
  5. SpringBoot 集成 clickhouse + mybatis-plus 配置及使用问题说明(含建表语句、demo源码、测试说明)
  6. 华测数据导出方法_输电线路塔基测量成图方法研究与应用
  7. 2014年英语一阅读理解Text1
  8. Java中的向下转型与向上转型
  9. 阿里计算平台掌门人贾扬清:我对人工智能方向的一点浅见
  10. fedora启动进入命令窗口_查看版本_修改hostname
  11. Splay_Tree 模板(区间修改,旋转操作)
  12. 数字时代的必经之路,汽车经销商(4S)行业的信息化特点
  13. java中io的重要性_java中的IO整理
  14. 什么是阿尔法和贝塔?
  15. 3、RDD-Single-Stage Rotation-Decoupled Detector for Oriented Object
  16. 微信小程序开发问题收集及解决方案——样式篇
  17. react 返回一个页面_react项目中实现返回不刷新
  18. 基于COF智能屏的桌面式3D打印机方案
  19. Wi-Fi 工作频段
  20. 不要再重复造轮子了,Hutool这款开源工具类库贼好使

热门文章

  1. 阿里云数据库RDS如何监控、备份及克隆实例?
  2. 灵性图书馆:好书推荐-《荷欧波诺波诺的幸福奇迹》
  3. 超级抠图:Super PhotoCut for Mac
  4. iOS直播APP流程和相关技术介绍
  5. 远程服务器上的输入法不见了,电脑输入法不见了怎么办?
  6. 影响Google Adsense广告单价高低的因素分析获取更高的收入
  7. 成功解决android 网络视频边下载变播放。
  8. Android侧滑返回分析和实现(不高仿微信),flutter项目实战
  9. 基于FPGA的CYUSB3014双向通信实验
  10. [Azure][Event hub]Kafka无法同时连接到同一个namespace下的两个Event hub