StratifiedKFold用法类似Kfold,但是他是分层采样,确保训练集,测试集中各类别样本的比例与原始数据集中相同

# coding:utf-8
import numpy as np
from sklearn.model_selection import KFold,StratifiedKFoldX=np.array([[1,2,3,4],[11,12,13,14],[21,22,23,24],[31,32,33,34],[41,42,43,44],[51,52,53,54],[61,62,63,64],[71,72,73,74]
])y=np.array([1,1,0,0,1,1,0,0])
sfolder = StratifiedKFold(n_splits=3,random_state=0,shuffle=False)
floder = KFold(n_splits=3,random_state=0,shuffle=False)for train, test in sfolder.split(X,y):print('Train: %s | test: %s' % (train, test))print(" ")#print("train: ",X[train])#print("test:", X[test])#print("\n\n")print("\n\n  --------  \n\n")for train, test in floder.split(X,y):print('Train: %s | test: %s' % (train, test))print(" ")          '''
Train: [3 4 5 6 7] | test: [0 1 2]Train: [0 1 2 5 7] | test: [3 4 6]Train: [0 1 2 3 4 6] | test: [5 7]--------  Train: [3 4 5 6 7] | test: [0 1 2]Train: [0 1 2 6 7] | test: [3 4 5]Train: [0 1 2 3 4 5] | test: [6 7]
'''  

结论: 可以看到StratifiedKFold 分层采样交叉切分,确保训练集,测试集中各类别样本的比例与原始数据集中相同。

StratifiedKFold实现分层抽样相关推荐

  1. 抽样方法,采样方法 shuffle

    20210114 def dataset_split(data):# 数据拆分 第二步try:# data = shuffle(data)# train = data.iloc[0:int(data. ...

  2. 多分类问题中sklearn的RFECV指定scoring函数

    先亮代码 from sklearn.feature_selection import RFECV import pandas as pd from sklearn.model_selection im ...

  3. 机器学习实战(3)——分类

    目录 1 MNIST数据集 2 训练一个二元分类器 3 性能考核 3.1 使用交叉验证测量精度 3.2 混淆矩阵 3.3 精度和召回率 3.4 精度/召回率权衡 3.5 ROC曲线 4 多类别分类器 ...

  4. Hands On Machine Learning with Scikit Learn and TensorFlow(第三章)

    MNIST 从sklearn自带函数中导入NMIST 第一次导入可能会出错,从这里下载https://github.com/amplab/datascience-sp14/blob/master/la ...

  5. 《机器学习实战:基于Scikit-Learn、Keras和TensorFlow第2版》-学习笔记(3)

    第三章 分类 · Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition, by Aurélie ...

  6. K折交叉验证(StratifiedKFold与KFold比较)

    文章目录 一.交叉验证 二.K折交叉验证 KFold()方法 StratifiedKFold()方法 一.交叉验证 交叉验证的基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训 ...

  7. StratifiedKFold()与KFold()比较

    一.KFold() 先看代码示例: import numpy as np from sklearn.model_selection import KFold X=np.array([[1,2],[3, ...

  8. K折交叉验证K-CV与StratifiedKFold

    1. K折交叉验证 K-fold Cross Validation,记为K-CV KFold 将所有的样例划分为 k 个组,称为折叠 (fold) ,每组数据都具有相同的大小.每一次分割会将其中的 K ...

  9. StratifiedShuffleSplit实现分层抽样交叉验证

    StratifiedShuffleSplit()实现分层抽样交叉验证 1. K-折交叉验证法 交叉验证通常采用K-折交叉验证法–将训练数据拆分成K份,用其中K-1份进行训练,剩下的一份进行预测,从而检 ...

最新文章

  1. Linux环境ddd安装与使用
  2. FPGA从Xilinx的7系列学起(6)
  3. 利用ServletFileUpload组件上传文件
  4. 基于xp系统搭建android开发环境
  5. mysql query结果集_如何解决PHP使用mysql_query查询超大结果集超内存问题
  6. 13--长度最小的子数组
  7. 浏览器从输入URL到页面渲染过程 —— 浏览器的进程与线程
  8. Spring Boot 实现登录拦截器,这才是正确的姿势!!
  9. SAP License:ERP之路
  10. 计算机科学与技术考研考西南交通大学,西南交大计算机科学与技术考研怎么样...
  11. 瑞利分布(Rayleigh Distribution)回顾
  12. mail企业邮箱登录入口有哪些?
  13. 什么是MTTF、MTBF、MTRF?
  14. 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》
  15. python群聊聊天室程序_Python聊天室程序---基础
  16. python 天气预报地图_实现地图天气预报的显示
  17. 图片链接直接打开显示正常,放在img标签里就加载不出来的解决方法
  18. 网站开发-实用SQL语句大全
  19. 【VMware】VMware 虚拟机使用笔记
  20. ArcGIS基础实验操作100例--实验66符号图层的保存与加载

热门文章

  1. 【Jetpack篇】LiveData取代EventBus,flutter安装
  2. 矿产行业智能采购管理系统开发,采购平台提升矿企核心竞争力
  3. Java分布式全局ID(一)
  4. 瘦客户机为何不瘦反胖?
  5. 腾讯手游助手android文件夹,腾讯手游助手中找到文件安装目录位置的详细操作方法...
  6. msconfig打不开,运行找不到msconfig解决办法
  7. 氨基/请加/羧基/生物素功能化水溶性CdSeQds,CdTeQds,CdSe/ZnSQds,ZnOQds,CuInS/ZnSQds量子点
  8. 贷记业务及相应技术规范
  9. AV1和开放媒体联盟(AOM)的发展、成果与未来
  10. 南亚Patchwork APT组织新活动特点分析