教程连接:https://scikit-learn.org/stable/modules/cross_validation.html#cross-validation
当样本中各类的含量不平衡时用Stratified k-fold函数来选择训练集和学习集。例如:

X=np.ones(10)

y=[0,0,0,0,1,1,1,1,1,1]

len(y)

10

skf=StratifiedKFold(n_splits=3)

for train,test in skf.split(X,y):
print(’%s %s’ % (train,test))

[2 3 6 7 8 9] [0 1 4 5]
[0 1 3 4 5 8 9] [2 6 7]
[0 1 2 4 5 6 7] [3 8 9]

2.GroupKFold:用于分类又group的数据
3.TimeSeriesSplit:时间序列数据训练集与测试集的分类方法
例如:

from sklearn.model_selection import TimeSeriesSplit

X=np.array([[1,2],[3,4],[1,2],[3,4],[1,2],[3,4]])

y=np.array(range(6))

y

array([0, 1, 2, 3, 4, 5])

y=np.array(range(1,7))

y

array([1, 2, 3, 4, 5, 6])

tscv=TimeSeriesSplit(n_splits=3)

print(tscv)

TimeSeriesSplit(max_train_size=None, n_splits=3)

for train,test in tscv.split(X):
print(’%s %s’ % (train,test))

[0 1 2] [3]
[0 1 2 3] [4]
[0 1 2 3 4] [5]

Stratified k-foldTimeSeriesSplit相关推荐

  1. svm rbf人脸识别 yale_实操课——机器学习之人脸识别

    SVM(Support Vector Machine)指的是支持向量机,是常见的一种判别方法.在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别.分类以及回归分析.在n维空间中找到一个分类超 ...

  2. 支持向量机svm的完整实现并配有解析

    svm分析(类似于源码) from future import print_function from time import time import logging #绘图工具 import mat ...

  3. 机器学习理论之SVM

    支持向量机系列 (1) 算法理论理解 http://blog.pluskid.org/?page_id=683 手把手教你实现SVM算法(一) (2) 算法应用 算法应用----python 实现实例 ...

  4. [译]使用scikit-learn进行机器学习的简介(教程1)

    原文:http://www.cnblogs.com/taceywong/p/4568806.html 原文地址:http://scikit-learn.org/stable/tutorial/basi ...

  5. 麦子学院深度学习视频SVM人脸识别课程代码修改及实现

    1.麦子学院深度学习SVM人脸识别原代码对应修改 2.代码实现 1.麦子学院深度学习SVM人脸识别原代码对应修改 1.1 from sklearn.cross_validation import tr ...

  6. 人脸识别SVM算法实现--参考麦子学院彭亮机器学习基础5.2

    #本例为人脸识别的SVM算法 #首先fetch_lfw_people导入数据 #其次对数据进行处理,首先得到X,y,分割数据集为训练集和测试集,PCA降维,然后训练 #最后查看正确率,classifi ...

  7. 答题卡的计分方式_如何建立信用风险模型和记分卡

    答题卡的计分方式 We are all aware of, and keep track of, our credit scores, don't we? That all-important num ...

  8. 统计建模-多元线性回归预测房价

    简单聊聊统计建模中,使用多元线性回归模型来预测房价. 文章目录 变量描述: (1)读取数据 (2)单变量描述 (3)自变量对因变量的影响分析 (4)检验变量重要性 (5)筛选出重要变量建模 (6)模型 ...

  9. python数据挖掘与入门实践(2.2)用sciket-learn估计器分类

    接python数据挖掘与入门实践(2.1)用sciket-learn估计器分类 三.运行算法 交叉验证一般分为三类:double-fold CV 即经常所说的2折交叉:10-fold交叉和LOO(le ...

  10. sklearn - Dimensionality reduction

    参考: 1.http://scikit-learn.org/stable/ 2.http://scikit-learn.org/stable/modules/decomposition.html#de ...

最新文章

  1. 暑期集训3:几何基础 练习题B: HDU - 2001
  2. 马斯克宣布特斯拉破产,自己哭晕在车旁?
  3. R语言ggplot2可视化、不同分组使用不同的色彩、同一分组(group)的线条使用相同的色彩但是配置使用不同的线型(line type)
  4. 子报表修改后需要重新导入,0.00显示.00的调整方法
  5. java http请求实现_JAVA实现HTTP请求方式
  6. Cartographer—ROS中的安装
  7. php判断post是否xss,PHP实现表单提交数据的验证处理功能【防SQL注入和XSS攻击等】...
  8. 项目入口_住宅小区入口就该这么设计,说得好仔细!
  9. 数的三次方根(二分查找)
  10. 【内网学习笔记】14、发现主机缺失补丁
  11. 学计算机能考南京哪个大学,这三所南京市高校,适合报考计算机类专业,适合的考生不要错过...
  12. 华为系统和计算机,电脑手机合二为一 华为多屏协同让电脑与手机亲密互动
  13. 在Excel里快速插入目录
  14. Spring cloud config 配置文件加密
  15. Prometheus-监控主机基础指标配置及告警
  16. “梵高。向日葵”为什么值3亿
  17. 针对移动式和无线物联网设备的低压电机控制系统的设计
  18. VRRP和DHCP的设置
  19. LIS系统源码 检验信息管理系统源码
  20. 《网络安全工程师笔记》 第五章:用户与组管理

热门文章

  1. python中imag是什么意思_Python-在imag中查找主要/最常见的颜色
  2. Openstack Periodic Task
  3. 闲鱼前端组件库的建设
  4. 简单的介绍一下腾讯的TAPD
  5. PAT 1037 在霍沃茨找零钱
  6. 【MATLAB笔记】对矩阵进行满秩分解
  7. HDU-4826 Labyrinth(DP)
  8. Pidgin for windows 与MSN、ICQ、QQ、YAHOO、GoogleTalk、AIM/AOL等网络聊天工具互联互通的新型聊天软件
  9. VR/AR眼镜Type-C转接器边投屏边PD快充方案
  10. [CareerCup] 9.8 Represent N Cents 组成N分钱