Stratified k-foldTimeSeriesSplit
教程连接:https://scikit-learn.org/stable/modules/cross_validation.html#cross-validation
当样本中各类的含量不平衡时用Stratified k-fold函数来选择训练集和学习集。例如:
X=np.ones(10)
y=[0,0,0,0,1,1,1,1,1,1]
len(y)
10
skf=StratifiedKFold(n_splits=3)
for train,test in skf.split(X,y):
print(’%s %s’ % (train,test))
[2 3 6 7 8 9] [0 1 4 5]
[0 1 3 4 5 8 9] [2 6 7]
[0 1 2 4 5 6 7] [3 8 9]
2.GroupKFold:用于分类又group的数据
3.TimeSeriesSplit:时间序列数据训练集与测试集的分类方法
例如:
from sklearn.model_selection import TimeSeriesSplit
X=np.array([[1,2],[3,4],[1,2],[3,4],[1,2],[3,4]])
y=np.array(range(6))
y
array([0, 1, 2, 3, 4, 5])
y=np.array(range(1,7))
y
array([1, 2, 3, 4, 5, 6])
tscv=TimeSeriesSplit(n_splits=3)
print(tscv)
TimeSeriesSplit(max_train_size=None, n_splits=3)
for train,test in tscv.split(X):
print(’%s %s’ % (train,test))
[0 1 2] [3]
[0 1 2 3] [4]
[0 1 2 3 4] [5]
Stratified k-foldTimeSeriesSplit相关推荐
- svm rbf人脸识别 yale_实操课——机器学习之人脸识别
SVM(Support Vector Machine)指的是支持向量机,是常见的一种判别方法.在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别.分类以及回归分析.在n维空间中找到一个分类超 ...
- 支持向量机svm的完整实现并配有解析
svm分析(类似于源码) from future import print_function from time import time import logging #绘图工具 import mat ...
- 机器学习理论之SVM
支持向量机系列 (1) 算法理论理解 http://blog.pluskid.org/?page_id=683 手把手教你实现SVM算法(一) (2) 算法应用 算法应用----python 实现实例 ...
- [译]使用scikit-learn进行机器学习的简介(教程1)
原文:http://www.cnblogs.com/taceywong/p/4568806.html 原文地址:http://scikit-learn.org/stable/tutorial/basi ...
- 麦子学院深度学习视频SVM人脸识别课程代码修改及实现
1.麦子学院深度学习SVM人脸识别原代码对应修改 2.代码实现 1.麦子学院深度学习SVM人脸识别原代码对应修改 1.1 from sklearn.cross_validation import tr ...
- 人脸识别SVM算法实现--参考麦子学院彭亮机器学习基础5.2
#本例为人脸识别的SVM算法 #首先fetch_lfw_people导入数据 #其次对数据进行处理,首先得到X,y,分割数据集为训练集和测试集,PCA降维,然后训练 #最后查看正确率,classifi ...
- 答题卡的计分方式_如何建立信用风险模型和记分卡
答题卡的计分方式 We are all aware of, and keep track of, our credit scores, don't we? That all-important num ...
- 统计建模-多元线性回归预测房价
简单聊聊统计建模中,使用多元线性回归模型来预测房价. 文章目录 变量描述: (1)读取数据 (2)单变量描述 (3)自变量对因变量的影响分析 (4)检验变量重要性 (5)筛选出重要变量建模 (6)模型 ...
- python数据挖掘与入门实践(2.2)用sciket-learn估计器分类
接python数据挖掘与入门实践(2.1)用sciket-learn估计器分类 三.运行算法 交叉验证一般分为三类:double-fold CV 即经常所说的2折交叉:10-fold交叉和LOO(le ...
- sklearn - Dimensionality reduction
参考: 1.http://scikit-learn.org/stable/ 2.http://scikit-learn.org/stable/modules/decomposition.html#de ...
最新文章
- 暑期集训3:几何基础 练习题B: HDU - 2001
- 马斯克宣布特斯拉破产,自己哭晕在车旁?
- R语言ggplot2可视化、不同分组使用不同的色彩、同一分组(group)的线条使用相同的色彩但是配置使用不同的线型(line type)
- 子报表修改后需要重新导入,0.00显示.00的调整方法
- java http请求实现_JAVA实现HTTP请求方式
- Cartographer—ROS中的安装
- php判断post是否xss,PHP实现表单提交数据的验证处理功能【防SQL注入和XSS攻击等】...
- 项目入口_住宅小区入口就该这么设计,说得好仔细!
- 数的三次方根(二分查找)
- 【内网学习笔记】14、发现主机缺失补丁
- 学计算机能考南京哪个大学,这三所南京市高校,适合报考计算机类专业,适合的考生不要错过...
- 华为系统和计算机,电脑手机合二为一 华为多屏协同让电脑与手机亲密互动
- 在Excel里快速插入目录
- Spring cloud config 配置文件加密
- Prometheus-监控主机基础指标配置及告警
- “梵高。向日葵”为什么值3亿
- 针对移动式和无线物联网设备的低压电机控制系统的设计
- VRRP和DHCP的设置
- LIS系统源码 检验信息管理系统源码
- 《网络安全工程师笔记》 第五章:用户与组管理
热门文章
- python中imag是什么意思_Python-在imag中查找主要/最常见的颜色
- Openstack Periodic Task
- 闲鱼前端组件库的建设
- 简单的介绍一下腾讯的TAPD
- PAT 1037 在霍沃茨找零钱
- 【MATLAB笔记】对矩阵进行满秩分解
- HDU-4826 Labyrinth(DP)
- Pidgin for windows 与MSN、ICQ、QQ、YAHOO、GoogleTalk、AIM/AOL等网络聊天工具互联互通的新型聊天软件
- VR/AR眼镜Type-C转接器边投屏边PD快充方案
- [CareerCup] 9.8 Represent N Cents 组成N分钱