sklearn的train_test_split函数
train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签。
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.2, random_state=0)
#或者
X_train, X_test, y_train, y_test = train_test_split(feature,label,stratify=label, random_state=50)
参数详解:
X/ feature: 特征/自变量
y / label: 标签/因变量
train_size: 训练集数所占比例
test_size: 测试集数所占比例
random_state: 随机种子,默认值为0。
随机数种子:其实就是该组随机数的编号,在需要重复试验的时候,保证得到一组一样的随机数。比如你每次都填1,其他参数一样的情况下你得到的随机数组是一样的。但填0或不填,每次都会不一样。随机数的产生取决于种子,随机数和种子之间的关系遵从以下两个规则:种子不同,产生不同的随机数;种子相同,即使实例不同也产生相同的随机数。
stratify =label : 依据标签y,按原数据y中各类比例,分配给train和test,使得train和test中各类数据的比例与原数据集一样。
转载于:https://www.cnblogs.com/Christina-Notebook/p/10278495.html
sklearn的train_test_split函数相关推荐
- sklearn之train_test_split()函数各参数
sklearn之train_test_split()函数各参数 在机器学习中,我们通常将原始数据按照比例分割为"测试集"和"训练集",从 sklearn.mod ...
- sklearn之train_test_split()函数各参数含义
在机器学习中,我们通常将原始数据按照比例分割为"测试集"和"训练集",从 sklearn.model_selection 中调用train_test_split ...
- sklearn中train_test_split函数中的random_state有什么用?
我们先生成下面的训练数据. import numpy as np from sklearn.model_selection import train_test_split #生成训练数据 x=np.l ...
- 机器学习sklearn.model_selection.train_test_split函数使用
splitting = train_test_split(*arrays,**options) 如: X_train, X_test, y_train, y_test = train_test_spl ...
- sklearn的train_test_split()各函数参数含义解释(非常全)
sklearn的train_test_split()各函数参数含义解释(非常全) sklearn的train_test_split()各函数参数含义解释(非常全) - The-Chosen-One - ...
- Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略
Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...
- 数据集划分函数sklearn.model_selection.train_test_split参数详解
该函数可以随机划分样本数据为训练集和测试集,并返回划分好的训练集和测试集数据. sklearn.model_selection.train_test_split(train_data,train_ta ...
- sklearn中的train_test_split()函数解析
sklearn中的train_test_split()函数解析 train_test_split()函数:机器学习中用于分割数据集(训练集和测试集) X_train,X_test,y_train,y_ ...
- sklearn中的train_test_split函数
train_test_split函数用于将数据集随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签. X_train,X_test, y_train, y_test =cr ...
最新文章
- 从oracle中读取图片,Pb从oracle中读取和保存图片
- 【故障修复】SharePoint Designer 无法登陆网站
- 树莓派4温度压力测试方法
- autocad完全应用指南_建筑绘图慢?580页的AUTOCAD完全自学必备指南,高效绘图不求人...
- 世界之窗浏览器怎么隐藏收藏栏
- 基于SOCKS的IPv4向IPv6过渡技术
- Wondershare Recoverit for Mac(数据恢复软件)
- 顶点计划一自行车组调查报告
- NOIP2013普及组初赛
- 领域驱动设计核心概念
- 使用python将多份pdf文件合并成一份
- 一个普通人的震后十年
- jinjia2中for循环索引
- RF天线设计的一些概念
- 微信扫一扫(wx.scanQRCode)功能新手可能遇到的问题
- [系统安全] 二十九.深信服分享之外部威胁防护和勒索病毒对抗
- 深度学习调参技巧(一)
- trie树之敏感词过滤算法
- PMP考试要点顺口溜
- excel拆分表格怎么做?
热门文章
- python3写冒泡排序_使用python3实现冒泡排序、选择排序和快速排序
- html制作统计期末成绩,JS-结合html综合练习js的对象——班级成绩表制作
- java的character用法_Java中Character类的使用方法
- 学计算机去大工中大,厦门大学和大连理工大学你 选哪个?哪个好。厦门大学和东南大学、天津大学、武汉大学、中山大学去那个...
- uWSGI 和 nginx 的区别?
- oracle实现主键自动增长
- JMS学习(2):ActiveMQ简单介绍以及安装
- win10 远程桌面卡顿_Win10系统远程桌面连接缓慢卡顿解决措施
- MetInfo最新版代码审计漏洞合集
- linux中使用xshell远程连接