sklearn的train_test_split,果然很好用啊!
sklearn的train_test_split
train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签。
格式:
X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.3, random_state=0)
参数解释:
train_data:被划分的样本特征集
train_target:被划分的样本标签
test_size:如果是浮点数,在0-1之间,表示样本占比;如果是整数的话就是样本的数量
random_state:是随机数的种子。
随机数种子:其实就是该组随机数的编号,在需要重复试验的时候,保证得到一组一样的随机数。比如你每次都填1,其他参数一样的情况下你得到的随机数组是一样的。但填0或不填,每次都会不一样。
随机数的产生取决于种子,随机数和种子之间的关系遵从以下两个规则:
种子不同,产生不同的随机数;种子相同,即使实例不同也产生相同的随机数。
示例
>>> import numpy as np >>> from sklearn.model_selection import train_test_split >>> X, y = np.arange(10).reshape((5, 2)), range(5) >>> X array([[0, 1], [2, 3], [4, 5], [6, 7], [8, 9]]) >>> list(y) [0, 1, 2, 3, 4]
>>> X_train, X_test, y_train, y_test = train_test_split( ... X, y, test_size=0.33, random_state=42) ... >>> X_train array([[4, 5], [0, 1], [6, 7]]) >>> y_train [2, 0, 3] >>> X_test array([[2, 3], [8, 9]]) >>> y_test [1, 4]
转载于:https://www.cnblogs.com/bonelee/p/8036024.html
sklearn的train_test_split,果然很好用啊!相关推荐
- 切分数据集(train_test_split),思路分享及手打代码和介绍sklearn中train_test_split,适合小白入门
本篇博客介绍train_test_split,步骤1-4是自己手打代码和思路分享,步骤5介绍如何使用sklearn中的train_test_split,步骤3有介绍随机种子哦,简单易懂,适合小白入门 ...
- sklearn的train_test_split()各函数参数含义解释(非常全)
sklearn的train_test_split()各函数参数含义解释(非常全) sklearn的train_test_split()各函数参数含义解释(非常全) - The-Chosen-One - ...
- 数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split]、[h2o]、[网格搜索]、[numpy]、[plotly.express]}
数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split].[h2o].[网格搜索].[numpy].[plotly.expres ...
- sklearn的train_test_split
sklearn的train_test_split train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签. 格式: X_train ...
- [Python+sklearn] 拆分数据集为训练和测试子集 sklearn.model_selection.train_test_split()
Python - sklearn 拆分数据集为训练和测试子集 sklearn.model_selection.train_test_split() 功能: 将数组或矩阵拆分为随机的训练子集和测试子集 ...
- sklearn之train_test_split()函数各参数含义
在机器学习中,我们通常将原始数据按照比例分割为"测试集"和"训练集",从 sklearn.model_selection 中调用train_test_split ...
- 数据集划分函数sklearn.model_selection.train_test_split参数详解
该函数可以随机划分样本数据为训练集和测试集,并返回划分好的训练集和测试集数据. sklearn.model_selection.train_test_split(train_data,train_ta ...
- sklearn之train_test_split()函数各参数
sklearn之train_test_split()函数各参数 在机器学习中,我们通常将原始数据按照比例分割为"测试集"和"训练集",从 sklearn.mod ...
- sklearn中train_test_split函数中的random_state有什么用?
我们先生成下面的训练数据. import numpy as np from sklearn.model_selection import train_test_split #生成训练数据 x=np.l ...
最新文章
- mysql每组随机一条_MySql分组后随机获取每组一条数据的操作
- 一种导致android开发时无法生成R.java文件的原因
- ubuntu 无法进入startx_Ubuntu无法进入图形化界面(报错/dev/sda1:clean的解决)
- e3是合法浮点数吗_下列哪些是不合法的浮点数的选项是 123 2e4.2 .e5 -e3 .234 1e3
- linux 编译3g驱动_linux重新编译内核
- JFinalConfig
- graphics | 基础绘图系统的拼图方法之三:使用mfrow、mfcol参数和layout函数
- Java服务端获取微信小程序openid(简单实现,搞懂原理)
- 安卓模拟器调试GPS
- 计算机安装应用程序卸的步骤,怎么彻底删除电脑安装的软件程序
- Vi 编辑器常用命令
- DELMIA软件:机器人与行走轴联动实现长焊缝弧焊焊接虚拟仿真
- 实施成功的ITIL变更管理的6个步骤
- Vue开发工具dev-tools的安装与使用
- 记实现多racecar仿真过程中遇到的问题(一)
- 如何让ARM板开机启动Qt
- C++字符串内数字统计
- 直播中常用的美颜sdk动态贴纸功能是什么?技术怎么实现的?
- 脱发的各种类型里,想判断自己是否属于雄激素性脱发、处于哪个阶段,怎么办?
- 三星Galaxy S20:如何调整振动强度和模式