sklearn的train_test_split
sklearn的train_test_split
train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签。
格式:
X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.3, random_state=0)
参数解释:
train_data:被划分的样本特征集
train_target:被划分的样本标签
test_size:如果是浮点数,在0-1之间,表示样本占比;如果是整数的话就是样本的数量
random_state:是随机数的种子。
随机数种子:其实就是该组随机数的编号,在需要重复试验的时候,保证得到一组一样的随机数。比如你每次都填1,其他参数一样的情况下你得到的随机数组是一样的。但填0或不填,每次都会不一样。
随机数的产生取决于种子,随机数和种子之间的关系遵从以下两个规则:
种子不同,产生不同的随机数;种子相同,即使实例不同也产生相同的随机数。
示例
>>> import numpy as np >>> from sklearn.model_selection import train_test_split >>> X, y = np.arange(10).reshape((5, 2)), range(5) >>> X array([[0, 1],[2, 3],[4, 5],[6, 7],[8, 9]]) >>> list(y) [0, 1, 2, 3, 4]
>>>
>>> X_train, X_test, y_train, y_test = train_test_split( ... X, y, test_size=0.33, random_state=42) ... >>> X_train array([[4, 5],[0, 1],[6, 7]]) >>> y_train [2, 0, 3] >>> X_test array([[2, 3],[8, 9]]) >>> y_test [1, 4]
sklearn的train_test_split相关推荐
- sklearn的train_test_split()各函数参数含义解释(非常全)
sklearn的train_test_split()各函数参数含义解释(非常全) sklearn的train_test_split()各函数参数含义解释(非常全) - The-Chosen-One - ...
- 数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split]、[h2o]、[网格搜索]、[numpy]、[plotly.express]}
数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split].[h2o].[网格搜索].[numpy].[plotly.expres ...
- sklearn的train_test_split,果然很好用啊!
sklearn的train_test_split train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签. 格式: X_train ...
- [Python+sklearn] 拆分数据集为训练和测试子集 sklearn.model_selection.train_test_split()
Python - sklearn 拆分数据集为训练和测试子集 sklearn.model_selection.train_test_split() 功能: 将数组或矩阵拆分为随机的训练子集和测试子集 ...
- sklearn之train_test_split()函数各参数含义
在机器学习中,我们通常将原始数据按照比例分割为"测试集"和"训练集",从 sklearn.model_selection 中调用train_test_split ...
- 数据集划分函数sklearn.model_selection.train_test_split参数详解
该函数可以随机划分样本数据为训练集和测试集,并返回划分好的训练集和测试集数据. sklearn.model_selection.train_test_split(train_data,train_ta ...
- 切分数据集(train_test_split),思路分享及手打代码和介绍sklearn中train_test_split,适合小白入门
本篇博客介绍train_test_split,步骤1-4是自己手打代码和思路分享,步骤5介绍如何使用sklearn中的train_test_split,步骤3有介绍随机种子哦,简单易懂,适合小白入门 ...
- sklearn之train_test_split()函数各参数
sklearn之train_test_split()函数各参数 在机器学习中,我们通常将原始数据按照比例分割为"测试集"和"训练集",从 sklearn.mod ...
- sklearn.model_selection.train_test_split随机划分训练集和测试集
1 函数用途 train_test_split()是交叉验证中常用的函数,功能是将数组或矩阵按比例随机划分为训练集和测试集,使用方法为: X_train,X_test, y_train, y_test ...
最新文章
- java 全局变量 内存不回收_Java的内存 - 内存回收
- Haha!Sniffer Pro终于可以用啦~
- python 字符串list转为数字list
- [转]另一个SqlParameterCollection 中已包含 SqlParameter[解决方案]
- 转结构体_golang处理gb2312转utf8编码的问题
- python批量读取dbf_Python 读取DBF/FPT 文件
- 一些定义–测试技术9
- LeetCode 84. 柱状图中最大的矩形(Largest Rectangle in Histogram)
- 精通 TensorFlow 1.x 中文版(初稿)
- python2.7中没有zlib库的解决方案(zipimport.ZipImportError: can't decompress data; zlib not available)
- java创建对象的几种方式
- pcl库python_成功安装 linux pcl (1.8.1版本) python-pcl
- YJX_rxjh_21_3.2.3
- JS 数组reduce()方法详解及高级技巧
- 解决方案:Coin3D安装编译以及配合VS2019、QT的使用
- 古代小说鉴赏辞典 - 郭子仪
- 10月24日——程序猿的节日
- 模具设计的四个步骤总结
- body 没有被撑开_为什么父div没有被撑开
- Android 常用命令行和 源码编译
热门文章
- python二维数组换行输出_关于用python绘制二维数组的问题
- Springboot分层图解
- AC_Dream 1216 G - Beautiful People
- android贝塞尔曲线多点,Canvas 贝塞尔曲线的多点波动
- php carbon 连续日期,日期及时间处理包 Carbon 在 Laravel 中的简单使用
- android html转pdf工具,android – 使用iText库将html转换为pdf时未应用hr的内联CSS
- mysql数据库sql注入原理_SQL注入原理解析以及举例1
- centos daemonize_手把手教你在centos上配置Django项目(超详细步骤)
- Shell脚本——变量
- 【二分+二维前缀和】Largest Allowed Area