sklearn的train_test_split

train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签。

格式:

X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.3, random_state=0)

参数解释

train_data:被划分的样本特征集

train_target:被划分的样本标签

test_size:如果是浮点数,在0-1之间,表示样本占比;如果是整数的话就是样本的数量

random_state:是随机数的种子。

随机数种子:其实就是该组随机数的编号,在需要重复试验的时候,保证得到一组一样的随机数。比如你每次都填1,其他参数一样的情况下你得到的随机数组是一样的。但填0或不填,每次都会不一样。

随机数的产生取决于种子,随机数和种子之间的关系遵从以下两个规则:

种子不同,产生不同的随机数;种子相同,即使实例不同也产生相同的随机数。

示例

>>> import numpy as np
>>> from sklearn.model_selection import train_test_split
>>> X, y = np.arange(10).reshape((5, 2)), range(5)
>>> X
array([[0, 1],[2, 3],[4, 5],[6, 7],[8, 9]])
>>> list(y)
[0, 1, 2, 3, 4]

>>>

>>> X_train, X_test, y_train, y_test = train_test_split(
...     X, y, test_size=0.33, random_state=42)
...
>>> X_train
array([[4, 5],[0, 1],[6, 7]])
>>> y_train
[2, 0, 3]
>>> X_test
array([[2, 3],[8, 9]])
>>> y_test
[1, 4]

sklearn的train_test_split相关推荐

  1. sklearn的train_test_split()各函数参数含义解释(非常全)

    sklearn的train_test_split()各函数参数含义解释(非常全) sklearn的train_test_split()各函数参数含义解释(非常全) - The-Chosen-One - ...

  2. 数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split]、[h2o]、[网格搜索]、[numpy]、[plotly.express]}

    数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split].[h2o].[网格搜索].[numpy].[plotly.expres ...

  3. sklearn的train_test_split,果然很好用啊!

    sklearn的train_test_split train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签. 格式: X_train ...

  4. [Python+sklearn] 拆分数据集为训练和测试子集 sklearn.model_selection.train_test_split()

    Python - sklearn 拆分数据集为训练和测试子集 sklearn.model_selection.train_test_split() 功能: 将数组或矩阵拆分为随机的训练子集和测试子集 ...

  5. sklearn之train_test_split()函数各参数含义

    在机器学习中,我们通常将原始数据按照比例分割为"测试集"和"训练集",从 sklearn.model_selection 中调用train_test_split ...

  6. 数据集划分函数sklearn.model_selection.train_test_split参数详解

    该函数可以随机划分样本数据为训练集和测试集,并返回划分好的训练集和测试集数据. sklearn.model_selection.train_test_split(train_data,train_ta ...

  7. 切分数据集(train_test_split),思路分享及手打代码和介绍sklearn中train_test_split,适合小白入门

    本篇博客介绍train_test_split,步骤1-4是自己手打代码和思路分享,步骤5介绍如何使用sklearn中的train_test_split,步骤3有介绍随机种子哦,简单易懂,适合小白入门 ...

  8. sklearn之train_test_split()函数各参数

    sklearn之train_test_split()函数各参数 在机器学习中,我们通常将原始数据按照比例分割为"测试集"和"训练集",从 sklearn.mod ...

  9. sklearn.model_selection.train_test_split随机划分训练集和测试集

    1 函数用途 train_test_split()是交叉验证中常用的函数,功能是将数组或矩阵按比例随机划分为训练集和测试集,使用方法为: X_train,X_test, y_train, y_test ...

最新文章

  1. java 全局变量 内存不回收_Java的内存 - 内存回收
  2. Haha!Sniffer Pro终于可以用啦~
  3. python 字符串list转为数字list
  4. [转]另一个SqlParameterCollection 中已包含 SqlParameter[解决方案]
  5. 转结构体_golang处理gb2312转utf8编码的问题
  6. python批量读取dbf_Python 读取DBF/FPT 文件
  7. 一些定义–测试技术9
  8. LeetCode 84. 柱状图中最大的矩形(Largest Rectangle in Histogram)
  9. 精通 TensorFlow 1.x 中文版(初稿)
  10. python2.7中没有zlib库的解决方案(zipimport.ZipImportError: can't decompress data; zlib not available)
  11. java创建对象的几种方式
  12. pcl库python_成功安装 linux pcl (1.8.1版本) python-pcl
  13. YJX_rxjh_21_3.2.3
  14. JS 数组reduce()方法详解及高级技巧
  15. 解决方案:Coin3D安装编译以及配合VS2019、QT的使用
  16. 古代小说鉴赏辞典 - 郭子仪
  17. 10月24日——程序猿的节日
  18. 模具设计的四个步骤总结
  19. body 没有被撑开_为什么父div没有被撑开
  20. Android 常用命令行和 源码编译

热门文章

  1. python二维数组换行输出_关于用python绘制二维数组的问题
  2. Springboot分层图解
  3. AC_Dream 1216 G - Beautiful People
  4. android贝塞尔曲线多点,Canvas 贝塞尔曲线的多点波动
  5. php carbon 连续日期,日期及时间处理包 Carbon 在 Laravel 中的简单使用
  6. android html转pdf工具,android – 使用iText库将html转换为pdf时未应用hr的内联CSS
  7. mysql数据库sql注入原理_SQL注入原理解析以及举例1
  8. centos daemonize_手把手教你在centos上配置Django项目(超详细步骤)
  9. Shell脚本——变量
  10. 【二分+二维前缀和】Largest Allowed Area