sklearn的train_test_split

train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签。

格式:

X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.3, random_state=0)

参数解释

train_data:被划分的样本特征集

train_target:被划分的样本标签

test_size:如果是浮点数,在0-1之间,表示样本占比;如果是整数的话就是样本的数量

random_state:是随机数的种子。

随机数种子:其实就是该组随机数的编号,在需要重复试验的时候,保证得到一组一样的随机数。比如你每次都填1,其他参数一样的情况下你得到的随机数组是一样的。但填0或不填,每次都会不一样。

随机数的产生取决于种子,随机数和种子之间的关系遵从以下两个规则:

种子不同,产生不同的随机数;种子相同,即使实例不同也产生相同的随机数。

示例

>>> import numpy as np
>>> from sklearn.model_selection import train_test_split >>> X, y = np.arange(10).reshape((5, 2)), range(5) >>> X array([[0, 1],  [2, 3],  [4, 5],  [6, 7],  [8, 9]]) >>> list(y) [0, 1, 2, 3, 4] 

>>>

>>> X_train, X_test, y_train, y_test = train_test_split( ... X, y, test_size=0.33, random_state=42) ... >>> X_train array([[4, 5],  [0, 1],  [6, 7]]) >>> y_train [2, 0, 3] >>> X_test array([[2, 3],  [8, 9]]) >>> y_test [1, 4]

转载于:https://www.cnblogs.com/bonelee/p/8036024.html

sklearn的train_test_split,果然很好用啊!相关推荐

  1. 切分数据集(train_test_split),思路分享及手打代码和介绍sklearn中train_test_split,适合小白入门

    本篇博客介绍train_test_split,步骤1-4是自己手打代码和思路分享,步骤5介绍如何使用sklearn中的train_test_split,步骤3有介绍随机种子哦,简单易懂,适合小白入门 ...

  2. sklearn的train_test_split()各函数参数含义解释(非常全)

    sklearn的train_test_split()各函数参数含义解释(非常全) sklearn的train_test_split()各函数参数含义解释(非常全) - The-Chosen-One - ...

  3. 数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split]、[h2o]、[网格搜索]、[numpy]、[plotly.express]}

    数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split].[h2o].[网格搜索].[numpy].[plotly.expres ...

  4. sklearn的train_test_split

    sklearn的train_test_split train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签. 格式: X_train ...

  5. [Python+sklearn] 拆分数据集为训练和测试子集 sklearn.model_selection.train_test_split()

    Python - sklearn 拆分数据集为训练和测试子集 sklearn.model_selection.train_test_split() 功能: 将数组或矩阵拆分为随机的训练子集和测试子集 ...

  6. sklearn之train_test_split()函数各参数含义

    在机器学习中,我们通常将原始数据按照比例分割为"测试集"和"训练集",从 sklearn.model_selection 中调用train_test_split ...

  7. 数据集划分函数sklearn.model_selection.train_test_split参数详解

    该函数可以随机划分样本数据为训练集和测试集,并返回划分好的训练集和测试集数据. sklearn.model_selection.train_test_split(train_data,train_ta ...

  8. sklearn之train_test_split()函数各参数

    sklearn之train_test_split()函数各参数 在机器学习中,我们通常将原始数据按照比例分割为"测试集"和"训练集",从 sklearn.mod ...

  9. sklearn中train_test_split函数中的random_state有什么用?

    我们先生成下面的训练数据. import numpy as np from sklearn.model_selection import train_test_split #生成训练数据 x=np.l ...

最新文章

  1. mysql每组随机一条_MySql分组后随机获取每组一条数据的操作
  2. 一种导致android开发时无法生成R.java文件的原因
  3. ubuntu 无法进入startx_Ubuntu无法进入图形化界面(报错/dev/sda1:clean的解决)
  4. e3是合法浮点数吗_下列哪些是不合法的浮点数的选项是 123 2e4.2 .e5 -e3 .234 1e3
  5. linux 编译3g驱动_linux重新编译内核
  6. JFinalConfig
  7. graphics | 基础绘图系统的拼图方法之三:使用mfrow、mfcol参数和layout函数
  8. Java服务端获取微信小程序openid(简单实现,搞懂原理)
  9. 安卓模拟器调试GPS
  10. 计算机安装应用程序卸的步骤,怎么彻底删除电脑安装的软件程序
  11. Vi 编辑器常用命令
  12. DELMIA软件:机器人与行走轴联动实现长焊缝弧焊焊接虚拟仿真
  13. 实施成功的ITIL变更管理的6个步骤
  14. Vue开发工具dev-tools的安装与使用
  15. 记实现多racecar仿真过程中遇到的问题(一)
  16. 如何让ARM板开机启动Qt
  17. C++字符串内数字统计
  18. 直播中常用的美颜sdk动态贴纸功能是什么?技术怎么实现的?
  19. 脱发的各种类型里,想判断自己是否属于雄激素性脱发、处于哪个阶段,怎么办?
  20. 三星Galaxy S20:如何调整振动强度和模式

热门文章

  1. docker ubuntu 离线安装包
  2. linux亲和性,两种亲和性
  3. mysql命令行的光标不显示和git-bash不能直接使用mysql登录的问题
  4. laravel中的where和orwhere的源码分析
  5. tp3.2.3权限控制一之详解及demo
  6. 【机器学习入门到精通系列】粒子群优化算法
  7. python【蓝桥杯vip练习题库】 ADV-364 天天向上(DP)
  8. 【Java Web前端开发】JavaScript高级
  9. 【深度学习笔记】ROC曲线 vs Precision-Recall曲线
  10. 网络计算机的广域性有什么,为什么计算机网络有局域网?