train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签。

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.2, random_state=0)
#或者
X_train, X_test, y_train, y_test = train_test_split(feature,label,stratify=label, random_state=50)

参数详解:

X/ feature:  特征/自变量

y / label:  标签/因变量

train_size: 训练集数所占比例

test_size: 测试集数所占比例

random_state: 随机种子,默认值为0。

随机数种子:其实就是该组随机数的编号,在需要重复试验的时候,保证得到一组一样的随机数。比如你每次都填1,其他参数一样的情况下你得到的随机数组是一样的。但填0或不填,每次都会不一样。随机数的产生取决于种子,随机数和种子之间的关系遵从以下两个规则:种子不同,产生不同的随机数;种子相同,即使实例不同也产生相同的随机数。

stratify =label  : 依据标签y,按原数据y中各类比例,分配给train和test,使得train和test中各类数据的比例与原数据集一样。

转载于:https://www.cnblogs.com/Christina-Notebook/p/10278495.html

sklearn的train_test_split函数相关推荐

  1. sklearn之train_test_split()函数各参数

    sklearn之train_test_split()函数各参数 在机器学习中,我们通常将原始数据按照比例分割为"测试集"和"训练集",从 sklearn.mod ...

  2. sklearn之train_test_split()函数各参数含义

    在机器学习中,我们通常将原始数据按照比例分割为"测试集"和"训练集",从 sklearn.model_selection 中调用train_test_split ...

  3. sklearn中train_test_split函数中的random_state有什么用?

    我们先生成下面的训练数据. import numpy as np from sklearn.model_selection import train_test_split #生成训练数据 x=np.l ...

  4. 机器学习sklearn.model_selection.train_test_split函数使用

    splitting = train_test_split(*arrays,**options) 如: X_train, X_test, y_train, y_test = train_test_spl ...

  5. sklearn的train_test_split()各函数参数含义解释(非常全)

    sklearn的train_test_split()各函数参数含义解释(非常全) sklearn的train_test_split()各函数参数含义解释(非常全) - The-Chosen-One - ...

  6. Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...

  7. 数据集划分函数sklearn.model_selection.train_test_split参数详解

    该函数可以随机划分样本数据为训练集和测试集,并返回划分好的训练集和测试集数据. sklearn.model_selection.train_test_split(train_data,train_ta ...

  8. sklearn中的train_test_split()函数解析

    sklearn中的train_test_split()函数解析 train_test_split()函数:机器学习中用于分割数据集(训练集和测试集) X_train,X_test,y_train,y_ ...

  9. sklearn中的train_test_split函数

    train_test_split函数用于将数据集随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签. X_train,X_test, y_train, y_test =cr ...

最新文章

  1. 从oracle中读取图片,Pb从oracle中读取和保存图片
  2. 【故障修复】SharePoint Designer 无法登陆网站
  3. 树莓派4温度压力测试方法
  4. autocad完全应用指南_建筑绘图慢?580页的AUTOCAD完全自学必备指南,高效绘图不求人...
  5. 世界之窗浏览器怎么隐藏收藏栏
  6. 基于SOCKS的IPv4向IPv6过渡技术
  7. Wondershare Recoverit for Mac(数据恢复软件)
  8. 顶点计划一自行车组调查报告
  9. NOIP2013普及组初赛
  10. 领域驱动设计核心概念
  11. 使用python将多份pdf文件合并成一份
  12. 一个普通人的震后十年
  13. jinjia2中for循环索引
  14. RF天线设计的一些概念
  15. 微信扫一扫(wx.scanQRCode)功能新手可能遇到的问题
  16. [系统安全] 二十九.深信服分享之外部威胁防护和勒索病毒对抗
  17. 深度学习调参技巧(一)
  18. trie树之敏感词过滤算法
  19. PMP考试要点顺口溜
  20. excel拆分表格怎么做?

热门文章

  1. python3写冒泡排序_使用python3实现冒泡排序、选择排序和快速排序
  2. html制作统计期末成绩,JS-结合html综合练习js的对象——班级成绩表制作
  3. java的character用法_Java中Character类的使用方法
  4. 学计算机去大工中大,厦门大学和大连理工大学你 选哪个?哪个好。厦门大学和东南大学、天津大学、武汉大学、中山大学去那个...
  5. uWSGI 和 nginx 的区别?
  6. oracle实现主键自动增长
  7. JMS学习(2):ActiveMQ简单介绍以及安装
  8. win10 远程桌面卡顿_Win10系统远程桌面连接缓慢卡顿解决措施
  9. MetInfo最新版代码审计漏洞合集
  10. linux中使用xshell远程连接