sklearn.model_selection.train_test_split随机划分训练集和测试集
官网文档:http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html#sklearn.model_selection.train_test_split

一般形式:
train_test_split是交叉验证中常用的函数,功能是从样本中随机的按比例选取train_data和test_data,形式为:
X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.4, random_state=0)

cross_validatio为交叉验证

参数解释:

train_data:所要划分的样本特征集
train_target:所要划分的样本结果
test_size:样本占比,如果是整数的话就是样本的数量
random_state:是随机数的种子
随机数种子:其实就是该组随机数的编号,在需要重复试验的时候,保证得到一组一样的随机数。比如你每次都填1,其他参数一样的情况下你得到的随机数组是一样的。但填0或不填,每次都会不一样。
随机数的产生取决于种子,随机数和种子之间的关系遵从以下两个规则:
种子不同,产生不同的随机数;种子相同,即使实例不同也产生相同的随机数。

import numpy as np
from sklearn.model_selection import train_test_splitX,y=np.arange(10).reshape((5,2)),range
X=np.array([[0,1],[2,3],[4,5],[6,7],[8,9]])
y=[0,1,2,3,4]
print(X)
print(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=0)
print(X_train)
print(y_train)
print(X_test)
print(y_test)

结果为

[[0 1][2 3][4 5][6 7][8 9]]
[0, 1, 2, 3, 4]
[[2 3][6 7][8 9]]
[1, 3, 4]
[[4 5][0 1]]
[2, 0]

train_test_split用法总结相关推荐

  1. Sklearn的train_test_split用法

    https://blog.csdn.net/fxlou/article/details/79189106

  2. train_test_split()用法

    https://blog.csdn.net/The_Time_Runner/article/details/93613943

  3. python机器学习 train_test_split()函数用法解析及示例 划分训练集和测试集 以鸢尾数据为例 入门级讲解

    文章目录 train_test_split()用法 获取数据 划分训练集和测试集 完整代码脚手架 train_test_split()用法 python机器学习中常用 train_test_split ...

  4. Python——KNN实战(附详细代码与注解)

    估计各位绅士都看过我之前的KNN算法博文(嘿嘿≧◔◡◔≦,假装大家都看过),应广大博客朋友们的要求,本次博主来开车讲解如何做一个KNN分类器实现将iris数据集进行分类.关于KNN的相关知识请看机器学 ...

  5. 深度学习-9.20(仅自己学习使用)

    ​​​torch.nn.Conv2d()函数详解 参数详解: torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, pad ...

  6. 【机器学习kaggle赛事】泰坦尼克号生存预测

    目录 写在前面 数据集情况查看 数据清洗 Embarked: Fare Age Cabin 特征工程 1,探究Sex与Survived的相关性 2,探究Pcalss与Survived的关联性 3,Em ...

  7. 深度学习经典应用——鸢尾花分类(基于sklearn包)+三维成果可视化

    文章目录 任务描述 数据集 Step1. 数据准备 Step2. 模型搭建 Step3.模型训练 Step4. 模型评估 Step5. 模型使用 3D可视化模型 任务描述 构建一个模型,根据鸢尾花的花 ...

  8. 乳腺癌细胞数据分析Logistic回归模型

    Breast_cancer_cells & Logistic_Regression 数据集以及源代码资源包: 链接:https://pan.baidu.com/s/1VIjTjtSa1Jngq ...

  9. python 期末复习笔记

    关于python大数据分析的期末选择题已经整理好啦,关注公众号:大数据智库,回复[大数据选择题],即可获得网盘连接! 文章目录 1.类型 数据类型 数值类型 值类型与引用类型 可变与不可变对象类型 1 ...

最新文章

  1. CodeGen API分析
  2. linux 界面工具 qt,Qt主窗口中的工具栏
  3. 百度地图API之MyLocationOverlay的使用(Android)
  4. 爬取豆瓣电影排名前250部电影并且存入Mongo数据库
  5. 云VS本地,一言难尽的ERP
  6. web之用FileUpload上传文件
  7. [XSY3381] 踢罐子(几何)
  8. axios 使用步骤很简单,首先在前端项目中,引入 axios:
  9. 2014/4/4做题感悟
  10. 计算机网络实训室建设设备,计算机网络技术综合实训室建设方案.doc
  11. 再也不学AJAX了!(一)AJAX概述
  12. 重启mysql tomcat_linux下MySQL、Tomcat、Redis、Nginx停止和重启
  13. php解析torrent文件格式,bittorrent 种子文件结构解析
  14. 蓝牙运动耳机什么牌子好,分享六款好用的运动耳机
  15. 德州奥斯汀大学计算机专业,德克萨斯大学奥斯汀分校计算机系
  16. python新闻文本爬虫_python学习_新闻联播文字版爬虫(V 1.0版)
  17. FPGA:ov7725摄像头通过VGA/HDMI显示RGB565格式的图像
  18. 《操作系统真象还原》第十四章 ---- 实现文件系统 任务繁多 饭得一口口吃路得一步步走啊(上一)
  19. 安装时总是显示“$(DllSelfRegisterEx)不能被注册” 的解决方法
  20. IOS锁屏状态播放音乐时显示专辑信息和图片

热门文章

  1. 数据结构python描述英文版_数据结构——Python语言描述
  2. hdmi网线延长器_一种百米级HDMI高清网线延长器的制作方法
  3. php js给input的赋值,JavaScript给input的value赋值引发的关于基本类型值和引用类型值问题_javascript技巧...
  4. Selenium xpath无法解析的如何处理
  5. Python计算一个数的阶乘
  6. 视频下载工具“硕鼠”与遨游浏览器的比拼(图文)
  7. Zero-DCE++运行问题
  8. 与波导分道扬镳后传音控股再谋借壳非洲之王欲在A股扬名
  9. 爆牙齿的世界杯日记(八分之一之巴西区)
  10. RDP 优化操作 微软远程桌面 开启显卡加速、60FPS、USB设备重定向