机器学习中对于数据的随机划分

train_test_split的引用: from sklearn.model_selection import train_test_split

例如:

import numpy as npfrom sklearn.model_selection import train_test_splitX,y=np.arange(10).reshape((5,2)),range
X=np.array([[0,1],[2,3],[4,5],[6,7],[8,9]])
y=[0,1,2,3,4]
print(X)
print(y)X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.4,random_state=0)print(X_train)print(X_test)print(y_train)print(y_test)

#X_train为训练集,X_test为测试集,y_train为训练集,y_test为测试集

train_test_split  将数据集划分成X_train,X_test,y_train,y_test  四部分

train_test_split (train_data,train_target,test_size=0.4, random_state=0)

train_data:所要划分的样本整体

train_target所要划分的样本分类结果

test_size:测试样本占比,如果是整数的话就是样本数量

random_state=0:随机数种子  这里的random_state就是为了保证程序每次运行都分割一样的训练集和测试集。   

思考题:random=0和random=1有什么区别?

train_test_split的用法(机器学习)相关推荐

  1. python机器学习 train_test_split()函数用法解析及示例 划分训练集和测试集 以鸢尾数据为例 入门级讲解

    文章目录 train_test_split()用法 获取数据 划分训练集和测试集 完整代码脚手架 train_test_split()用法 python机器学习中常用 train_test_split ...

  2. train_test_split()函数用法

    链接: sklearn.model_selection.train_test_split 1 用途 分裂数组或矩阵为随机的训练集和测试集. 是一个快速实用的工具,能够包装输入验证.next(Shuff ...

  3. 机器学习之train_test_split详解

    文章目录 前言 一.train_test_split是什么? 二.使用步骤 1.引入库 2.读入数据 3.参数意义 总结 前言 train_test_split是python在机器学习中常常需要用到的 ...

  4. 机器学习之XGBoost模型学习

    1.划分数据集函数train_test_split以及数据的加载: python机器学习 train_test_split()函数用法解析及示例 划分训练集和测试集 以鸢尾数据为例 入门级讲解_侯小啾 ...

  5. 机器学习系列(10)_决策树与随机森林回归

    注:本篇文章接上一篇文章>>机器学习系列(9)_决策树详解01 文章目录 一.决策树优缺点 二.泰坦尼克号幸存者案例 三.随机森林介绍 1.随机森林的分类 2.重要参数 [1]n_esti ...

  6. sklearn中的train_test_split()函数解析

    sklearn中的train_test_split()函数解析 train_test_split()函数:机器学习中用于分割数据集(训练集和测试集) X_train,X_test,y_train,y_ ...

  7. python3 opencv 输出中文

    pip install opencv-python opencv读取中文路径图片: opencv读取中文路径图片_jacke121的专栏-CSDN博客_opencv中文路径 win 安装 pip in ...

  8. 房地产特征价格评估的次市场效应模型: 一种概率方法撰写

    文章目录 一.数据预处理部分 (一)使用到的库 (二)使用到的函数 (三)实现流程 二.POI数据处理部分 (一)使用到的库 (二)使用到的函数 (三)实现流程 三.BN (一)使用到的库 (二)使用 ...

  9. 数据挖掘报告——汽车销售行业行为识别

    目录 项目背景 需求分析 功能分析 详细讲解 1. 数据导入 2.数据处理 2.1独热特征编码 2.2分离结果集 2.3转换文本为int类型 2.4删除多余数据 3数据可视化 3.1数据归一化 3.2 ...

最新文章

  1. python精通-干货|Python学习必须精通的几个模块
  2. 度量相似性数学建模_【数学建模】day09-聚类分析
  3. 【HDU - 1850】Being a Good Boy in Spring Festival (尼姆博弈,nim,异或前缀和)
  4. [转载] Java基础之构造方法(函数)何时被调用
  5. 【中级02】Java Class字节码文件底层逻辑详解
  6. maya curveflow修改
  7. 【R语言】rep用法(自用)
  8. 点云匹配方法NDT(正态分布变换)
  9. 如何使用Pandas进行数据分析!最详细的数据分析教程!
  10. n阶奇数魔方阵c语言编程,n阶魔方阵C语言
  11. Linus 批评英特尔的 LAM 代码,拒绝将其合并到内核
  12. 比价寄快递CPS小程序开发
  13. 孙陶然:核心价值观是企业用人的“一票否决权”
  14. 贪玩蓝月服务器维护需多少时间,贪玩蓝月8月26日00:10部分区服维护公告
  15. 大话数据结构笔记【1】:数据结构绪论
  16. python+appium,常见报错与解决方法
  17. linux中go读取mysql_如何利用Golang解析读取Mysql备份文件
  18. 学习《Linux就该这么学》第十五课
  19. 微信支付--安装支付证书的坑
  20. android反馈简书,Android HapticFeedback(触觉反馈)

热门文章

  1. Android启动页白屏/黑屏问题解决
  2. lemon详细使用方法
  3. 【推荐】自用软件工具推荐 WIN
  4. AnyDesk 远程桌面控制、替代TeamViewer
  5. AnyDesk如何设置自动连接
  6. 【自动控制原理_B站网课笔记】控制系统的结构图
  7. .net安装或运行时提示stdole.dll错误
  8. 技术只是工作的一部分
  9. 【许愿贴】写在考研查分前和后
  10. MYSQL 自定义函数,查询节点所有父节点、查询节点所有子节点