该函数可以随机划分样本数据为训练集和测试集,并返回划分好的训练集和测试集数据。

sklearn.model_selection.train_test_split(train_data,train_target,test_size=0.3,random_state=5)

参数详解:

  • train_data:待划分样本数据
  • train_target:待划分样本数据的结果,与train_data一一对应
  • test_size:可以为浮点、整数或None,默认为None
    浮点数表示测试数据占总样本的比例;整数表示测试样本的样本数量;
    若为None时,test size自动设置成0.25 test_size决定划分测试、训练集比例
  • random_state:设置随机数种子
    在其它参数相同的情况下,同一个随机数得到的随机数组一样
    若为0或None或不填,则每次得到数据都不一样
  • stratify:可以处理数据不平衡问题
    stratify=train_target时,每次划分后,测试集和训练集中的标签比例同原始的样本中标签的比例相同。假设原始样本中标签A和标签B的比例为1:5,测试集和训练集中标签A和标签B的比例都为1:5

数据集划分函数sklearn.model_selection.train_test_split参数详解相关推荐

  1. Lesson 8.1Lesson 8.2 决策树的核心思想与建模流程CART分类树的建模流程与sklearn评估器参数详解

    Lesson 8.1 决策树的核心思想与建模流程 从本节课开始,我们将介绍经典机器学习领域中最重要的一类有监督学习算法--树模型(决策树). 可此前的聚类算法类似,树模型也同样不是一个模型,而是一类模 ...

  2. train_test_split 参数详解

    train_test_split 参数详解 简单用法如下: from sklearn.model_selection import train_test_split from sklearn.data ...

  3. 站长在线Python精讲:在Python函数中的默认参数详解

    欢迎你来到站长在线的站长学堂学习Python知识,本文学习的是<在Python函数中的默认参数详解>.本文的主要内容有:默认参数的概念和默认参数的示例.默认参数不能设置可变对象. 目录 1 ...

  4. 站长在线Python教程精讲:在Python函数中的关键字参数详解

    欢迎你来到站长在线的站长学堂学习Python知识,本文学习的是<在Python函数中的关键字参数详解>.本文的主要内容有:关键字参数的含义和关键字参数的应用举例. 目录 1.关键字参数的含 ...

  5. 感知机(perceptron):原理、python实现及sklearn.linear_model.Perceptron参数详解

    文章目录 1.感知机模型介绍 2.感知机学习策略 3.感知机学习算法 3.1 原始形式 3.2.1算法收敛性的证明 3.2对偶形式 4.python实现感知机算法 4.1手写感知机算法 4.2 sci ...

  6. PCA降维原理及其代码实现(附加 sklearn PCA用法参数详解)

    学习笔记 本篇博文绝大多数来源于书籍<机器学习实战> 记录自己的学习笔记而已. 降维作用 (1)使得数据集更容易使用 (2)降低很多算法的计算开销 (3)去除噪声 (4)多维数据不容易画图 ...

  7. WordPress分类列表函数:wp_list_categories用法及参数详解举例

    http://www.511yj.com/wordpress-wp-categories.html 注意: 1. wp_list_categories() 和 list_cats() 以及 wp_li ...

  8. mysql 时间取日期函数_mysql 获取当前日期函数及时间格式化参数详解

    MYSQL 获取当前日期及日期格式 获取系统日期: NOW() 格式化日期: DATE_FORMAT(date, format) 注: date:时间字段 format:日期格式 返回系统日期,输出 ...

  9. mysql ifnull 用法_MYSQL IFNULL函数的使用和参数详解

    MYSQL IFNULL(expr1,expr2) 如果expr1不是NULL,IFNULL()返回expr1,否则它返回expr2.IFNULL()返回一个数字或字符串值,取决于它被使用的上下文环境 ...

最新文章

  1. 【BZOJ1305】 [CQOI2009]dance跳舞
  2. YY项目之TabLayout自定义Tab的title
  3. Codeforces Round #183 (Div. 2) C
  4. 数据搬运组件:基于Sqoop管理数据导入和导出
  5. Mysql基础--表的操作
  6. 解决ORA-01578错误一例
  7. 1192. [HNOI2006]鬼谷子的钱袋【进制】
  8. Java常见面试题:BIO,NIO,AIO 有什么区别?
  9. Android 四大组件学习之Service四
  10. Java自学视频整理
  11. 魔法表格(MagicTable)入门教程--CAD转Excel、CAD多个表格批量转Excel
  12. 【java实现地图经纬度逆编码】通过使用百度/高德地图的开放平台 实现经纬度与中文地址的转换(附代码方法)
  13. Dexpot 虚拟桌面软件(推荐)
  14. 搜狐财报:年度盈利,长跑依旧
  15. 吃透JAVA的Stream流操作,多年实践总结
  16. 3.1 学习计算机,从编程入手 ——《逆袭大学》连载
  17. 傻傻分不清:时间趋势项与时间虚拟变量
  18. 企业如何通过CRM系统做好客户管理?
  19. 设计模式.外观模式Facade
  20. 带你初识JSP(JAVA服务器页面)

热门文章

  1. Python合适的开发工具
  2. 【新闻推荐系统】(task1)系统搭建基本流程
  3. hadoop大数据生态集群
  4. 【C/C++】龙格库塔+亚当姆斯求解数值微分初值问题
  5. 抓包工具--Fiddler
  6. 声学参数-基频-Librosa标准: 基频的文字定义和用librosa提取wav文件基频
  7. String转字节数组
  8. Android中的消息推送
  9. Android谷歌推送
  10. cas19660-77-6/Chlorin E6/二氢卟吩 E6;meso-四(4-甲基-3-磺酸苯基)卟啉[简称T(4-MP)PS4];碘化四(4-三甲氨基苯基)卟啉(TTMAPPI)齐岳定制