使用numpy.random.choice()和set()快速划分交叉训练数据集

之前在划分训练集和验证集时,都是手工随机生成index,很笨。

学到的新方法如下:

import numpy as np
# 正态分布生成原始数据
x = np.random.random.normal(1,0.1,100)
# 按8:2分割数据
x_train_index = np.random.choice(len(x),round(len(x)*0.8),replace = False)
x_valid_index = np.array(list(set(range(len(x))) - set(x_train_index)))x_train = x[x_train_index]
x_valid = x[x_valid_index]

总结1: np.random.choice()

Definition : choice(a, size=None, replace=True, p=None)

Type : Function of None module

Parameters
a : 1-D array-like or int
If an ndarray, a random sample is generated from its elements. If an int, the random sample is generated as if a was np.arange(n)
size : int or tuple of ints, optional
Output shape. If the given shape is, e.g., (m, n, k), then m * n * k samples are drawn. Default is None, in which case a single value is returned.
replace : boolean, optional
Whether the sample is with or without replacement
是否包含重复元素
p : 1-D array-like, optional
The probabilities associated with each entry in a. If not given the sample assumes a uniform distribution over all entries in a.
按什么概率分布选取元素,默认是均匀分布

Returns
samples : 1-D ndarray, shape (size,)
The generated random samples

总结2: set()

Python的集合(set)和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素.

总结3: batch training

batch training 一样可以使用这种方法选取数据

batch_size = 25
for epoch in range(100):rand_index = np.random.choice(len(x_train), size = batch_size)rand_x = x_train[rand_index]rand_y = y_train[rand_index]...

[机器学习]三行代码快速划分交叉训练中训练集和验证集相关推荐

  1. 文本分类训练集 测试集_【AI1000问】训练为什么要分测试集和验证集?

    9 往期视频 点击边框调出视频工具条 为什么要分训练集和测试集呢? 在很多的书以及一些公开数据集中,都会将数据集分为训练集,验证集和测试集,看起来验证集和测试集并没有区别,为什么要分这两个呢? 作者/ ...

  2. 神经网络训练集和验证集的原理理解

    今天在学习<python深度学习>的时候,看到了这么一段话: 评估模型的重点是将数据划分为三个集合:训练集.验证集和测试集.在训练数据上训练模型,在验证数据上评估模型.一旦找到了最佳参数, ...

  3. 【AI-1000问】训练为什么要分测试集和验证集?

    往期视频(前往有三AI公众号观看) 为什么要分训练集和测试集呢? 在很多的书以及一些公开数据集中,都会将数据集分为训练集,验证集和测试集,看起来验证集和测试集并没有区别,为什么要分这两个呢? 作者/编 ...

  4. csv数据,已区分训练集和验证集,需要用r语言建立随机森林回归模型,计算模型精度,包括训练集和验证集的r方、mae、rmse

    csv数据,已区分训练集和验证集,需要用r语言建立随机森林回归模型,计算模型精度,包括训练集和验证集的r方.mae.rmse #读取训练集 train <- read.csv("tra ...

  5. 机器学习中为什么需要验证集,验证集与测试集的区别是什么?

    目录 1.为什么需要验证集 2.验证集与测试集的区别 3.如何使用验证集 4.为什么验证集和测试集都需要? 参考链接 1.为什么需要验证集 在机器学习中,训练模型时需要调节模型的参数来提高模型的性能, ...

  6. 最全!最完整的求first集和follow的代码!!!编译原理 FIRST集和FOLLOW集的求法 代码,程序,实验报告

    DEV C++ 项目实现 不会建项目的看这个-->如何创建项目 代码链接:https://pan.baidu.com/s/1VNdrSMXaKu3HI0UQ_TInUQ 提取码:b1qz 使用教 ...

  7. LL(1)文法中FIRST集和FOLLOW集的计算方法

    文章目录 深入理解 FIRST集的定义 FIRST集的实际意义 FIRST集的计算方法 FOLLOW集的定义 FOLLOW集的实际意义 FOLLOW集的计算方法 预测分析表的实质 LL(1)文法的判断 ...

  8. 如何正确使用机器学习中的训练集、验证集和测试集?

    王树义 读完需要 19 分钟 速读仅需7分钟 训练集.验证集和测试集,林林总总的数据集合类型,到底该怎么选.怎么用?看过这篇教程后,你就能游刃有余地处理它们了. 1 问题 审稿的时候,不止一次,我遇到 ...

  9. 【入门篇】如何正确使用机器学习中的训练集、验证集和测试集?

    [注] ·本文为转载文章,原文作者是王树义老师,原文链接为 https://zhuanlan.zhihu.com/p/71961236 训练集.验证集和测试集,林林总总的数据集合类型,到底该怎么选.怎 ...

最新文章

  1. 漫画:应用程序被拖慢?罪魁祸首竟然是Log4j!
  2. Android应用程序组件Content Provider的启动过程源代码分析(1)
  3. 2008r2配置 iis mysql php_Windows 2008 R2服务器配置文档iis+php+mysql
  4. python如何在exel中编程_如何使用Python以编程方式将行添加到现有Excel表中
  5. python中列表字典和字符串的相互转化
  6. c语言中按键程序设计,c语言获得键盘的按键
  7. FPGA模拟PS/2键盘
  8. PcShare远程控制(20070722免费版本)发布
  9. 油猴超神好用脚本推荐
  10. Oracle 多行显示在一行详解(listagg)
  11. 让你无法拒绝的数学之美,美的完美无瑕
  12. 书摘—松下幸之助全传
  13. Amazon软件开发工程师面试题
  14. C# 版 flvmerge:快速合并多个flv文件
  15. 那些著名的网络攻击事件 一
  16. 求解1-1/2+1/3+...1/99-1/100的和
  17. [E17264-15]Oracle® Database 2 Day + Real Application Clusters Guide 11g Release 2 (11.2)之六
  18. 怎样合并空闲空间到C盘(系统盘)来扩大C盘的容量?
  19. 中成药数据图谱可视化与知识问答平台研究
  20. 【Linux】linux上挂载NFS

热门文章

  1. [Matlab]FIR滤波器设计:(基本窗函数FIR滤波器设计)
  2. hive URI ${systemjava.io.tmpdir%7D$%7Bsystemuser.name%7D
  3. apache默认端口号是多少
  4. 华为p10android版本,华为P10系列什么时候升级安卓8.0?官方给出答案
  5. CAD设置命令框的字体
  6. 解决photoshop菜单卡顿,闪动,停顿问题
  7. matlab求hession矩阵
  8. 自然语言分词词性标注指代
  9. 逻辑地址和物理地址转换
  10. Word或者Excel中怎么把 空格 替换成 换行