随机挑选分类训练集和测试集
# -*- coding: utf-8 -*-import os
import random
import shutil
from shutil import copy2
from tqdm import tqdm# category = ['可回收垃圾', '有害垃圾', '厨余垃圾', '其他垃圾']
category = ['0','1','2','3','4','5','6','7','8','9']# 要保存的根目录saveTrainPATH = 'F:/1213bag/111/1colour/train/'
saveTestPATH = 'F:/1213bag/111/1colour/val/'if __name__ == "__main__":for j in range(10): #根据类别改PATH = 'F:/1213bag/111/1colour/bag/' + category[j]# 子文件夹for childPATH in tqdm(os.listdir(PATH)):# 子文件夹路径trainfiles = os.listdir(PATH)num_image = len(trainfiles)index_list = list(range(num_image))num = 0# 保存trian的路径-----------------------------trainDir = saveTrainPATH + category[j] + '/'# 先判断是否存在这个文件夹if not os.path.exists(trainDir):os.mkdir(str(trainDir))# 保存test的路径---------------------------------testDir = saveTestPATH + category[j] + '/'if not os.path.exists(testDir):os.mkdir(str(testDir))for i in index_list:fileName = os.path.join(PATH, trainfiles[i])if num < num_image * 0.85:copy2(fileName, trainDir) # 复制过去,不改变原来目录的图片else:copy2(fileName, testDir)num += 1# print(trainDir, '\n', testDir)
随机挑选分类训练集和测试集相关推荐
- 随机切分csv训练集和测试集 鸢尾花
import csv import os import numpy as np '''将iris.csv中的数据分成train_iris和test_iris两个csv文件,其中train_iris.c ...
- sklearn.model_selection.train_test_split随机划分训练集和测试集
1 函数用途 train_test_split()是交叉验证中常用的函数,功能是将数组或矩阵按比例随机划分为训练集和测试集,使用方法为: X_train,X_test, y_train, y_test ...
- 深度学习之数据处理——如何将图片和标签打乱并划分为训练集和测试集
深度学习之数据处理--如何将图片和标签打乱并划分为训练集和测试集 记录我的第一篇CSDN博客 最近我在网上找到Office31数据集,这个数据集中包含了三个子数据集,分别为:Amazon.dslr.w ...
- Python分割训练集和测试集
数据集介绍 使用数据集Wine,来自UCI.包括178条样本,13个特征. import pandas as pd import numpy as npdf_wine = pd.read_csv('h ...
- python尝试不同的随机数进行数据划分、使用卡方检验依次计算不同随机数划分下训练接和测试集所有分类特征的卡方检验的p值,如果所有p值都大于0.05则训练集和测试集都具有统计显著性、数据划分合理
python尝试不同的随机数进行数据划分.使用卡方检验依次计算不同随机数划分下训练接和测试集所有分类特征(categorical)的卡方检验的p值,如果所有p值都大于0.05则退出循环.则训练集和测试 ...
- R语言决策树、bagging、随机森林模型在训练集以及测试集的预测结果(accuray、F1、偏差Deviance)对比分析、计算训练集和测试集的预测结果的差值来分析模型的过拟合(overfit)情况
R语言决策树.bagging.随机森林模型在训练集以及测试集的预测结果(accuray.F1.偏差Deviance)对比分析.计算训练集和测试集的预测结果的差值来分析模型的过拟合(overfit)情况 ...
- Sklearn-train_test_split随机划分训练集和测试集
sklearn.model_selection.train_test_split随机划分训练集和测试集 官网文档:http://scikit-learn.org/stable/modules/gene ...
- 将数据集分为训练集和测试集(python脚本)
文章目录 程序: 下面简单介绍一下程序流程 1.引入库 os库 shutil random 2.mk_file函数 3.主函数 程序: 我们在训练卷积神经网络之前,要搭建好数据集,分成训练集和测试集两 ...
- idea2020.2中@test是怎么测试的_Sklearn 划分训练集和测试集
[从零开始学机器学习第 03 篇] 摘要:手写 Sklearn 的 train_test_split 函数. 之前两篇文章以酒吧的红酒故事引出了 kNN 分类算法,根据已倒好的酒(样本),预测新倒的酒 ...
最新文章
- Excel VBA两两个体距离矩阵转化为数据库格式
- 基于通用权限管理系统实现的单点登录
- php操作session
- 职业生涯的8种德---非常重要
- Linux下ps -ef和ps aux的区别
- opencv mat release thrown_【OpenCV+Python】图像与视频处理入门
- springAop和AspectJ的关系
- 16进制字符串转化为10进制数
- requests 获取div_爬虫系列第五篇 使用requests与BeautifulSoup爬取豆瓣图书Top250
- 手把手教你用Spring Cloud和Docker构建微服务
- 浅谈volatile关键字
- [渝粤教育] 天水师范学院 离散数学 参考 资料
- C#中Dictionary的用法及用途(转)
- 计算机用硬盘做缓存,用SSD固态硬盘做缓存加速怎么样实测
- 小子注入,怎么使用呢?
- 百度地图根据缩放级别显示不同的marker点和窗口内容
- 西北工业大学电工学mooc第六章测试题及解析
- 湖北工业大学机械c语言考试试题,关于部分同学重新参加《C语言程序设计》、《计算机及网络应用基础》课程补考的通知...
- vue form表单验证清除
- Windows10操作系统共享文件夹给VMWare虚拟机centos 7 操作系统使用