文件图片随机划分训练集和验证集
# coding=utf-8
import os, random, shutildef moveFile(fileDir):pathDir = os.listdir(fileDir) # 取图片的原始路径filenumber = len(pathDir)picknumber = int(filenumber * ratio) # 按照rate比例从文件夹中取一定数量图片sample = random.sample(pathDir, picknumber) # 随机选取picknumber数量的样本图片for name in sample:shutil.move(os.path.join(fileDir, name), os.path.join(tarDir, name))returnif __name__ == '__main__':ori_path = r'C:\Users\zhoutao\Downloads\train(1)\train' # 最开始train的文件夹路径split_Dir = r'C:\Users\zhoutao\Downloads\train(1)\val' #移动到新的文件夹路径ratio = 0.15 # 抽取比例for firstPath in os.listdir(ori_path):fileDir = os.path.join(ori_path, firstPath) # 原图片文件夹路径tarDir = os.path.join(split_Dir, firstPath) # val下子文件夹名字if not os.path.exists(tarDir): # 如果val下没有子文件夹,就创建os.makedirs(tarDir)moveFile(fileDir) # 从每个子类别开始逐个划分
文件图片随机划分训练集和验证集相关推荐
- Sklearn-train_test_split随机划分训练集和测试集
sklearn.model_selection.train_test_split随机划分训练集和测试集 官网文档:http://scikit-learn.org/stable/modules/gene ...
- sklearn.model_selection.train_test_split随机划分训练集和测试集
1 函数用途 train_test_split()是交叉验证中常用的函数,功能是将数组或矩阵按比例随机划分为训练集和测试集,使用方法为: X_train,X_test, y_train, y_test ...
- train_test_split(),随机划分训练集和测试集的函数
sklearn.model_selection.train_test_split() from sklearn.model_selection import train_test_split x_tr ...
- [机器学习]三行代码快速划分交叉训练中训练集和验证集
使用numpy.random.choice()和set()快速划分交叉训练数据集 之前在划分训练集和验证集时,都是手工随机生成index,很笨. 学到的新方法如下: import numpy as n ...
- 训练集 测试集 验证集_Python机器学习实战:划分训练集和检验集
机器学习实战:这里没有艰深晦涩的数学理论,我们将用简单的案例和大量的示例代码,向大家介绍机器学习的核心概念.我们的目标是教会大家用Python构建机器学习模型,解决现实世界的难题. 本文来自<数 ...
- 31,32,33_过拟合、欠拟合的概念、L2正则化,Pytorch过拟合欠拟合,交叉验证-Train-Val-Test划分,划分训练集和测试集,K-fold,Regularization
1.26.过拟合.欠拟合及其解决方案 1.26.1.过拟合.欠拟合的概念 1.26.1.1.训练误差和泛化误差 1.26.1.2.验证数据集与K-fold验证 1.26.1.3.过拟合和欠拟合 1.2 ...
- csv数据,已区分训练集和验证集,需要用r语言建立随机森林回归模型,计算模型精度,包括训练集和验证集的r方、mae、rmse
csv数据,已区分训练集和验证集,需要用r语言建立随机森林回归模型,计算模型精度,包括训练集和验证集的r方.mae.rmse #读取训练集 train <- read.csv("tra ...
- idea2020.2中@test是怎么测试的_Sklearn 划分训练集和测试集
[从零开始学机器学习第 03 篇] 摘要:手写 Sklearn 的 train_test_split 函数. 之前两篇文章以酒吧的红酒故事引出了 kNN 分类算法,根据已倒好的酒(样本),预测新倒的酒 ...
- python机器学习 train_test_split()函数用法解析及示例 划分训练集和测试集 以鸢尾数据为例 入门级讲解
文章目录 train_test_split()用法 获取数据 划分训练集和测试集 完整代码脚手架 train_test_split()用法 python机器学习中常用 train_test_split ...
- 神经网络训练集和验证集的原理理解
今天在学习<python深度学习>的时候,看到了这么一段话: 评估模型的重点是将数据划分为三个集合:训练集.验证集和测试集.在训练数据上训练模型,在验证数据上评估模型.一旦找到了最佳参数, ...
最新文章
- 使用Spring Cloud Feign作为HTTP客户端调用远程HTTP服务
- 科大星云诗社动态20210809
- 速看|万豪数据泄漏门再敲警钟 酒店集团7步安全建议
- ASP正则表达式方面小笔记
- IPFS搭建HTTPS去中心化网站,真实可用
- sql求平均日活_日活、周活(周重活)、月活 统计
- mysql登录报错error1045,mysql创建登录报错ERROR1045(28000)
- Java 泛型 (generics) 的使用
- 通过 PackageManager 获得你想要的 App 信息
- Detours信息泄漏漏洞
- 敏捷开发(Agile)
- RB-PEG2000-Pyrene,含有芘丁酸和罗丹明的PEG,Pyrene-PEG2000-Rhodamine
- Spark Streaming系列-1、什么是Spark Streaming?
- Spark-Sql源码解析之三 Analyzer:Unresolved logical plan – analyzed logical plan
- 人生杂感随笔-观佛教与道教(六道轮回)
- 语音中常用输入特征的提取过程:MFCC、FBank
- Kettle_使用资源库功能把ktr元数据统一存储到数据库中
- 如何(不)让你的Python代码不再晦涩难懂
- 上市公司碳排放测算数据(1992-2022年)
- the sentiments when install labelimage