基于tensorflow 批量修改自己的图片数据集 (附代码)
转载自:地址
现在网上有很多关于Deeplearning的教程,不过这些教程的数据集都是已经做好的,并且格式名字什么的都已经整理好了。特别是很多入门的教程都是Mnist 的数据集,这都已经非常的完善了。不过对于想自己制作数据集的小白来说,如何将自己收集的图片批量转换为自己需要的格式呢,网上提到的并不多。作为菜鸟一枚,现在把自己制作数据集的方法,和各位大牛分享下,如有谬误,还请斧正。
以一个Cat VS Dog 二分类为例。首先,将自己从网上爬的图片分别两个文件夹,文件夹名称为分类对象(cat ,dog)。
然后再通过调用函数,统一修改图片的名字,分别以 cat0.jpg ,cat1.jpg, cat2.jpg ,cat3.jpg ......
dog.0,dog.1,dog.2,dog.3,dog.4......方式进行重命名。
step 1. 刚开始的文件及图片
train文件下的两个子文件
刚爬下来cat文件下图片的名称(一般网上直接爬下来的图片名字都不统一,会比较乱)
闲话不说,直接上代码
import os def rename(file_dir,name):'''将网上爬下来的图片重命名(更好的观看)''''''第一个参数是目标文件名 第二个参数是图片的名称'''i=0for file in os.listdir(file_dir): '''获取该路径文件下的所有图片''' src = os.path.join(os.path.abspath(file_dir), file) '''修改后图片的存储位置(目标文件夹+新的图片的名称)''' dst = os.path.join(os.path.abspath(file_dir), name+str(i) + '.jpg')os.rename(src, dst) #将图片重新命名i=i+1 file_dir='C:/Users/ASUS/Desktop/train' #目标下的文件夹名称
rename(file_dir+'/cat','cat') #获取目标文件夹下,子文件的的路径 并进行重命名
rename(file_dir+'/dog','dog')
这是修改后的子文件夹下图片的名称
修改图片名称的目的是制作自己的数据集的第一步,接下来,博主还会和大家分享,如何用修改好后的图片制作tfrecord 数据集,tfrecord数据集可以更好地读取数据,有效的利用电脑的GPU ,特别是数据量较大的时候,可以很好的提高数据处理的速度。 如有不足,还请各位大牛指正,还望共同进步!
基于tensorflow 批量修改自己的图片数据集 (附代码)相关推荐
- TF之LiR:基于tensorflow实现手写数字图片识别准确率
TF之LiR:基于tensorflow实现手写数字图片识别准确率 目录 输出结果 代码设计 输出结果 Extracting MNIST_data\train-images-idx3-ubyte.gz ...
- 基于YOLOv5的手势识别系统(含手势识别数据集+训练代码)
基于YOLOv5的手势识别系统(含手势识别数据集+训练代码) 目录 基于YOLOv5的手势识别系统(含手势识别数据集+训练代码) 1. 前言 2. 手势识别的方法 (1)基于多目标检测的手势识别方法 ...
- 批量修改部门名称(根据部门代码)
批量修改部门名称(根据部门代码) update dcc_internal_file set dcc_internal_file.dept_name=t_s_depart.departname from ...
- 2020华为杯E题——基于灰色预测的大雾能见度预测模型(附代码)
2020华为杯E题--基于灰色预测的大雾能见度预测模型(附代码) 一.E题赛题 二.赛题分析 三.基于灰色预测的大雾能见度预测模型 3.1灰色预测模型的定义 3.2 灰色预测模型的目的 GM(1,1) ...
- 基于遗传算法优化的Elman神经网络数据预测-附代码
基于遗传算法优化的Elman神经网络数据预测 - 附代码 文章目录 基于遗传算法优化的Elman神经网络数据预测 - 附代码 1.Elman 神经网络结构 2.Elman 神经用络学习过程 3.电力负 ...
- 路径规划算法:基于灰狼优化(GWO)的路径规划算法- 附代码
路径规划算法:基于灰狼优化(GWO)的路径规划算法- 附代码 文章目录 路径规划算法:基于灰狼优化(GWO)的路径规划算法- 附代码 1.算法原理 1.1 环境设定 1.2 约束条件 1.3 适应度函 ...
- FPGA零基础学习:基于FPGA的二进制转BCD设计(附代码)
FPGA零基础学习:基于FPGA的二进制转BCD设计(附代码) 本系列将带来FPGA的系统性学习,从最基本的数字电路基础开始,最详细操作步骤,最直白的言语描述,手把手的"傻瓜式"讲 ...
- 路径规划算法:基于入侵杂草优化的路径规划算法- 附代码
路径规划算法:基于入侵杂草优化的路径规划算法- 附代码 文章目录 路径规划算法:基于入侵杂草优化的路径规划算法- 附代码 1.算法原理 1.1 环境设定 1.2 约束条件 1.3 适应度函数 2.算法 ...
- python 图片数据增强_数据增强之批量修改图像尺寸大小(附Python实现)
2019 is a new start! 很久没有更啦~希望不要懒惰.(虽然不努力真滴很舒服诶) 今天就来说一下之前在处理图片时候用到的一些知识. 数据增强 在接触Alexnet网络结构模型的时候,第 ...
最新文章
- [UWP]了解模板化控件(7):支持Command
- 「2017 山东一轮集训 Day5」距离
- android 不同型号的终端的UI适配--一种解决方法
- SAP WebIDE:how to enable context API reference
- error_reporting()的用法
- 即将放弃python的app_python放弃之 模块和包
- ripro虚拟资源主题8.9开心版/免授权/ripro日主题V8.9
- String str=“i“与 String str=new String(“i”)一样吗?
- Bluetooth的profile总结
- autojs之提取text中的红色文字(图片二值化+百度智能云-文字识别OCR-接口调用)
- Windows编译运行EasyPR
- esp8266 蓝牙耳机_基于Qualcomm QCC3001/TWS迷你型入耳式蓝牙耳机方案
- Vue实现tab导航栏,支持左右滑动
- Android 实现沉浸式体验
- windows云服务器价格_windows云服务器安装(微软云服务器价格)
- 网络原理练习题(含答案)
- RTX 4070TI和RTX 4080差距 RTX4070ti和4080区别对比
- 考研时间安排和考研内容
- freecodecamp----应用无障碍
- CVE-2021-40539-Zoho ManageEngine ADSelfService Plus如何从bypass到RCE
热门文章
- ps切图后 JAVA开发_2018年设计师都在用的PS切图插件--摹客
- c语言三种循环语句,C语言三种循环语句的功能等价性
- php管理员登陆问题,discuz论坛管理员无法登录后台的原因和解决方法
- phpexcel 数字格式_将文本转换为phpexcel中的数字格式
- 程序员操作系统推荐_程序员的这些问题,竟然在工作后才发现!
- js 随机数_JS常用方法和一些封装:随机数生成
- python 返回函数 闭包_python中闭包Closure函数作为返回值的方法示例
- csr 蓝牙驱动_双11来临之际,推荐几款无线蓝牙耳机吧
- sql面试题问答题_SQL面试问答
- 使用PDF-XChange Editor为PDF文件添加签名(图片+签名)