转载自:地址

现在网上有很多关于Deeplearning的教程,不过这些教程的数据集都是已经做好的,并且格式名字什么的都已经整理好了。特别是很多入门的教程都是Mnist 的数据集,这都已经非常的完善了。不过对于想自己制作数据集的小白来说,如何将自己收集的图片批量转换为自己需要的格式呢,网上提到的并不多。作为菜鸟一枚,现在把自己制作数据集的方法,和各位大牛分享下,如有谬误,还请斧正。

以一个Cat VS Dog 二分类为例。首先,将自己从网上爬的图片分别两个文件夹,文件夹名称为分类对象(cat ,dog)。

然后再通过调用函数,统一修改图片的名字,分别以   cat0.jpg ,cat1.jpg, cat2.jpg ,cat3.jpg ......  

dog.0,dog.1,dog.2,dog.3,dog.4......方式进行重命名。

step 1.  刚开始的文件及图片

train文件下的两个子文件

刚爬下来cat文件下图片的名称(一般网上直接爬下来的图片名字都不统一,会比较乱)

闲话不说,直接上代码

import os  def rename(file_dir,name):'''将网上爬下来的图片重命名(更好的观看)''''''第一个参数是目标文件名 第二个参数是图片的名称'''i=0for file in os.listdir(file_dir):  '''获取该路径文件下的所有图片'''    src = os.path.join(os.path.abspath(file_dir), file) '''修改后图片的存储位置(目标文件夹+新的图片的名称)'''        dst = os.path.join(os.path.abspath(file_dir),  name+str(i) + '.jpg')os.rename(src, dst) #将图片重新命名i=i+1     file_dir='C:/Users/ASUS/Desktop/train'  #目标下的文件夹名称
rename(file_dir+'/cat','cat')  #获取目标文件夹下,子文件的的路径 并进行重命名
rename(file_dir+'/dog','dog')

这是修改后的子文件夹下图片的名称

 修改图片名称的目的是制作自己的数据集的第一步,接下来,博主还会和大家分享,如何用修改好后的图片制作tfrecord 数据集,tfrecord数据集可以更好地读取数据,有效的利用电脑的GPU ,特别是数据量较大的时候,可以很好的提高数据处理的速度。    如有不足,还请各位大牛指正,还望共同进步! 

基于tensorflow 批量修改自己的图片数据集 (附代码)相关推荐

  1. TF之LiR:基于tensorflow实现手写数字图片识别准确率

    TF之LiR:基于tensorflow实现手写数字图片识别准确率 目录 输出结果 代码设计 输出结果 Extracting MNIST_data\train-images-idx3-ubyte.gz ...

  2. 基于YOLOv5的手势识别系统(含手势识别数据集+训练代码)

    基于YOLOv5的手势识别系统(含手势识别数据集+训练代码) 目录 基于YOLOv5的手势识别系统(含手势识别数据集+训练代码) 1. 前言 2. 手势识别的方法 (1)基于多目标检测的手势识别方法 ...

  3. 批量修改部门名称(根据部门代码)

    批量修改部门名称(根据部门代码) update dcc_internal_file set dcc_internal_file.dept_name=t_s_depart.departname from ...

  4. 2020华为杯E题——基于灰色预测的大雾能见度预测模型(附代码)

    2020华为杯E题--基于灰色预测的大雾能见度预测模型(附代码) 一.E题赛题 二.赛题分析 三.基于灰色预测的大雾能见度预测模型 3.1灰色预测模型的定义 3.2 灰色预测模型的目的 GM(1,1) ...

  5. 基于遗传算法优化的Elman神经网络数据预测-附代码

    基于遗传算法优化的Elman神经网络数据预测 - 附代码 文章目录 基于遗传算法优化的Elman神经网络数据预测 - 附代码 1.Elman 神经网络结构 2.Elman 神经用络学习过程 3.电力负 ...

  6. 路径规划算法:基于灰狼优化(GWO)的路径规划算法- 附代码

    路径规划算法:基于灰狼优化(GWO)的路径规划算法- 附代码 文章目录 路径规划算法:基于灰狼优化(GWO)的路径规划算法- 附代码 1.算法原理 1.1 环境设定 1.2 约束条件 1.3 适应度函 ...

  7. FPGA零基础学习:基于FPGA的二进制转BCD设计(附代码)

    FPGA零基础学习:基于FPGA的二进制转BCD设计(附代码) 本系列将带来FPGA的系统性学习,从最基本的数字电路基础开始,最详细操作步骤,最直白的言语描述,手把手的"傻瓜式"讲 ...

  8. 路径规划算法:基于入侵杂草优化的路径规划算法- 附代码

    路径规划算法:基于入侵杂草优化的路径规划算法- 附代码 文章目录 路径规划算法:基于入侵杂草优化的路径规划算法- 附代码 1.算法原理 1.1 环境设定 1.2 约束条件 1.3 适应度函数 2.算法 ...

  9. python 图片数据增强_数据增强之批量修改图像尺寸大小(附Python实现)

    2019 is a new start! 很久没有更啦~希望不要懒惰.(虽然不努力真滴很舒服诶) 今天就来说一下之前在处理图片时候用到的一些知识. 数据增强 在接触Alexnet网络结构模型的时候,第 ...

最新文章

  1. [UWP]了解模板化控件(7):支持Command
  2. 「2017 山东一轮集训 Day5」距离
  3. android 不同型号的终端的UI适配--一种解决方法
  4. SAP WebIDE:how to enable context API reference
  5. error_reporting()的用法
  6. 即将放弃python的app_python放弃之 模块和包
  7. ripro虚拟资源主题8.9开心版/免授权/ripro日主题V8.9
  8. String str=“i“与 String str=new String(“i”)一样吗?
  9. Bluetooth的profile总结
  10. autojs之提取text中的红色文字(图片二值化+百度智能云-文字识别OCR-接口调用)
  11. Windows编译运行EasyPR
  12. esp8266 蓝牙耳机_基于Qualcomm QCC3001/TWS迷你型入耳式蓝牙耳机方案
  13. Vue实现tab导航栏,支持左右滑动
  14. Android 实现沉浸式体验
  15. windows云服务器价格_windows云服务器安装(微软云服务器价格)
  16. 网络原理练习题(含答案)
  17. RTX 4070TI和RTX 4080差距 RTX4070ti和4080区别对比
  18. 考研时间安排和考研内容
  19. freecodecamp----应用无障碍
  20. CVE-2021-40539-Zoho ManageEngine ADSelfService Plus如何从bypass到RCE

热门文章

  1. ps切图后 JAVA开发_2018年设计师都在用的PS切图插件--摹客
  2. c语言三种循环语句,C语言三种循环语句的功能等价性
  3. php管理员登陆问题,discuz论坛管理员无法登录后台的原因和解决方法
  4. phpexcel 数字格式_将文本转换为phpexcel中的数字格式
  5. 程序员操作系统推荐_程序员的这些问题,竟然在工作后才发现!
  6. js 随机数_JS常用方法和一些封装:随机数生成
  7. python 返回函数 闭包_python中闭包Closure函数作为返回值的方法示例
  8. csr 蓝牙驱动_双11来临之际,推荐几款无线蓝牙耳机吧
  9. sql面试题问答题_SQL面试问答
  10. 使用PDF-XChange Editor为PDF文件添加签名(图片+签名)