1. 问题描述

做迁移时候用到公共数据集ImageCLEF, 但是给的结构如图:

有b,c,i, p四种图像数据,和list数据,对应每一条数据的名称及其标签,记录举例如下:

b/252.car-side-101/252_0446.jpg 6

2.目标:做成如下格式

每种图片归为自己类别

3. 脚本如下:

3.1 查看目录下文件

import os
import shutil# 列出所有txt记录文件
Domain_Dir = os.listdir('image-clef/list/')
Domain_Dir

结果如下:

['bList.txt', 'cList.txt', 'iList.txt', 'pList.txt']

3.2 创建对应的文件类别目录

# 创建bList对应的文件目录
with open('image-clef/list/' + 'bList.txt', 'r') as f:for i in f:# 获取每种记录类别kind = i.strip('\n').split(' ')[1]# 新的文件目录名称path = 'image-clefback/b/' + kind# 判断该类别目录是否存在isExists = os.path.exists(path)# 不存在则创建目录if not isExists:os.makedirs(path)

结果如下:

3.3 对图像数据进行归类

with open('image-clef/list/' + 'bList.txt', 'r') as f:for i in f:# 获取txt中图片的名称picture_name = i.strip('\n').split(' ')[0].split('/')[2]# 获取对应的类别kind = i.strip('\n').split(' ')[1]# 移动图片到分类的文件夹if picture_name in os.listdir('image-clef/b'):# file_path记录原始图片位置file_path = 'image-clef/b/' + picture_name# newpath表示目标文件目录newpath = 'image-clefback/b/' + kind#移动shutil.copy(file_path, newpath)

结果如下:

4.如果不想自己处理,可以下载我处理后的数据,包含原始数据。

附链接处理好已分类 迁移学习(image-clef数据集)_imageclef,imageclef数据集-Python文档类资源-CSDN下载

原生数据链接 https://drive.google.com/file/d/0B9kJH0-rJ2uRS3JILThaQXJhQlk/view?usp=sharing​​​​​​

5. 更新一下数据集:

感谢[P.C.](P.C.的博客_CSDN博客-领域博主)对数据集P数量不足600张的指出,同时附带新的数据链接:

1. 坚果云

链接:https://www.jianguoyun.com/p/DW5Gc_sQmN7PCBjwrKIE

Password: e5v8GG

2. 百度云

链接:https://pan.baidu.com/s/1rfRRC-tg32Mcfnsm91HVcQ 
提取码:fle0

ImageCLEF数据集处理(Python读取txt内容创建文件夹;将图片拷贝至指定文件夹)相关推荐

  1. 读取CSV内容,根据不同的图片标签放到指定文件夹

    读取csv文件内容,根据不同的图片标签到指定文件夹. 原本的数据是这样的 然后根据CSV文件的内容 进行读取,根据不同的label将图片放到指定的label 文件夹里 import pandas as ...

  2. python读取txt文件并写入excel-Python读取txt内容写入xls格式excel中的方法

    由于xlwt目前只支持xls格式,至于xlsx格式,后面会继续更新 import xlwt import codecs def Txt_to_Excel(inputTxt,sheetName,star ...

  3. python读取txt文件并输出到表格_Python读取txt内容写入xls格式excel中的方法

    由于xlwt目前只支持xls格式,至于xlsx格式,后面会继续更新 import xlwt import codecs def Txt_to_Excel(inputTxt,sheetName,star ...

  4. python删除重复值所在的行数_使用python读取txt文件的内容,并删除重复的行数方法...

    注意,本文代码是使用在txt文档上,同时txt文档中的内容每一行代表的是图片的名字. #coding:utf-8 import shutil readDir = "原文件绝对路经" ...

  5. Python读取.txt文档内容/读取text文件内容

    Python读取.txt文档内容/读取text文件内容; 读取txt后缀文件的内容的两种方式,简约易懂,复制粘贴即可食用,节约你宝贵的时间 文档全部数据一次性读取 # -*- coding: UTF- ...

  6. python读取txt文件代码-Python txt文件常用读写操作代码实例

    python读取txt文件 #方式一: file = r'D: est.txt' with open(file, 'rb+') as f: #可读可写二进制,文件若不存在就创建 data = f.re ...

  7. python读取txt文件为dataframe,python批量读取txt文件为DataFrame

    我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作.比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢? 首先我们要 ...

  8. python读取txt文件并画图

    1,使用python读取txt文件 已知txt文件内容如下: 0 01 12 43 94 165 256 36 请以第一列为x轴,第二列为y轴画图 步骤如下: 1)使用readlines读取文件 2) ...

  9. python导入txt文件并绘图-Python读取txt某几列绘图的方法

    晚上帮同学用Python脚本绘图,大概需求是读取一个txt文件的两列分别作为x和y的值,绘图即可,代码如下: #coding:utf-8 import numpy as np import matpl ...

最新文章

  1. halcon算子盘点:Chapter 15灰度分割
  2. 计算机excel表格相关考试视频,1189.5天通过职称计算机考试:Excel 2003中文电子表格(考点视频串讲+全真模拟).pdf...
  3. Leetcode 杂题
  4. 全志t3linux驱动_全志A20GPIO驱动分析|Android驱动及系统开发交流区|研发交流|雨滴科技技术论坛 - Powered by Discuz!...
  5. python signal
  6. 手把手教你在友善之臂tiny4412上用uboot启动Linux内核
  7. SAP License:一句话让你明白FICO
  8. Nuxt项目支持import写法的最新解决方案
  9. 天书夜读:从汇编语言到Windows内核编程
  10. tcp wireshark 过滤syn_抓包工具Wireshark常用过滤使用方法
  11. Service Mesh 框架选型对比分析:Linkerd、Envoy、Istio、Conduit
  12. 十六.linux开发之Kernel移植——内核的配置和编译原理
  13. Python实效编程01 -- 星座预测
  14. 计算机系统分盘作用,电脑分盘有什么好处,要不要重装系统
  15. AD从原理图到PCB超详细教程
  16. 通用技术课件_优化—让我们做得更好 | 高中通用技术优质课展示
  17. C++在视图中显示缩略图
  18. 关于找不到mfc120u.dll文件错误与0xc000007b错误的解决方案
  19. 单片机-嵌入式相关的一些论坛
  20. 如何在VS code中导入easyui

热门文章

  1. paloalto防火墙的优势
  2. ffmpeg剪切视频导致音画不同步,剪切时间不准的问题
  3. 仿滴滴打车的平滑移动附近车辆效果实现全流程,基于高德地图
  4. cs231n训练营学习笔记(3)
  5. 【Kevin P. Murphy】机器学习:基于概率论的观点
  6. 暗网出售180万苏宁会员数据,背后是谁在泄露用户信息?
  7. 异步电机的VVVF的C代码+仿真模型,C代码可直接在simulink模型里进行在线仿真
  8. HFSS仿真-如何画阿基米德螺旋平面线
  9. 计算机应用 信息系统可靠性,【2014年自考管理系统中计算机应用复习笔记:系统的可靠性】- 环球网校...
  10. 华北理工计算机学院官网,CCFCV走进高校