提取voc数据集中特定的类

先贴出代码：

import shutil
import os
import xml.etree.ElementTree as ETAnnotations_path = r"E:/data/voc/VOCdevkit/VOC2007/Annotations"
image_path = r"E:/data/voc/VOCdevkit/VOC2007/JPEGImages"
save_img_path = r"E:/data/voc/VOCdevkit/VOC2007/tte/"
save_xml_path = r"E:/data/voc/VOCdevkit/VOC2007/xml/"
classes = [ 'car', 'horse', 'cat', 'dog','bird','sheep', 'cow']
def get_my_classes(Annotations_path,image_path,save_img_path,save_xml_path,classes):xml_path = os.listdir(Annotations_path)for i in classes:if not os.path.exists(save_img_path+"/"+i):os.mkdir(save_img_path+i)if not os.path.exists(save_xml_path+"/"+i):os.mkdir(save_xml_path+i)for xmls in xml_path:print(Annotations_path+"/"+xmls)in_file = open(os.path.join(Annotations_path,xmls))print(in_file)tree = ET.parse(in_file)root = tree.getroot()
#         print(root)xml_class = []# 这里是要求每一个xml文件（图片）只能有单独的一个类if len(set(root.iter('object'))) != 1:continuefor obj in root.iter('object'):cls_name = obj.find('name').textprint(cls_name)try:shutil.copy(image_path+"/"+xmls[:-3]+"jpg" , save_img_path+"/"+cls_name+"/"+xmls[:-3]+"jpg")shutil.copy(Annotations_path+"/"+xmls , save_xml_path+"/"+cls_name+"/"+xmls)except:continueget_my_classes(Annotations_path,image_path,save_img_path,save_xml_path,classes)

详解：

Annotations_path：这是你xml文件存储的位置，也就是你的这个文件夹
save_img_path：这是你提取特定类后，其每一类的图片存放的位置，如图我提取了以下几类。
image_path：这就是你voc数据集所有图片的位置目录
save_xml_path：是你保存每一类xml的位置
classes：这是你要提取的几个类

注：
这里是要求每一个xml文件（图片）里只能有单独的一个类，也就是如果一张图片里有多种物体，我们直接break，进入下一个xml。

提取voc数据集中特定的类相关推荐

数据如何变成知识，第 3 部分提取暗数据
在我的上一篇文章中,您了解了数据湖如何允许存储大量多格式数据,从而帮助加速数据摄入和降低摄入成本.廉价存储技术的出现,使组织能更轻松.更便宜地存储大量数据. 组织存储数据有许多原因,通常是为了保留记录 ...
数据如何变成知识(3):提取暗数据
转发自IBM社区:https://www.ibm.com/developerworks/cn/analytics/library/ba-data-becomes-knowledge-3/index.h ...
21天Python学习——lxml库与Xpath提取网页数据
活动地址:CSDN21天学习挑战赛一.爬虫提取网页数据的流程图图源:100天精通Python(爬虫篇)--第45天:lxml库与Xpath提取网页数据_无羡ღ的博客-CSDN博客_pyt ...
长文 | 从发展轨迹、社会变迁和人口数据变化来看工具类产品的发展出路有哪些（1）
7月25日,我看到"腾讯某GM|工具类产品,未来发展的出路有哪些?"这个问题觉得很有意思,下面是我对这个问题的回答,希望有更多道友能参与进来分享. 我对这个问题很感兴趣,最近花了不 ...
一步一步教你抓数据——用.net精确提取网站数据的通用方法 [转]
一步一步教你抓数据--用.net精确提取网站数据的通用方法 [转] 2008年02月23日星期六 16:53 具体实现思路: 1 首先用WebClient类下载网页源码 public static ...
用Aspose.Words 从Word文档中提取表格数据
用Aspose.Words 从Word文档中提取表格数据对于某些项目,开发人员需要从Word文档中提取数据并导出到数据库.最大的挑战是必须支持现有Word文档. 相同格式且带多个数据块的Word文档 ...
asp.net 获取全部在线用户_提取在线数据的9个最佳网页抓取工具
Web Scraping工具专门用于从网站中提取信息.它们也被称为网络收集工具或Web数据提取工具. Web Scraping工具可以在各种场景中用于无限目的. 比如: 1.收集市场研究数据网络抓取 ...
怎么提取pdf中的表格数据_如何从pdf第1部分中提取表格数据
怎么提取pdf中的表格数据 In this article, we talk about the challenges and principles of extracting tabular dat ...
java索引图片,索引从图片中提取像素数据的代码的错误
我使用Python Imaging Library和Numpy运行以下代码,从图片中的特定感兴趣区域中提取像素数据 . 以下代码应该采用尺寸w乘以h的多张图片,切割宽度a(水平)和b(垂直)的边距,并 ...

提取voc数据集中特定的类

提取voc数据集中特定的类相关推荐

最新文章

热门文章