一、显示VOC2007数据集中的图像及标注信息

以VOC2007为例：包含下面五个部分，分别图像标注信息和图像，我这里主要是根据给定的标注信息，将对应图像所属类别标注在图像上；

先看一下annotations中的数据：.xml是可扩展标记语言

以000002.xml为例，内容为：

<annotation><folder>VOC2007</folder><filename>000002.jpg</filename><source><database>The VOC2007 Database</database><annotation>PASCAL VOC2007</annotation><image>flickr</image><flickrid>329145082</flickrid></source><owner><flickrid>hiromori2</flickrid><name>Hiroyuki Mori</name></owner><size> //图像尺寸<width>335</width><height>500</height><depth>3</depth></size><segmented>0</segmented><object> // 对象<name>train</name><pose>Unspecified</pose><truncated>0</truncated><difficult>0</difficult><bndbox> // 边界框<xmin>139</xmin><ymin>200</ymin><xmax>207</xmax><ymax>301</ymax></bndbox></object>
</annotation>

根据xml中提供的信息进行提取对应的objects和bndbox;

import mxnet as mx
import xml.etree.ElementTree as ET
import matplotlib.pyplot as plt
# 在图像中绘制方框
from matplotlib.patches import Rectangle
import random
import cv2# 测试图像的标注文件和图像
xml_path = 'VOC_image_demo/000002.xml'
img_path = 'VOC_image_demo/000002.jpg'bbox = []
tree = ET.parse(xml_path)
root = tree.getroot()
objects = root.findall('object')
for object in objects:# 根据找出的object再进一步找出图像中的类别名name = object.find('name').text# xml中的标记信息中的bndboxbndbox = object.find('bndbox')# 对应坐标xmin = int(bndbox.find('xmin').text)ymin = int(bndbox.find('ymin').text)xmax = int(bndbox.find('xmax').text)ymax = int(bndbox.find('ymax').text)# 格式：类名:name+[坐标]bbox_i = [name,xmin,ymin,xmax,ymax]bbox.append(bbox_i)print(bbox)image_string = open(img_path,'rb').read()
image = mx.image.imdecode(image_string,flag=1).asnumpy()
# 显示原图
fig,ax = plt.subplots()
plt.imshow(image)
colors = dict()
for bbox_i in bbox:class_name = bbox_i[0]if class_name not in colors:# 随机生成颜色或者自己指定也可以colors[class_name] = (random.random(),random.random(),random.random())xmin = bbox_i[1]ymin = bbox_i[2]xmax = bbox_i[3]ymax = bbox_i[4]rect = Rectangle(xy=(xmin,ymin),width=xmax-xmin,height=ymax-ymin,edgecolor = colors[class_name],facecolor = 'None',linewidth = 3.5)plt.text(xmin,ymin-6,'{:s}'.format(class_name),bbox = dict(facecolor=colors[class_name],alpha = 0.5))ax.add_patch(rect)plt.axis('off')plt.savefig('VOC_image_demo/000002_groundtruth')

[['train', 139, 200, 207, 301]]

一、显示VOC2007数据集中的图像及标注信息相关推荐

8SimpleAdapter:一行显示的数据有图标
SimpleAdapter:一行显示的数据有图标,文本等信息. SimpleAdapter(Context context, List<? extends Map<String, ?> ...
9 万张车辆图像及标注数据 - 数据堂
9 万张车辆图像及标注数据 - 数据堂 https://www.datatang.com/dataset 1. 数据产品概述车型分布:8 种车型数据特点:车辆齐全,数据清晰,矩形框标注车牌采集设 ...
R语言使用gt包和gtExtras包优雅地、漂亮地显示表格数据：使用gt包可视化表格数据，使其易于阅读和理解、使用gtExtras包添加一个图，显示表中某一列中的数字、并为类型数据添加图像符号标签
R语言使用gt包和gtExtras包优雅地.漂亮地显示表格数据:使用gt包可视化表格数据,使其易于阅读和理解.使用gtExtras包添加一个图,显示表中某一列中的数字.并为类型数据添加图像符号标签目 ...
VB如何直接显示内存中的二进制图像数据
有时在进行网络程序设计时,我们希望客户端接收到服务器传来的图像文件的二进制数组的,能够直接显示,而不是通过保存到临时文件后显示,其实通过COM的IPicture接口,在VB里非常容易做到,代码如下: ...
jsf mysql_在JSF数据表中显示来自MySQL数据库的图像[关闭]
小编典典您可以使用来显示存储在中的图像byte[],而不管其byte[]来源(数据库,磁盘文件系统,网络等)如何.最简单的例子是: 指的是StreamedContent财产. 但是,这有一个陷阱,尤 ...
VTK修炼之道13：数据读写_图像数据的读写
1.前言 VTK应用程序所需的数据可以通过两种途径获取: 第一种是生成模型 ;第二种是从外部存储介质里导入相关的数据文件,(如vtkBMPReader读取 BMP图像) .VTK 也可以将程序中处理完 ...
swift解析html数据类型,ios-Swift：以标签或textVi显示HTML数据
ios-Swift:以标签或textVi显示HTML数据我有一些HTML数据,其中包含标题,段落,图像和列表标签. 有没有一种方法可以在一个UITextView或UILabel中显示此数据? 12个 ...
中livechart显示大数据_Kaggle 大数据竞赛中的Tricks总结
作者 | Prince Canuma 编译 | AI有道, ronghuaiyang 任何领域的成功都可以归结为一套小规则和基本原则,当它们结合在一起时会产生伟大的结果. 机器学习和图像分类也不例外, ...
海康相机SDK+halcon17(64位)+MFC+VS(64位）联合开发遇到的问题(在使用GenImage3Extern将RGB数据转换为halcon图像时出现异常情况处理)
这几天遇到了问题就是在MFC中开发SDK,遇到了问题是: 1.回调函数中的原始图像没数据,但是图像的信息是有的这个问题的主要原因在于海康相机的默认输出数据的格式是 YUYV ,并不是RGB的,因此需 ...
html显示统计图数据模板_博客统计信息显示模板
html显示统计图数据模板 One of the things that I do while drinking my morning coffee is to check the statistic ...

一、显示VOC2007数据集中的图像及标注信息

一、显示VOC2007数据集中的图像及标注信息相关推荐

最新文章

热门文章