在使用SSD-tensorflow训练中需要传入自己的训练集与测试集的一些参数,其中包含各类名出现过的图片数,各类总框数,及总数。

今天写了一个计数的脚本如下,可用于索引XML文件中的目标数:

import re
import osclass_name =['0','1','2','3','4','5','6','7','8','9'] #自己的类名
# './VOC2007/test/Annotations'
annotation_folder = './VOCtest/test/Annotations'     #改为自己xml标签文件夹的路径
list = os.listdir(annotation_folder)
current_number = []#存放类出现的次数
image_count=[]#存放类出现过的图片数
i = 0
while (i < len(class_name)):cla = class_name[i]total_number=0image_num=0for j in range(0, len(list)):path = os.path.join(annotation_folder,list[j])# print(path)annotation_file = open(annotation_folder + '/' + os.path.basename(path)).read()count = len(re.findall("<name>" + cla + "</name>", annotation_file)) #这里因为我的类名比较简单而且是数字,所以不能单单索引类名,必须把类名前后的符号加上,按自己的需求索引if count >0:image_num +=1total_number += countimage_count.append(image_num)current_number.append(total_number)i += 1
#打印格式是按照SSD中格式设置的
for i in range(len(current_number)):print('\"%d\" : (' %i,image_count[i],',',current_number[i],'),')
print('\"total\" : (',len(list),',',sum(current_number),'),')

结果如下:

统计xml文件中的标签出现框数及出现过的图片数相关推荐

  1. 【XML文件数据预处理】获取xml文件中所有标签名称及数量||提取某个特定标签的数量||生成包含某个标签的图片索引txt并复制图片到指定文件夹

    目录 1.获取xml文件中所有标签名称及数量 2.提取某个特定标签的数量 3.生成包含某个标签的图片索引txt并复制图片到指定文件夹 1.获取xml文件中所有标签名称及数量 [需求]自己标注的数据集, ...

  2. pom.xml文件中nonFilteredFileExtension标签

    maven打包项目的时候pom.xml配置文件里可以配置对项目进行统一编码,但是部分文件 可能不需要进行重新编码,例如: 证书文件:重新编码后可能导致证书不可用.    需要过滤掉不需要编码的文件:过 ...

  3. Mybatis XML文件中使用CDATA标签

    0.背景   当下,使用Mybatis的XML文件书写复杂SQL,依然是一种主流的选择.那么,我们在书写SQL语句时,要时刻提醒自己,自己正在书写一个XML文件,XML文件对于一些特殊字符,是会进行解 ...

  4. 【项目经验】如果想在mapper.xml文件中的一个标签中写多条sql语句,则需要在jdbc的配置文件中稍做配置

    如果想在mapper.xml文件中的一个标签中写多条sql语句,则需要在jdbc的配置文件中稍做配置: url=jdbc:mysql://127.0.0.1:3306/airipo?useUnicod ...

  5. 在xml文件的Preference标签中,用extra给intent标签加参数

    2019独角兽企业重金招聘Python工程师标准>>> 在xml文件的Preference标签中,用<extra>给<Intent>标签加参数,以及<i ...

  6. python提取xml的所有框坐标_python 提取批量xml文件中的坐标信息存入txt文件 xml文件转txt文件...

    读取多个xml文件中的坐标信息:xmin.xmax.ymin.ymax(实际为一个矩形框的坐标值),并通过简单的计算得到矩形框的长.宽,最后按照自己的需求读入到一个txt文档中 xml文件目录及文件如 ...

  7. 提取Insight-MVT_Annotation_Train 数据集标签xml文件中的信息

    Insight-MVT_Annotation_Train  数据集标签xml文件中的信息 从xml文件中解析出所要的信息  type  height  width  top  left  写成Pasc ...

  8. python 统计多个json文件中某个标签的数量

    1.json文件数据 json文件数据长这样: 然后我们有多个json文件: 目标: 我们现在需要统计每个json文件所有label标签后的值的数量. 2.代码 import json from os ...

  9. web.xml文件中的web-app元素

    [转载]web.xml文件中的web-app元素 (2012-05-24 13:35:57) 转载▼ 标签: 转载 分类: java 挺全 的 呵呵呵 转了 原文地址:web.xml文件中的web-a ...

最新文章

  1. 使用Python+OpenCV+dlib为人脸生成口罩
  2. 计算机科学与技术第6次上机实验报告,计算机科学与技术第次实验报告-20210602214116.docx-原创力文档...
  3. PHP 通过随机数获得ASCII 值返回字符。
  4. 如何给指定地址空间拍一个快照
  5. Py_Initialize fails - unable to load the file system codec
  6. 【专升本计算机】专升本计算机期末考试复习题(A卷附答案)
  7. 20181009-6 选题 Scrum立会报告+燃尽图 05
  8. mysql的槽_Mysql槽点 - MySQL及其它开源数据库 - ITPUB论坛-中国专业的IT技术社区...
  9. HDU 6170 2017 多校训练:Two strings(DP)
  10. Android studio 常用的插件
  11. salt 服务启动失败
  12. Angr安装与使用之使用篇(十四)
  13. 汇编语言中OUT和IN的用法
  14. windows系统下,在iis管理器(无W3SVC/WAS服务)或网站IIS功能不全(无默认文档、模块、各种规则设置等)
  15. 2021年ARINC818数字视频传输重磅新品–Helios
  16. MySQL InnoDB引擎如何保证事务特性
  17. 【雅思大作文考官范文】——第十九篇:独居人口' essay
  18. python数据分析师面试题选
  19. Sat Sep 25 07:38:46 Local time zone must be set--see zic manual page 2021
  20. python中断输入_在 Python 中接管键盘中断信号的实现方法

热门文章

  1. linux df -h指令,Linux df 命令使用参数详解
  2. python综合设计问题_Python 设计和历史的 27 个问题(2)
  3. CodeForces - 801C Voltage Keepsake 二分
  4. pytorch学习笔记(二十四):深度卷积神经网络(AlexNet)
  5. 《南溪的目标检测学习笔记》——权重初始化
  6. 远程连接Ubuntu服务器
  7. Python接通图灵机器人
  8. 东大OJ-Max Area
  9. LeetCode for SQL 176. 第二高的薪水 (ifnull limit order by)
  10. AndroidStudio打包生成apk