建立自己的voc数据集_将自己数据集转化成voc数据集格式并用mmdetection训练
一、准备自己的数据
拿nwpu数据集来举例,nwpu数据集文件夹中的内容是:
images文件夹:存放数据图片
labelTxt文件夹:存放标注信息,images文件夹中每张图片都对应一个txt文件存放在此文件夹中,图片与标注文件的名称相同
test.txt和train.txt:记录训练集和测试集中的图片名称
二、转换成voc格式数据集
转换过程提供了两个脚本以简化操作,将create_dir.py与creat_annotations.py拷贝至希望存放voc数据集的目录(VOCdevkit)下,之后:
1、创建目录
在根目录(.../VOCdevkit)下输入命令行命令python create_dir.py
会创建出以下样式的目录结构:
└── VOCdevkit #根目录
└── VOC2007
├── Annotations #存放xml文件,与JPEGImages中的图片一一对应,解释图片的内容等等
├── ImageSets
│ ├── Action
│ ├── Layout
│ ├── Main
│ └── Segmentation
├── JPEGImages #存放源图片
├── SegmentationClass #存放的是图片,语义分割相关
└── SegmentationObject #存放的是图片,实例分割相关
2、拷贝图片
将图片全部拷贝至JPEGImages中
或者,创建软连接到JPEGImages
总之,使得点击JPEGImages文件夹后的内容就是数据集的图片
3、生成Annotations文件夹中xml文件
在根目录(.../VOCdevkit)下输入命令行命令$ python create_annotations.py
PS:需要先修改下文件内容的四处(已在代码行后标注)
import os, sys
import glob
from PIL import Image
label_lists = []
img_lists = []
src_label_dir = '/mnt/B/nwpu/labelTxt/' ###指向自己数据集的labelTxt文件夹
src_img_dir = '/mnt/B/nwpu/images/' ###指向自己数据集的images文件夹
out_xml_dir = '/mnt/D/yuangan/datasets/nwpu/VOC2007/Annotations/' ###指向voc数据集的Annotations文件夹
# write in xml file
# os.mknod(src_xml_dir + '/' + img + '.xml')
xml_file = open((out_xml_dir + '/' + name + '.xml'), 'w')
xml_file.write('\n')
xml_file.write(' VOC2007\n')
xml_file.write(' ' + str(name) + '.png' + '\n') ###若准备的图片为jpg格式则将png替换为jpg
xml_file.write(' \n')
xml_file.write(' ' + str(width) + '\n')
xml_file.write(' ' + str(height) + '\n')
xml_file.write(' 3\n')
xml_file.write(' \n')
xml_file.close()
for label_item in label_lists:
4、确定voc数据集的训练集与测试集
将自己数据集中的test.txt和train.txt拷贝到/ImageSets/Main下,并将test.txt改名成testval.txt
至此,数据集格式转化完成
二、用mmdetection训练faster_rcnn和ssd网络
以下操作均在进入mmdetection项目目录(.../mmdetection)里完成
1、修改配置文件
1.1、配置检测类别
打开mmdet/datasets/voc.py
将红框内容修改成数据集中的类别
1.2、配置图片格式
打开mmdet/datasets/xml_style.py
红框内容按照图片是jpg格式还是png格式修改
2、训练方法
训练很简单,利用官方给出的命令:
python tools/train.py ${CONFIG_FILE}
{CONFIG_FILE}文件存放在configs/pascal_voc中
比如用faster_rcnn网络训练:
python tools/train.py configs/pascal_voc/faster_rcnn_r50_fpn_1x_voc0712.py
用ssd训练:
python tools/train.py configs/pascal_voc/ssd512_voc.py
3、更改训练好的模型的存放目录
训练好的网络存放地址默认在mmdetection/work_dir,若要指定存放目录则在命令后加入--work_dir ${YOUR_WORK_DIR}
如:
python tools/train.py configs/pascal_voc/faster_rcnn_r50_fpn_1x_voc0712.py --work_dir /home/jokery/project/mmdetection/work_dirs/dota_faster_rcnn/
建立自己的voc数据集_将自己数据集转化成voc数据集格式并用mmdetection训练相关推荐
- pandas的自带数据集_盘点 | Python自带的那些数据集
01 Seaborn自带数据集 在学习Pandas透视表的时候,大家应该注意到,我们使用的案例数据"泰坦尼克号"来自于seaborn自带的在线数据库,我们可以通过seaborn提 ...
- python的自带数据集_盘点 | Python自带的那些数据集
01 Seaborn自带数据集 在学习Pandas透视表的时候,大家应该注意到,我们使用的案例数据"泰坦尼克号"来自于seaborn自带的在线数据库,我们可以通过seaborn提供 ...
- mot数据集_【多目标跟踪】搞不懂MOT数据集,会跑代码有啥用!
基本数据集介绍 MOT 数据集 数据集用的最多的是 MOTChallenge,专注于行人追踪的.https://motchallenge.net/15 年的都是采集的老的数据集的视频做的修正.参考论文 ...
- 处理自己的数据集_手写代码实现KDD CUP99数据集的数据归一化处理
归一化是数据处理的常用方法之一,目的是消除不同评价指标之间的量纲对数据分析结果的影响,使各指标处于同一数量级,以解决数据指标之间的可比性问题. 目前学术界关于归一化和标准化的概念还不统一,常常会把这两 ...
- python数据集_【Python数据分析实战】divorce数据集
1.数据集来源Divorce Predictors data set Data Setarchive.ics.uci.edu 2.库.函数和数据集的导入 import numpy as np imp ...
- msra数据集_干货下载 | 中文自然语言处理 语料/数据集
来源:GitHub 作者:SophonPlus ChineseNlpCorpus 搜集.整理.发布中文自然语言处理 语料/数据集,与有志之士共同促进中文自然语言处理 的 发展. 情感/观点/评论 倾向 ...
- python合并两个数据集_在Python中合并两个数据集
我有两组x-y数据,它们的x值应该合并.为了说明这一点,第一组如下所示:0.5;3.4 0.8;3.8 0.9;1.2 1.3;1.1 1.9;2.3 第二盘是这样的: ^{pr2}$ 数据在两个单独 ...
- 齿轮箱数据集_基于不同工况下辅助数据集的齿轮箱故障诊断
[1] 邹今春, 沈玉娣.变工况齿轮箱故障诊断方法综述[J].机械传动, 2012, 36(8)124-132. ZHOU Jin-chun, SHEN Yu-di, A review of gear ...
- 建立自己的voc数据集_制作自己的数据集(VOC2007格式)用于Faster-RCNN训练
一.数据集文件夹 新建一个文件夹,用来存放整个数据集,或者和voc2007一样的名字:VOC2007 然后在文件夹里面新建如下文件夹: 二.将训练图片放到JPEGImages 将所有的训练图片放到该文 ...
最新文章
- 在特定情况下的简单SSO实现方案
- clickhouse官方文档_ClickHouse和他的朋友们(1)编译、开发、测试
- POJ 1170 Shoping Offers(IOI 95)
- 论述一个模式的时候的方法
- ML.NET Cookbook:(11)如果我的训练数据不在文本文件中怎么办?
- 2019升职加薪必备:你一定要修炼的产品思维
- 【Python】GUI编程(Tkinter)教程
- 黑苹果_黑苹果扯犊子篇
- db2 linux 导入数据_MySQL数据的导出和导入(Linux)
- 【mac】iTerm2中ssh保持连接不断开
- 物理学 物体的运动力学分析之牛顿三定律 单摆的MATLAB运动仿真(一)
- SSM毕设项目国有资产管理系统3c938(java+VUE+Mybatis+Maven+Mysql)
- iOS 边学边记 升级ios14 Xcode真机调试启动非常慢的问题解决
- 如何判断打码平台哪个好
- “DDS” 你为什么要丢数据丫
- 在哪里可以下载免费的office使用?
- eterm和easyfare的官网地址
- A*算法(超级详细讲解,附有举例的详细手写步骤)
- 1080P画面大小却是1920*1088的两个原因
- 多旋翼飞行器电机旋转方向图示