一、准备自己的数据

拿nwpu数据集来举例,nwpu数据集文件夹中的内容是:

images文件夹:存放数据图片

labelTxt文件夹:存放标注信息,images文件夹中每张图片都对应一个txt文件存放在此文件夹中,图片与标注文件的名称相同

test.txt和train.txt:记录训练集和测试集中的图片名称

二、转换成voc格式数据集

转换过程提供了两个脚本以简化操作,将create_dir.py与creat_annotations.py拷贝至希望存放voc数据集的目录(VOCdevkit)下,之后:

1、创建目录

在根目录(.../VOCdevkit)下输入命令行命令python create_dir.py

会创建出以下样式的目录结构:

└── VOCdevkit #根目录

└── VOC2007

├── Annotations #存放xml文件,与JPEGImages中的图片一一对应,解释图片的内容等等

├── ImageSets

│ ├── Action

│ ├── Layout

│ ├── Main

│ └── Segmentation

├── JPEGImages #存放源图片

├── SegmentationClass #存放的是图片,语义分割相关

└── SegmentationObject #存放的是图片,实例分割相关

2、拷贝图片

将图片全部拷贝至JPEGImages中

或者,创建软连接到JPEGImages

总之,使得点击JPEGImages文件夹后的内容就是数据集的图片

3、生成Annotations文件夹中xml文件

在根目录(.../VOCdevkit)下输入命令行命令$ python create_annotations.py

PS:需要先修改下文件内容的四处(已在代码行后标注)

import os, sys

import glob

from PIL import Image

label_lists = []

img_lists = []

src_label_dir = '/mnt/B/nwpu/labelTxt/' ###指向自己数据集的labelTxt文件夹

src_img_dir = '/mnt/B/nwpu/images/' ###指向自己数据集的images文件夹

out_xml_dir = '/mnt/D/yuangan/datasets/nwpu/VOC2007/Annotations/' ###指向voc数据集的Annotations文件夹

# write in xml file

# os.mknod(src_xml_dir + '/' + img + '.xml')

xml_file = open((out_xml_dir + '/' + name + '.xml'), 'w')

xml_file.write('\n')

xml_file.write(' VOC2007\n')

xml_file.write(' ' + str(name) + '.png' + '\n') ###若准备的图片为jpg格式则将png替换为jpg

xml_file.write(' \n')

xml_file.write(' ' + str(width) + '\n')

xml_file.write(' ' + str(height) + '\n')

xml_file.write(' 3\n')

xml_file.write(' \n')

xml_file.close()

for label_item in label_lists:

4、确定voc数据集的训练集与测试集

将自己数据集中的test.txt和train.txt拷贝到/ImageSets/Main下,并将test.txt改名成testval.txt

至此,数据集格式转化完成

二、用mmdetection训练faster_rcnn和ssd网络

以下操作均在进入mmdetection项目目录(.../mmdetection)里完成

1、修改配置文件

1.1、配置检测类别

打开mmdet/datasets/voc.py

将红框内容修改成数据集中的类别

1.2、配置图片格式

打开mmdet/datasets/xml_style.py

红框内容按照图片是jpg格式还是png格式修改

2、训练方法

训练很简单,利用官方给出的命令:

python tools/train.py ${CONFIG_FILE}

{CONFIG_FILE}文件存放在configs/pascal_voc中

比如用faster_rcnn网络训练:

python tools/train.py configs/pascal_voc/faster_rcnn_r50_fpn_1x_voc0712.py

用ssd训练:

python tools/train.py configs/pascal_voc/ssd512_voc.py

3、更改训练好的模型的存放目录

训练好的网络存放地址默认在mmdetection/work_dir,若要指定存放目录则在命令后加入--work_dir ${YOUR_WORK_DIR}

如:

python tools/train.py configs/pascal_voc/faster_rcnn_r50_fpn_1x_voc0712.py --work_dir /home/jokery/project/mmdetection/work_dirs/dota_faster_rcnn/

建立自己的voc数据集_将自己数据集转化成voc数据集格式并用mmdetection训练相关推荐

  1. pandas的自带数据集_盘点 | Python自带的那些数据集

    01  Seaborn自带数据集 在学习Pandas透视表的时候,大家应该注意到,我们使用的案例数据"泰坦尼克号"来自于seaborn自带的在线数据库,我们可以通过seaborn提 ...

  2. python的自带数据集_盘点 | Python自带的那些数据集

    01 Seaborn自带数据集 在学习Pandas透视表的时候,大家应该注意到,我们使用的案例数据"泰坦尼克号"来自于seaborn自带的在线数据库,我们可以通过seaborn提供 ...

  3. mot数据集_【多目标跟踪】搞不懂MOT数据集,会跑代码有啥用!

    基本数据集介绍 MOT 数据集 数据集用的最多的是 MOTChallenge,专注于行人追踪的.https://motchallenge.net/15 年的都是采集的老的数据集的视频做的修正.参考论文 ...

  4. 处理自己的数据集_手写代码实现KDD CUP99数据集的数据归一化处理

    归一化是数据处理的常用方法之一,目的是消除不同评价指标之间的量纲对数据分析结果的影响,使各指标处于同一数量级,以解决数据指标之间的可比性问题. 目前学术界关于归一化和标准化的概念还不统一,常常会把这两 ...

  5. python数据集_【Python数据分析实战】divorce数据集

    1.数据集来源Divorce Predictors data set Data Set​archive.ics.uci.edu 2.库.函数和数据集的导入 import numpy as np imp ...

  6. msra数据集_干货下载 | 中文自然语言处理 语料/数据集

    来源:GitHub 作者:SophonPlus ChineseNlpCorpus 搜集.整理.发布中文自然语言处理 语料/数据集,与有志之士共同促进中文自然语言处理 的 发展. 情感/观点/评论 倾向 ...

  7. python合并两个数据集_在Python中合并两个数据集

    我有两组x-y数据,它们的x值应该合并.为了说明这一点,第一组如下所示:0.5;3.4 0.8;3.8 0.9;1.2 1.3;1.1 1.9;2.3 第二盘是这样的: ^{pr2}$ 数据在两个单独 ...

  8. 齿轮箱数据集_基于不同工况下辅助数据集的齿轮箱故障诊断

    [1] 邹今春, 沈玉娣.变工况齿轮箱故障诊断方法综述[J].机械传动, 2012, 36(8)124-132. ZHOU Jin-chun, SHEN Yu-di, A review of gear ...

  9. 建立自己的voc数据集_制作自己的数据集(VOC2007格式)用于Faster-RCNN训练

    一.数据集文件夹 新建一个文件夹,用来存放整个数据集,或者和voc2007一样的名字:VOC2007 然后在文件夹里面新建如下文件夹: 二.将训练图片放到JPEGImages 将所有的训练图片放到该文 ...

最新文章

  1. 在特定情况下的简单SSO实现方案
  2. clickhouse官方文档_ClickHouse和他的朋友们(1)编译、开发、测试
  3. POJ 1170 Shoping Offers(IOI 95)
  4. 论述一个模式的时候的方法
  5. ML.NET Cookbook:(11)如果我的训练数据不在文本文件中怎么办?
  6. 2019升职加薪必备:你一定要修炼的产品思维
  7. 【Python】GUI编程(Tkinter)教程
  8. 黑苹果_黑苹果扯犊子篇
  9. db2 linux 导入数据_MySQL数据的导出和导入(Linux)
  10. 【mac】iTerm2中ssh保持连接不断开
  11. 物理学 物体的运动力学分析之牛顿三定律 单摆的MATLAB运动仿真(一)
  12. SSM毕设项目国有资产管理系统3c938(java+VUE+Mybatis+Maven+Mysql)
  13. iOS 边学边记 升级ios14 Xcode真机调试启动非常慢的问题解决
  14. 如何判断打码平台哪个好
  15. “DDS” 你为什么要丢数据丫
  16. 在哪里可以下载免费的office使用?
  17. eterm和easyfare的官网地址
  18. A*算法(超级详细讲解,附有举例的详细手写步骤)
  19. 1080P画面大小却是1920*1088的两个原因
  20. 多旋翼飞行器电机旋转方向图示

热门文章

  1. 关于6月9日凌晨的苹果发布会杂谈
  2. 漫谈 SLAM 技术(上)
  3. 滚珠螺杆在设备上的应用
  4. Golang 语言的排序、结构体排序
  5. 腾讯理财通NIFD-互联网理财行为与安全研究报告——附下载链接
  6. JavaScript快速排序算法
  7. 一文读懂边缘计算和业务场景
  8. jet-cp4005 linux双面打印,小身材大作为 惠普 CP4005办公好助手
  9. oracle连接出现问题
  10. 下载文件的三种具体实现方式