最新更新:因为训练过模型,我发现有些类别mAP太低,然后就想去掉train这个类别,但发现一个新问题:官方下的那个train的大json文件似乎存在数据缺失?我用了两个小项目尝试将大json转化为xml,发现都只有69863个标签文件。但是好在网盘下的有小json标签文件70000个,所以我又想办法将小json转化为xml,同时转化的时候去掉train这一类。

下面这篇文章中的应该是可以从小json转换到xml,至于里面的txt转换我没用过,不清楚可行性。

(二)使用YOLOv3训练BDD100K数据集之标签格式转换_Xavier丶Zeng的博客-CSDN博客

然后再推荐个从voc到其他格式的项目:

https://github.com/premkumar25/Convert_VOC_COCO_YOLO

下面是之前写的:

_______________________________________________

今天主要任务是想搞定一个好用的行人车辆目标检测数据集。

大多都是这种:

车辆行人检测数据集_目标检测数据集-车辆_weixin_39846361的博客-CSDN博客

Toyota Motor Europe (TME) Motorway Dataset

bit数据集

都是那种汽车的

要么就都是那种行人的。

然后我发现有一个bdd100k的数据集还挺适合行人车辆目标检测的。

下载方式:

BDD100K Documentation — BDD100K documentation

但是很奇怪啊,我每次下载到最后都会出现下载错误,原因未知。

然后就找了个数据集大全的:

链接:https://pan.baidu.com/s/1fFSzGJt6Op4k7Gyo9QjtYA 
提取码:kuld

当然我还找到一篇博客似乎下载有用,标签格式转换暂时还没试过,但看起来还可以:

(1条消息) BDD100K数据集下载和标签格式转换问题_Liu_Zongyuan的博客-CSDN博客_bdd100k数据集下载

格式转换(下面更新了解决方案):

bdd100k数据集的格式是:json

而之前提到的所使用的yolov3的代码是需要voc数据集格式,也就是xml。甚至说似乎yolov3原本使用的是txt格式,这就带来了格式转换的问题。

我解决的思路首先是去b站上找视频,然后发现似乎不太行,针对json转xml格式。

1、但是有一个视频是卖软件的,淘宝上确实是有,但要个小几十,所以暂时不弄。

2、然后我去csdn上找,发现一个大概率能用的:

(二)使用YOLOv3训练BDD100K数据集之标签格式转换_Xavier丶-CSDN博客

然后还有人根据这篇和自己的任务写了个github的代码:

bdd100k转xml_liu506039293的博客-CSDN博客_bdd100k

liuzehao/bdd100ktoxml: bdd100k数据集转xml (github.com)

然后的话目前只停留在这一步。

3、还有一个是我发现其实那个bdd100k的网站当时不知道是点了哪个下载,大概率是下完数据集后还有一个xml格式的能下载,但是老问题:

4、还一个延伸问题:

其实我想过github上肯定有人写过能从json转xml的代码,也找到了,但还是那个问题。不会用别人的github项目,这个我之前遗留下来的问题。关键问题在于:read me给的信息完全不够,而上面的项目由于过于完整,导致以目前我的能力难以看懂,这个问题一定要解决!

目前讨论了一下还有一些思路:

1、首先git clone

2、然后去conda创造环境:包括python和库,一般在requirement.txt里面

3、那些奇奇怪怪的文件都先不管。

4、对着readme.md去跑成功一次代码。

5、看代码去改成自己所需要的,一般就是调路径、模式、接口。

格式转换最终解决方案:

先提一嘴,这项目不是一次就找到了,我先找了个json转xml的项目,发现效果和我想的不太一样,后面就搜bdd to voc才找到最终解决方案。

去github上找了个项目(github上不去就去搜fastgithub弄个小软件就行)

​​​​​​leeesangwon/bdd100k_to_VOC: converting bdd100k json to pascal voc style xml files (github.com)

用git clone下载再用vscode打开。

然后里面的代码修改的话其实就一个问题:路径。

第一个注意点:

这里只能用/不能用\,不然会报错。

具体可以看这个:

(1条消息) Python报错:‘unicodeescape‘ codec can‘t decode bytes in position 2-3: truncated \UXXXXXXXX escape_Riding the snail chase missiles ~-CSDN博客第二个注意点:

这里会发现它要的是那个总json文件,而如果你要是从我那网盘地址下,那是单独一个个的json,注意一下这里就行。

其他的就是把bdd图片和标签json所在路径调对就可以了。

然后的话结果保存在那个bdd路径下有个xml的文件夹。

验证转换结果:

安装好labelimg库,然后

这里一定要先change save dir去标签文件夹(即xml文件所在处)

然后再open dir去图片所在处

然后就能看到标注框。

至此格式转换从json到xml成功。

题外话:

今天的进度是真的不行,早上在下数据集报错。中午复习了一波复试,但没想到下午回实验室有人在复试面试模拟,属于是压力给足了。

新的问题:

1、模拟面试的同学知识量如何做到那么扎实?(设计好的题库?)

2、那位同学如何对自己的毕设项目进行的修改?

3、那位同学的自我介绍那些怎么弄的?

延伸问题:

4、瑞芯微的学习看不见希望。

5、之前概念学习阶段还有遗留问题。

6、yolov3具体实现代码其实并没有足够深入,无法进行代码复现,改进也成问题。

7、github项目看不懂问题。

今天并没有推进多少工作进度,明日计划:

1、可以的话想把bdd100k的数据集转换成xml格式。

2、用现成的voc数据集小跑一下模型。

3、未来重装一个ubuntu18.04系统然后去实现yolov3项目的复现。

4、想尽一切办法学习瑞芯微。

yolov3数据集--bdd100k相关推荐

  1. 【数据集NO.1】最经典大规模、多样化的自动驾驶视频数据集——BDD100K数据集

    本专栏主要分享本人收集整理的深度学习数据集资源,供大家参考使用.一个合适的数据集是论文写作.科研成功的开始.栏目会先简要介绍数据集,然后分享数据集的链接.本文分享最经典大规模.多样化的自动驾驶视频数据 ...

  2. 使用YOLOv3训练BDD100K数据集之标签格式转换

    BDD100K数据集介绍: BDD100K的道路目标检测部分总共有10类:bus,traffic light,traffic sign,person,bike,truck,moter,car,trai ...

  3. 使用yolov5训练自动驾驶目标检测数据集BDD100K

    文章目录 一.什么是BDD100K 二.数据预处理 三.环境配置 四.修改模型结构 五.迁移学习 六.训练BDD100K 七.评估性能 八.结语 一.什么是BDD100K BDD100K是伯克利发布的 ...

  4. yolov3数据集制作

    3. 制作自己的训练集测试集 首先把你的训练集(测试集)图片放到/darknet/dataset/Train (/darknet/dataset/Test ) , 图片扩展名为.jpg 然后对你数据集 ...

  5. BDD100K:最经典大规模、多样化的自动驾驶视频数据集

    来源:HyperAI超神经 本文约1000字,建议阅读6分钟 目前,自动驾驶的公开数据集主要由视频和图片组成,近两年也增加了许多雷达数据.今天将介绍的数据集为加州大学伯克利分校发布的 BDD100K ...

  6. Dataset之BDD100K:BDD100K数据集的简介、下载、使用方法之详细攻略

    Dataset之BDD100K:BDD100K数据集的简介.下载.使用方法之详细攻略 目录 BDD100K数据集的简介 BDD100K数据集的下载 BDD100K数据集的使用方法 BDD100K数据集 ...

  7. BDD100K:大规模、多样化的驾驶视频数据集

    文章目录 BDD100K:大规模.多样化的驾驶视频数据集 Annotations (一)道路目标检测 (二)车道线标记 (三)可行驶区域 (四)全帧实例分割 Driving Challenges Fu ...

  8. 史上最简单-在 windows+python3.6 环境下创建自己的YOLOv3 [ VOC2007 ] 数据集

    因为看了好多博客,将YOLOv3数据集标记分为好几步,感觉......有点说不出来的奇怪. 现在想想,能用程序运行的事情,为啥要手动呢? 请按如下步骤进行操作: 1. 标记数据集. 标记数据集所用软件 ...

  9. 把xml数据集 转为 BDD100K 的json数据格式

    注意:本文所表示的json格式并非coco数据集格式,而是自动驾驶数据集BDD100K的标注. 请先确认再看全文!!!!! 一.修改数据集读取位置 5~9行 二.修改类别 33~34行,若有标注类别名 ...

最新文章

  1. SVM支持向量机--sklearn研究
  2. 泛型类型通常在Dao和Service 中使用BaseDaoT extends Serializable的泛型
  3. python解码base64_在python中解码Base64 Gzip
  4. 汇编语言:第二章 寄存器
  5. EIGRP and the OSPF redistribute
  6. 如何在命令行更改IP地址
  7. 让Windows 7变成WIFI热点
  8. zabbix监控系统的实际应用(客户端安装-基本应用设置-报警提醒篇)
  9. 【梳理】高等代数(北大) 第一章 线性方程组(docx)
  10. 延迟渲染,及材质ID
  11. git之ssh与https地址之间的切换、设置免密码访问服务器、remote、set-url、config、global、credential、helper、store、cache、origin
  12. 7个实用有效的shopify运营策略,跨境电商卖家必知
  13. 更改web.config,让godady的win主机启用gzip压缩
  14. 会议OA之我的会议(排座送审)
  15. 分布式对象存储服务器minio
  16. Microsoft (Office) 365本地无法激活解决方案
  17. ASP.NET Core 和 EF Core系列教程——CRUD
  18. 如何通过Java实现485通信
  19. 树莓派摄像头检测运动物体
  20. 机器学习实用代码汇总(你想要的这里都有)

热门文章

  1. 更改tomcat服务器项目的图标
  2. 股权证明pos记账权是根据不同节点_POC、POW、POS,谁才是共识之王?
  3. 十.四轮车驱动开发之三: 巧用编码器获取电机转速信息
  4. Solidworks模型转换到URDF格式并配置Moveit的详细教程
  5. 《2022年中国上市公司数字经济白皮书》(附下载)
  6. 电力-故障录波(向量图)
  7. win10开机卡死在logo处无限转圈怎么办
  8. [Perl工具篇] 安装Strawberry Perl与第一个Perl程序(Padre下)
  9. 模拟3d星空python_Python Blender 绘制3D宇宙飞船
  10. django 数据库迁移(migrate)