widerPerson数据集属于密集人群标注类型数据集
内部图片看标记为网络收集,很多带有水印
数据集对行人检测,分为5个类别,分别为1正常行人,2骑车人,3遮挡部分的人体,4人形物体,5无法区分的密集人堆
数据集文件编码为utf-16格式的文本文件,第一行为标注的个数,这个比较另类,需要在转换中去除
其他标注行格式为 编号,标注左上角,标注右上角,标注宽度,标注高度,转换yolo格式文件比较方便。

网络上有很多资料都是直接转换成voc格式的xml文件,为了方便测试,这里直接提供直接转成yolo格式的文件,保存下面为py格式文件,在根目录建立一个train文件夹,直接运行,会将train内生成对应训练yolo格式(悟空学堂)

import os
from pathlib import Path
from PIL import Image
import csv
import shutil# coding=utf-8
def check_charset(file_path):import chardetwith open(file_path, "rb") as f:data = f.read(4)charset = chardet.detect(data)['encoding']return charsetdef convert(size, box0,box1,box2,box3):dw = 1. / size[0]dh = 1. / size[1]x = (box0 + box2) / 2 * dwy = (box1 + box3)/ 2 * dhw = (box2-box0) * dwh = (box3-box1) * dhreturn (x, y, w, h)if __name__ == '__main__':path = 'train.txt'with open(path, 'r') as f:img_ids = [x for x in f.read().splitlines()]for img_id in img_ids: # '000040'img_path = 'Images/' + img_id + '.jpg'with Image.open(img_path) as Img:img_size = Img.sizeans = ''label_path = img_path.replace('Images', 'Annotations') + '.txt'outpath = 'train/' + img_id + '.txt'with open(label_path,encoding=check_charset(label_path)) as file:line = file.readline()count = int(line.split('\n')[0]) # 里面行人个数line = file.readline()while line:cls = int(line.split(' ')[0])if cls == 1 or cls == 2 or cls == 3 or cls == 4:xmin = float(line.split(' ')[1])ymin = float(line.split(' ')[2])xmax = float(line.split(' ')[3])ymax = float(line.split(' ')[4].split('\n')[0])print(img_size[0],img_size[1],xmin,ymin,xmax,ymax)bb = convert(img_size, xmin,ymin,xmax,ymax)ans = ans + '1' + ' ' + ' '.join(str(a) for a in bb) + '\n'line = file.readline()with open(outpath, 'w') as outfile:outfile.write(ans)shutil.copy(img_path, 'train/' + img_id + '.jpg')

注意,以为所有的标注我都按行人格式的,所以1,2,3,4都保留并转换成1类,人堆那个用不到就剪除了

另外还有一种使用中情况,就是一些图片文件不适合的,会删除,删除后,需要把对应的yolo格式txt重新对应,把不想要的图片文件删除,建立一个train1文件夹,运行下面代码py文件,清理完成

import os
from pathlib import Path
from PIL import Image
import csv
import shutilwd = os.getcwd()anns = os.listdir('train')
for ann in anns:if ann[-3:] != 'jpg':continueshutil.copy(wd + '/train/' + ann[:-3] + 'jpg',wd + '/train1/' + ann[:-3] + 'jpg')shutil.copy(wd + '/train/' + ann[:-3] + 'txt',wd + '/train1/' + ann[:-3] + 'txt')

WiderPerson行人检测数据集转yolo格式相关推荐

  1. WiderPerson行人检测数据集

    1. 简介 WiderPerson数据集是比较拥挤场景的行人检测基准数据集,其图像是从多种场景中选择的,不再局限于交通场景. 选择13382张图像,并用各种遮挡标记约40万个注释. 我们随机选择800 ...

  2. 【数据集】香烟目标检测数据集(YOLO格式标注)

    [来源] https://blog.csdn.net/qq_46098574/article/details/107334954 [链接及提取码](免费下载) 链接:https://pan.baidu ...

  3. [Python]Cityscapes Foggy数据集转yolo格式(目标检测任务)

    数据集下载相关 论文地址 鉴于数据集的版权问题,这个数据集不公开下载,只能通过脚本转换:但是这里可以找到网友已经转化过的数据集. 也可以选择直接从cityscapes转化:SFSU_synthetic ...

  4. 车辆重识别、行人检测数据集、多摄像头数据集

    Time:2022 / 8/ 19 Author:QHL-taki content:Dataset Sharing 前言 ​ 近期博主在做多摄像头行人重识别的任务,查询多方资料,收集到一些重识别相关的 ...

  5. PCB电路板元件目标检测数据集(YOLO标签,1400张,9类目标)

    9类目标, names: ['Cap1', 'Cap2', 'Cap3', 'Cap4', 'MOSFET', 'Mov', 'Resestor', 'Resistor', 'Transformer' ...

  6. 100种目标检测数据集【voc格式yolo格式json格式coco格式】+YOLO系列算法源码及训练好的模型

    提示:本文介绍并分享了应用于各行业.各领域非常有用的目标检测数据集(感谢您的关注+三连,数据集持续更新中-),其中绝大部分数据集作者已应用于各种实际落地项目,数据集整体质量好,标注精确,数据的多样性充 ...

  7. 用python将MSCOCO和Caltech行人检测数据集转化成VOC格式

    代码:转换用的代码放在这里 之前用Tensorflow提供的object detection API可以很方便的进行fine-tuning实现所需的特定物体检测模型(看这里).那么现在的主要问题就是数 ...

  8. BDD100K数据集转YOLO格式

    前言 BDD100K由伯克利大学AI实验室(BAIR)发布,是目前最大规模.内容最具多样性的公开驾驶数据集.BDD100K 数据集包含10万段高清视频,每个视频约40秒,720p,30 fps .每个 ...

  9. 车辆行人检测数据集_澎思科技行人再识别技术取得突破,刷新三大数据集世界记录...

    近日,国内人工智能企业澎思科技(Pensees)在行人再识别(Person Re-identification,简称ReID)算法上取得突破,在三大主流ReID数据集测试Market1501,Duke ...

最新文章

  1. html5 的a标签是可以拨电话的,通过其Href属性来实现
  2. asp.net 检测是否关注公众号_太阳电池缺陷检测方法光致发光检测法
  3. ios4 向 ios5 迁移短信的方式
  4. 杭电多校第三场-H-Game
  5. 开发人员需知的Web缓存知识(转)
  6. 部署DNS服务和管理DNS
  7. CentOS安装和配置FTP
  8. hadoop安装部署(伪分布及集群)
  9. java开发课程表_展示Java开发人员课程包
  10. Eclipse 如何生成项目的javadoc(API 文档)
  11. 《Effective Debugging:软件和系统调试的66个有效方法》一第5条:在能够正常运作的系统与发生故障的系统之间寻找差别...
  12. JLabel鼠标停在上面显示小手图标 点击跳转到相应网页
  13. 水文特点是什么意思_自动气象站应建在什么地方?
  14. ASP.NET生成静态页面的简单实现
  15. [转载] 两种方法分割python多空格字符串
  16. Java设计模式——GoF设计模式
  17. win11安装texlive 2021版本
  18. cisco 路由器时区设置
  19. 如何将图片转换成PCBLogo
  20. C语言:一道随机步法题

热门文章

  1. PHP从数据库中读取数据并打印
  2. org.eclipse.jgit.api.errors.TransportException: https://github.com/aurora-am
  3. 详解支持向量机(Support Vector Machine, SVM)
  4. 体系结构学习笔记---白话理解Tomasulo算法
  5. 戴尔740服务器raid型号,DELL R740服务器创建RAID1和RIAD5
  6. Flash 系列: Nor Nand OneNand
  7. iDSS显示连接服务器失败,印和SMTPS:无法连接(Indy and smtps: cannot connect)
  8. ue4 读取本地文件
  9. 员工管理系统之MYSQL
  10. 将数组转化成URI型字段,类似于URI中的m=indea=demo或m/index/a/demo