文章目录:

  • 1 问题场景
  • 2 使用labelImg查看COCO2017数据会出现很多目标被标注为一个框bbox
  • 3 相关探讨

1 问题场景

由于COCO2017数据集具有:

  • 类别多样性,有80个类别
  • 数据集场景丰富
  • 数据集标注多样性,例如,在COCO2017的person类,只要出现人,无论是出现整个人,还是只出现人的脸、或只出现人的腿、或只出现人的一只脚都标注为person类

我的目的是从COCO2017数据集中提取包含指定类别的类,例如我只想提取包含person类别,其他标注的类别都不要,如下是我从COCO2017数据集中提取包含person的类别,包含person类别的数据集大概有6W多张图片

(base) shl@zhihui-mint:~/shl_res/3_data$ tree COCO2017_person/images/
COCO2017_person/images/
├── 000000000036.jpg
├── 000000000049.jpg
├── 000000000061.jpg
├── 000000000074.jpg
├── 000000000077.jpg
├── 000000000086.jpg
......├── 000000581886.jpg
├── 000000581887.jpg
├── 000000581899.jpg
├── 000000581900.jpg
├── 000000581904.jpg
└── 000000581921.jpg0 directories, 64113 files
(base) shl@zhihui-mint:~/shl_res/3_data$

2 使用labelImg查看COCO2017数据会出现很多目标被标注为一个框bbox

在使用labelImg查看COCO2017数据会出现很多目标被标注为一个框bbox,如下图,他会把一群人标注为一个大的bbox

我以为是我代码转化的有问题,但是我查看了标注的person框都是没有问题的,只有当人群特别密集的时候,才会出现把所有的人群标注一个大的bbox,因此我确定我转化的代码应该是没有问题的。我不太明白COCO数据集这么标注的意义,我个人理解这种标注可能会造成误检,但是我也没有实际测试过,欢迎大家讨论,或者你明白COCO数据集这么标注的原因,告知我,谢谢!

3 相关探讨

我在知乎上看到一个相关的回答,他们的讨论认为:

  • 密集的人群目标比较多,也比较小,如果图片像素也比较小,标注起来就很困难
  • 检测也比较困难,在检测的时候小目标本身特征就很少,检测就很困难,因此干脆就把人群检测为person,这样也能勉强接受吧!

欢迎大家继续探讨,留言

欢迎大家关注笔者,你的关注是我持续更博的最大动力

原创文章,转载告知,盗版必究
微信:suihailiang0816 QQ:931762054 wx公众号:仰望星空的小随

探讨:COCO2017数据集中包含很多目标被标注为一个框bbox,是标注错误吗?相关推荐

  1. 最优控制电池储能模型 蓄电池储能模型的最优控制python源代码 包含五个python脚本,它从data .csv读取价格、负载和温度数据。 然后用本文中描述的决策变量、目标和约束构造一个pyomo抽

    最优控制电池储能模型 蓄电池储能模型的最优控制python源代码,代码按照高水平文章复现 包含五个python脚本,它从data .csv读取价格.负载和温度数据. 然后用本文中描述的决策变量.目标和 ...

  2. 光明日报:探讨大数据时代的依法治理之道

    编  者  按 bianzhean 大数据是万物及万物"普遍联系"的全景式记录,被称为"信息时代的石油".当前,我国正在大力推动实施国家大数据战略,加快建设数字 ...

  3. 「实战教程」如何使用POI读取模板PPT填充数据并拼接至目标文件

    文章目录 一.PPT文件格式介绍 1.PPT文件格式的概述 2.HSLF和XSLF的区别 3.如何选择合适的POI类库 二.SlideShow 三.读取PPT文件 1. 加载PPT文件 2. 获取PP ...

  4. maskrcnn用于目标检测_用自己的数据训练Mask R-CNN目标检测/分割模型

    摘要: 本文讲述了如何使用Mask-CNN对图像中的大量数据进行目标识别与目标分割. 计算机非常擅长数字运算,但对分析图像中的大量数据束手无策.直到最近找到了解决方法,即创建图像处理单元库,利用数千个 ...

  5. 【图普科技】边界框的数据增强:对目标检测图像变换的再思考(一)

    [本文由图普科技编译] 当谈到深度学习任务的表现时,毋庸置疑,数据越多越好.然而,我们拥有的数据可能是有限的.数据增强是通过人为扩充数据集来解决数据短缺问题的一种方法.实际上,该技术已被证明非常成功, ...

  6. 值得收藏!基于激光雷达数据的深度学习目标检测方法大合集(上)

    作者 | 黄浴 转载自知乎专栏自动驾驶的挑战和发展 [导读]上周,我们在激光雷达,马斯克看不上,却又无可替代?>一文中对自动驾驶中广泛使用的激光雷达进行了简单的科普,今天,这篇文章将各大公司和机 ...

  7. .val()数据乱码_【目标检测数据集】PASCAL VOC制作

    [VOC2007+2012] 数据集地址:https://pjreddie.com/projects/pascal-voc-dataset-mirror/ PASCAL VOC为图像识别和分类提供了一 ...

  8. ajax异步获取右侧html,Ajax异步获取html数据中包含js方法无效的解决方法

    Ajax异步获取html数据中包含js方法无效的解决方法 页面上使用js写了一个获取后台数据的方法 function data() { var tab = $("#dic") $. ...

  9. 深入探讨大数据权限管理方案-从哲学到技术

    大数据平台的权限管理工作,听起来不就是用户和密码管理这点事么?找个数据库存储一下两者的映射关系,然后再找个地方记录一下每个人可以做什么事,最后在需要的时候验证一下就好了,如果不讨论各种加解密原理和算法 ...

最新文章

  1. 西门子s7-400闭环控制模块_西门子6ES7312-1AE14-0AB0
  2. 对Reformer的深入解读
  3. python脚本实例手机端-终于晓得python入门脚本实例
  4. 挺好用的SQLSERVER数据库自动备份工具SQLBackupAndFTP(功能全面)
  5. NTU课程笔记 :CV6422(4) sampling process
  6. 从蛋白质结构到功能的生物信息学研究 From Protein Structure to Function with Bioinformatics PDF
  7. python网络编程——实现简单聊天
  8. 微软 MVP 福利大赏
  9. 排名前100的PHP函数及分析
  10. Android自定义View【实战教程】4⃣️----BitmapShader详解及圆形、圆角、多边形实现
  11. 《Excel图表之道》——书和人
  12. 三级网络技术无纸化模拟软件 (未来)教育
  13. 遗传算法基本原理及在互联网中的应用
  14. java 图片去水印_如何用java去除图片水印?
  15. HDU 6438 Buy and Resell 【贪心+思维+优先队列】
  16. aspectj tomcat load-time waver
  17. 14 款命令行常用工具的替代品
  18. 常见的噪声:高斯、泊松和椒盐噪声
  19. 洛谷P3964松鼠聚会
  20. HDU 5445 Food Problem 多重背包+二进制优化

热门文章

  1. iOS开发拓展篇——如何把项目托管到GitHub
  2. win10系统修改Intel VT-x时进入不了BIOS问题
  3. Java 类的一些高级特征
  4. 机器学习笔记(二)逻辑回归和正则化
  5. docker 删除默认连接_Net Core 中 Docker应用
  6. python经典好书-有哪些 Python 经典书籍?
  7. arcgis engine二次开发python-使用C#配合ArcGIS Engine进行地理信息系统开发
  8. python个人项目-Python个人练习项目 2-1
  9. 怎么用python处理excel文件-Python自动化如何处理excel文件数据
  10. 想学python编程-想学Python编程?你真的适合吗?