本篇博客主要以介绍MS COCO数据集为目标,分为3个部分:COCO介绍,数据集分类和COCO展示。

本人主要下载了其2014年版本的数据,一共有20G左右的图片和500M左右的标签文件。标签文件标记了每个segmentation的像素精确位置+bounding box的精确坐标,其精度均为小数点后两位。一个目标的标签示意如下:

{"segmentation":[[392.87, 275.77, 402.24, 284.2, 382.54, 342.36, 375.99, 356.43, 372.23, 357.37, 372.23, 397.7, 383.48, 419.27,407.87, 439.91, 427.57, 389.25, 447.26, 346.11, 447.26, 328.29, 468.84, 290.77,472.59, 266.38], [429.44,465.23, 453.83, 473.67, 636.73, 474.61, 636.73, 392.07, 571.07, 364.88, 546.69,363.0]], "area": 28458.996150000003, "iscrowd": 0,"image_id": 503837, "bbox": [372.23, 266.38, 264.5,208.23], "category_id": 4, "id": 151109},

下面来介绍一下这个数据集。

COCO简介:

COCO数据集是微软团队获取的一个可以用来图像recognition+segmentation+captioning 数据集,其官方说明网址:http://mscoco.org/。

该数据集主要有的特点如下:(1)Object segmentation(2)Recognition in Context(3)Multiple objects per image(4)More than 300,000 images(5)More than 2 Million instances(6)80 object categories(7)5 captions per image(8)Keypoints on 100,000 people

为了更好的介绍这个数据集,微软在ECCV Workshops里发表这篇文章:Microsoft COCO: Common Objects in Context。从这篇文章中,我们了解了这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,000影像和2,500,000个label。

该数据集主要解决3个问题:目标检测,目标之间的上下文关系,目标的2维上的精确定位。数据集的对比示意图:

数据集分类:

Image Classification:

分类需要二进制的标签来确定目标是否在图像中。早期数据集主要是位于空白背景下的单一目标,如MNIST手写数据库,COIL household objects。在机器学习领域的著名数据集有CIFAR-10 and CIFAR-100,在32*32影像上分别提供10和100类。最近最著名的分类数据集即ImageNet,22,000类,每类500-1000影像。

Object Detection:

经典的情况下通过bounding box确定目标位置,期初主要用于人脸检测与行人检测,数据集如Caltech Pedestrian Dataset包含350,000个bounding box标签。PASCAL VOC数据包括20个目标超过11,000图像,超过27,000目标bounding box。最近还有ImageNet数据下获取的detection数据集,200类,400,000张图像,350,000个bounding box。由于一些目标之间有着强烈的关系而非独立存在,在特定场景下检测某种目标是是否有意义的,因此精确的位置信息比bounding box更加重要。

Semantic scene labeling:

这类问题需要pixel级别的标签,其中个别目标很难定义,如街道和草地。数据集主要包括室内场景和室外场景的,一些数据集包括深度信息。其中,SUN dataset包括908个场景类,3,819个常规目标类(person, chair, car)和语义场景类(wall, sky, floor),每类的数目具有较大的差别(这点COCO数据进行改进,保证每一类数据足够)。

Other vision datasets:

一些数据集如Middlebury datasets,包含立体相对,多视角立体像对和光流;同时还有Berkeley Segmentation Data Set (BSDS500),可以评价segmentation和edge detection算法。

COCO展示:

该数据集标记流程如下:

COCO数据集有91类,虽然比ImageNet和SUN类别少,但是每一类的图像多,这有利于获得更多的每类中位于某种特定场景的能力,对比PASCAL VOC,其有更多类和图像。

COCO数据集分两部分发布,前部分于2014年发布,后部分于2015年,2014年版本:82,783 training, 40,504 validation, and 40,775 testing images,有270k的segmented people和886k的segmented object;2015年版本:165,482 train, 81,208 val, and 81,434 test images。

其性能对比和一些例子:

coco数据集大小分类_Microsoft COCO 数据集相关推荐

  1. coco数据集大小分类_MicroSoft COCO数据集

    安装错误 no such file or directory: 'pycocotools/_mask.c' 解决办法: pip install cython 评价标准 COCO数据集介绍 COCO数据 ...

  2. coco数据集大小分类_【数据集】LVIS:大规模细粒度词汇级标记数据集 ,出自FAIR ,连披萨里的菠萝粒都能完整标注...

    原标题:[数据集]LVIS:大规模细粒度词汇级标记数据集 ,出自FAIR ,连披萨里的菠萝粒都能完整标注 本文转自『AI开发者』 稍有改动 作者 / 杨鲤萍,编译 / 昱良 最近,FAIR 开放了 L ...

  3. coco数据集大小分类_2019-08-15 COCO数据集

    官网:cocodataset.org COCO has five annotation types: for object detection, keypoint detection, stuff s ...

  4. coco数据集大小分类_COCO 数据集使用说明书

    增加对 Windows 系统的支持: 替换 defaultdict 为 dict.get(),解决 Windows 的编码问题. 跳过解压这一步骤(包括直接的或间接的解压),直接对图片数据 image ...

  5. coco数据集大小分类_VOC、COCO数据集类别

    目录 VOC(20类): COCO(全90类): COCO(检测.分割所用80类): VOC(20类): 1aeroplane 2bicycle 3bird 4boat 5bottle 6bus 7c ...

  6. coco数据集大小分类_COCO数据集的标注格式

    COCO的 全称是Common Objects in COntext,是微软团队提供的一个可以用来进行图像识别的数据集.MS COCO数据集中的图像分为训练.验证和测试集.COCO通过在Flickr上 ...

  7. coco数据集大小分类_如何处理不平衡数据集的分类任务

    在情感分类任务中,数据集的标签分布往往是极度不平衡的.以我目前手上的这个二分类任务来说,正例样本14.4万个:负例样本166.1万 = 1 :11.5.很显然这是一个极度不平衡的数据集,假设我把样本全 ...

  8. coco数据集大小分类_COCO数据集使用

    一.简介 官方网站:http://cocodataset.org/ 全称:Microsoft Common Objects in Context (MS COCO) 支持任务:Detection.Ke ...

  9. 数据集大小与模型性能的敏感性分析

    [翻译自 : sensitivity-analysis-of-dataset-size-vs-model-performance] [说明:Jason Brownlee PhD大神的文章个人很喜欢,所 ...

最新文章

  1. C++实现遍历链表一次求出中间的节点
  2. 12月第四周安全回顾:双节期间微软忙补新漏洞,新Hash将测试
  3. 共享卫士完全设置教程图解
  4. 多索引表 (8)表操作
  5. 通过printf设置Linux终端输出的颜色和显示方式
  6. 前端面试1:CSS布局
  7. 【MyBatis框架】SqlMapConfigl配置文件之常用的setting设置
  8. centos下apache不解析php
  9. Java多线程编程核心技术 (pdf完整版)
  10. 按键精灵实现远程获取消息内容自动发送到群里(支持多个qq)
  11. 2021.1.19上海冬令营day2
  12. mysql的版本是什么_mysql版本号是什么意思?
  13. Jquery UI中 Dialog对象的作用及常用属性
  14. linux保存压缩程序输出,Linux压缩zip文件
  15. python全栈开发-基本数据类型2 python_day_5
  16. svg图形计算、矩阵函数计算、图形点位绝对坐标计算
  17. K8S学习之service
  18. 波哥大BRT带来的启示
  19. 如何从信息化、数字化迈向智能工厂?
  20. Android ListView 拖拽处理

热门文章

  1. 红帽linux5.5序列号,Redhat 5 安装序列号及版本说明
  2. java 多层异常_Java多层嵌套异常处理的基本流程
  3. 多个python脚本同时执行_Python实现脚本锁功能(同时只能执行一个脚本)
  4. linux运行搜狗拼音,Linux 搜狗输入法的安装(Ubuntu版)
  5. php mvc教程 文档,PHP培训教程教你快速打造PHP MVC框架[PHP基础教程]
  6. win7系统如何共享硬盘分区
  7. 搜狗浏览器怎么实现图标旋转 搜狗浏览器实现图标旋转的方法
  8. vue-router详尽:编程式导航、路由重定向、动态路由匹配、路由别名、嵌套路由、命名视图
  9. php如何将mysql数据库中的admin字段赋值给session_转php中使用session_set_save_handler()函数把session保存到MySQL数据库实例...
  10. emd实现信息隐藏_EMD算法原理与实现