深度学习图像数据集介绍(MSCOCO)

MSCOCO数据集是微软开发维护的大型图像数据集,次数聚集的任务包括识别(recognition),分割(segementation),及检测(detection)。 该数据集的官方网址为:

http://cocodataset.org/

该数据集合的主要特点:

1)目标分割

2)基于文本识别

3)每张图多目标

4)超过30万图

5)超过2百万实例

6)80种类别

7)平均每张图5个目标

8)对于十万个人有关键点

COCO API提供了Matlab,Python和lua的API接口,该接口可以提供完整的图像标签数据的加载,parsing和可视化。此外还有原始论文及相关实验论,教程等。在使用coco数据库提供的API和demo前要先下载coco的图像和label数据(类别、类别数量、像素级的分割等):

图像下载到本地coco/images/ 文件夹下(为了后面改代码的路经方便)

labels下载到coco/annotations/ 文件夹下

数据集分析

图像分类: 分类基于标注好的标签,将大量数据进行训练,提取出每种图像的关键特征后进行识别。

目标检测:经过关键点构建目标位置,进行位置标注,训练这些标注标签后进行检测。

基于语义的场景标记: 此类的标签制作过程中需要分析多方面的内容,做成像素级别的标签。 在这个数据集中同时包含了室内和室外的场景数据集。

MSCOCO数据示例

COCO数据集分两部分发布,第一次于2014年发布,82783个训练样本,40504验证样本以及40775的测试样本,另外有27万的分割人像图和88.6万的分割物体图。2015年的版本中哦你哦个包括165482的训练样本,81208验证样本和82434测试样本。

我开始在官网上下载没有成功,后来知道了一种方法,可以输入以下命令进行下载/

1、安装aria2

sudo apt-get install aria2

2、依次输入下面三个命令

aria2c -c http://msvocds.blob.core.windows.net/annotations-1-0-3/instances_train-val2014.zip

aria2c -c http://msvocds.blob.core.windows.net/coco2014/train2014.zip

aria2c -c http://msvocds.blob.core.windows.net/coco2014/val2014.zip

根据文件的后缀应该能分得出来,annotation是标签,train2014是训练集,val2014是验证集。我这点玩意下载了一周,失败了几次才完全下载下下来。如果在下载中途中断了,重新输入命令即可。

以上链接可以下载的是2014版本的数据。

annotation里是json文件,打开后可以看到标注的内容。

用 LibreOffice Writer可以打开

这个图里可以看到一大堆的属性标签。

Jason保存的是一堆信息,相当于一个字典。

info指向一些基本信息: 包括时间,版本,贡献者,网址链接等。

image指向列表,内容是图像信息,列表中的每一个字典下存储一张图像信息:licese、coco_url、data_capture、flickr_url等。

重要的key:

file_name,指向字符串,是图像的名字;

height和width指向的该图像的高和宽;

id指向的是图像特有的label,数字不重复,可以看做是图像的本身信息。好像身份证上的数字一样

annotation指向一个list,包含多个字典,每个字典中包含一个物体分割的信息。第一个segmentation中指向两串数字矩阵,含义是像素级分割得到的物体边缘坐标。坐标成对出现;后面area是segmentation的面积;iscrowded是重叠信息; bbox是物体的label框;category_id指向的数字代表类别;最后的id是每个框的身份编号; 最后的categories这个key是指向每个类别的名称和编号。

coco与其他数据集的比较

coco数据集中一些标注图像的示例

camvid数据集介绍_深度学习图像数据集介绍(MSCOCO)相关推荐

  1. 快速构建深度学习图像数据集,微软Bing和Google哪个更好用?

    译者 | Serene 编辑 | 明明 出品 | AI 科技大本营(公众号ID:rgznai100) [AI 科技大本营导读]在本文中,作者将利用微软的 Bing Image Search API 来 ...

  2. 99数据集预处理_深度学习在放射治疗的应用—工具篇(五)数据集构建

    家园宗旨:诚邀八方志同道合之友,共谋一隅传道受业之善! 作者简介: 本期我们将继续介绍Matlab中的数据集系列函数.上期中我们介绍了imageDatastore数据集函数,该函数能够实现深度学习所需 ...

  3. 深度学习数据集制作_深度学习时代的数据驱动建模之探讨

    数据驱动三维建模的方法分类 从方法学角度来看,数据驱动的三维建模大致可分为两类:参数方法(parametric methods)和非参数方法(non-parametric methods). 参数方法 ...

  4. 深度学习常用数据集资源(计算机视觉领域)

    目录 1.MNIST 2.ImageNet 4.COCO 5.PASCAL VOC 6.FDDB 1.MNIST 深度学习领域的入门数据集,当前主流的深度学习框架几乎都将MNIST数据集的处理入门第一 ...

  5. 【每周CV论文】深度学习图像降噪应该从阅读哪些文章开始

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像降噪是图像处理领域中非常传统和经典的问题 ...

  6. 深度学习图像超分辨率最新综述:从模型到应用

    点击我爱计算机视觉标星,更快获取CVML新技术 今日arXiv新上论文<Deep Learning for Image Super-resolution:A Survey>,详细回顾了近年 ...

  7. 深度学习常用数据集介绍

    数据集大全 数据集大全 介绍 目前接触到的数据集 1. [MNIST](http://yann.lecun.com/exdb/mnist/) 2. [CIFAR-10 / CIFAR-100](htt ...

  8. 深度学习 大数据集处理_大规模深度学习数据集管理系统

    深度学习 大数据集处理 Machine learning is data-driven. Most artificial intelligence (AI) practitioners would a ...

  9. 资源 | 25个深度学习开源数据集,have fun !

    作者:PRANAV DAR 翻译:Nicola 校对:冯羽 本文共4000字,建议阅读8分钟. 本文介绍了图像处理,自然语言处理,以及音频/语音处理三类25个开源数据集. 简介 深度学习(或生活中的大 ...

最新文章

  1. Ant Design of React从入门到开发教程
  2. mysql enum mybatis_Mybatis 枚举类处理
  3. 人工智能写散文之错位时空
  4. 非递归遍历求二叉排序树的深度
  5. 史上最全总结!Util、POJO、domain、entity、model、DAO、DTO、view、mapper、service、controller的作用和区别分析
  6. oracle静默安装集群,静默安装Oracle数据库10g篇
  7. 【RS码1】系统RS码编码原理及MATLAB实现(不使用MATLAB库函数)
  8. 使用OpenCV可视化Intel Realsensen D435 深度图为彩色图
  9. .NET/C# 使用Stopwatch测量运行时间
  10. springboot-属性提示
  11. CPU 架构 —— ARM 架构
  12. R语言并行计算的原理和案例
  13. 10慕课网《进击Node.js基础(一)》初识promise
  14. iOS AVPlayer支持播放的格式
  15. 恒生UFX交易接口基本介绍说明
  16. 实现memcmp函数
  17. 提高工作效率必备的生产力工具
  18. Blender Benchmark测试
  19. Lambda表达式到底是什么?——简单了解Lambda表达式
  20. MySQL 设计与开发规范

热门文章

  1. NGINX限流的一些思考
  2. CodeReview学习与总结
  3. TP查看已部署的TP框架的版本
  4. cad2014卡顿的解决方法_升级iOS14.1后出现卡顿、闪退?这3种方法可以解决
  5. python 30分钟_一张图30分钟快速Python入门
  6. 法语语言考试C1,法语考试大比拼:专八与Dalf C1,哪个更难?
  7. crf java实现_Tensorflow实现crf损失
  8. m3u8链接地址_FFmpeg下载m3u8视频
  9. 【若依(ruoyi)】自定义的数据选择对话框
  10. python众数问题给定含有n个元素的多重集合s_2-1 问题描述:给定含有n个元素的多重集合S - 下载 - 搜珍网...