camvid数据集介绍_深度学习图像数据集介绍(MSCOCO)
深度学习图像数据集介绍(MSCOCO)
MSCOCO数据集是微软开发维护的大型图像数据集,次数聚集的任务包括识别(recognition),分割(segementation),及检测(detection)。 该数据集的官方网址为:
http://cocodataset.org/
该数据集合的主要特点:
1)目标分割
2)基于文本识别
3)每张图多目标
4)超过30万图
5)超过2百万实例
6)80种类别
7)平均每张图5个目标
8)对于十万个人有关键点
COCO API提供了Matlab,Python和lua的API接口,该接口可以提供完整的图像标签数据的加载,parsing和可视化。此外还有原始论文及相关实验论,教程等。在使用coco数据库提供的API和demo前要先下载coco的图像和label数据(类别、类别数量、像素级的分割等):
图像下载到本地coco/images/ 文件夹下(为了后面改代码的路经方便)
labels下载到coco/annotations/ 文件夹下
数据集分析
图像分类: 分类基于标注好的标签,将大量数据进行训练,提取出每种图像的关键特征后进行识别。
目标检测:经过关键点构建目标位置,进行位置标注,训练这些标注标签后进行检测。
基于语义的场景标记: 此类的标签制作过程中需要分析多方面的内容,做成像素级别的标签。 在这个数据集中同时包含了室内和室外的场景数据集。
MSCOCO数据示例
COCO数据集分两部分发布,第一次于2014年发布,82783个训练样本,40504验证样本以及40775的测试样本,另外有27万的分割人像图和88.6万的分割物体图。2015年的版本中哦你哦个包括165482的训练样本,81208验证样本和82434测试样本。
我开始在官网上下载没有成功,后来知道了一种方法,可以输入以下命令进行下载/
1、安装aria2
sudo apt-get install aria2
2、依次输入下面三个命令
aria2c -c http://msvocds.blob.core.windows.net/annotations-1-0-3/instances_train-val2014.zip
aria2c -c http://msvocds.blob.core.windows.net/coco2014/train2014.zip
aria2c -c http://msvocds.blob.core.windows.net/coco2014/val2014.zip
根据文件的后缀应该能分得出来,annotation是标签,train2014是训练集,val2014是验证集。我这点玩意下载了一周,失败了几次才完全下载下下来。如果在下载中途中断了,重新输入命令即可。
以上链接可以下载的是2014版本的数据。
annotation里是json文件,打开后可以看到标注的内容。
用 LibreOffice Writer可以打开
这个图里可以看到一大堆的属性标签。
Jason保存的是一堆信息,相当于一个字典。
info指向一些基本信息: 包括时间,版本,贡献者,网址链接等。
image指向列表,内容是图像信息,列表中的每一个字典下存储一张图像信息:licese、coco_url、data_capture、flickr_url等。
重要的key:
file_name,指向字符串,是图像的名字;
height和width指向的该图像的高和宽;
id指向的是图像特有的label,数字不重复,可以看做是图像的本身信息。好像身份证上的数字一样
annotation指向一个list,包含多个字典,每个字典中包含一个物体分割的信息。第一个segmentation中指向两串数字矩阵,含义是像素级分割得到的物体边缘坐标。坐标成对出现;后面area是segmentation的面积;iscrowded是重叠信息; bbox是物体的label框;category_id指向的数字代表类别;最后的id是每个框的身份编号; 最后的categories这个key是指向每个类别的名称和编号。
coco与其他数据集的比较
coco数据集中一些标注图像的示例
camvid数据集介绍_深度学习图像数据集介绍(MSCOCO)相关推荐
- 快速构建深度学习图像数据集,微软Bing和Google哪个更好用?
译者 | Serene 编辑 | 明明 出品 | AI 科技大本营(公众号ID:rgznai100) [AI 科技大本营导读]在本文中,作者将利用微软的 Bing Image Search API 来 ...
- 99数据集预处理_深度学习在放射治疗的应用—工具篇(五)数据集构建
家园宗旨:诚邀八方志同道合之友,共谋一隅传道受业之善! 作者简介: 本期我们将继续介绍Matlab中的数据集系列函数.上期中我们介绍了imageDatastore数据集函数,该函数能够实现深度学习所需 ...
- 深度学习数据集制作_深度学习时代的数据驱动建模之探讨
数据驱动三维建模的方法分类 从方法学角度来看,数据驱动的三维建模大致可分为两类:参数方法(parametric methods)和非参数方法(non-parametric methods). 参数方法 ...
- 深度学习常用数据集资源(计算机视觉领域)
目录 1.MNIST 2.ImageNet 4.COCO 5.PASCAL VOC 6.FDDB 1.MNIST 深度学习领域的入门数据集,当前主流的深度学习框架几乎都将MNIST数据集的处理入门第一 ...
- 【每周CV论文】深度学习图像降噪应该从阅读哪些文章开始
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像降噪是图像处理领域中非常传统和经典的问题 ...
- 深度学习图像超分辨率最新综述:从模型到应用
点击我爱计算机视觉标星,更快获取CVML新技术 今日arXiv新上论文<Deep Learning for Image Super-resolution:A Survey>,详细回顾了近年 ...
- 深度学习常用数据集介绍
数据集大全 数据集大全 介绍 目前接触到的数据集 1. [MNIST](http://yann.lecun.com/exdb/mnist/) 2. [CIFAR-10 / CIFAR-100](htt ...
- 深度学习 大数据集处理_大规模深度学习数据集管理系统
深度学习 大数据集处理 Machine learning is data-driven. Most artificial intelligence (AI) practitioners would a ...
- 资源 | 25个深度学习开源数据集,have fun !
作者:PRANAV DAR 翻译:Nicola 校对:冯羽 本文共4000字,建议阅读8分钟. 本文介绍了图像处理,自然语言处理,以及音频/语音处理三类25个开源数据集. 简介 深度学习(或生活中的大 ...
最新文章
- Ant Design of React从入门到开发教程
- mysql enum mybatis_Mybatis 枚举类处理
- 人工智能写散文之错位时空
- 非递归遍历求二叉排序树的深度
- 史上最全总结!Util、POJO、domain、entity、model、DAO、DTO、view、mapper、service、controller的作用和区别分析
- oracle静默安装集群,静默安装Oracle数据库10g篇
- 【RS码1】系统RS码编码原理及MATLAB实现(不使用MATLAB库函数)
- 使用OpenCV可视化Intel Realsensen D435 深度图为彩色图
- .NET/C# 使用Stopwatch测量运行时间
- springboot-属性提示
- CPU 架构 —— ARM 架构
- R语言并行计算的原理和案例
- 10慕课网《进击Node.js基础(一)》初识promise
- iOS AVPlayer支持播放的格式
- 恒生UFX交易接口基本介绍说明
- 实现memcmp函数
- 提高工作效率必备的生产力工具
- Blender Benchmark测试
- Lambda表达式到底是什么?——简单了解Lambda表达式
- MySQL 设计与开发规范
热门文章
- NGINX限流的一些思考
- CodeReview学习与总结
- TP查看已部署的TP框架的版本
- cad2014卡顿的解决方法_升级iOS14.1后出现卡顿、闪退?这3种方法可以解决
- python 30分钟_一张图30分钟快速Python入门
- 法语语言考试C1,法语考试大比拼:专八与Dalf C1,哪个更难?
- crf java实现_Tensorflow实现crf损失
- m3u8链接地址_FFmpeg下载m3u8视频
- 【若依(ruoyi)】自定义的数据选择对话框
- python众数问题给定含有n个元素的多重集合s_2-1 问题描述:给定含有n个元素的多重集合S - 下载 - 搜珍网...