图像数据集:

1.MNIST

MNIST数据集官网
入门级的数据集,相信很多学习AI的人使用的第一个数据集就是MNIST。
NIST的全称是National Institute of Standards and Technology Special Database 19(美国标准与数据研究院),即 NIST Handprinted Forms and Characters Database, MNIST是其子集,即 miniNIST,其仅仅包含10个阿拉伯数字(即十类对象),每类对象含6000张训练图片,1000张测试图片,因此训练集共有60000张图片,测试集10000张图片。图片的大小为28x28的灰度图片(官网上说原始的图片是20x20的,但是图片中心化后放到了28x28的方格里)。
网站详细介绍了MNIST数据集的来源和数据格式,直接下载使用时需要根据官网给出的数据格式来进行预处理。
如果觉得MNIST的数据过于简单,想尝试更复杂的模型,可以使用NIST数据集,NIST的数据集有5中数据组织方式
hsf_page:包含了未经处理的整页的手写笔记
By write: 根据手写人来组织数据(可以用于笔迹辨认)
By field: 根据图片大类类组织,大类有:数字(digits),upper(大写),lower(小写),const(包括upper和lower)
By class:根据图片小类来组织,包括‘0-9’,‘a-z’,'A-Z’共62类。
By merge:由于一些数字大小写很难分辨,包括:C I J K L M O P S X Y Z U V W,因此将这些数字的大小写合并,最后得到47个类
NIST下载链接

2.CIFAR

CIFAR下载链接
分为CIFAR-10和CIFAR-100 是Alex Krizhevsky(就是AlexNet的发明者)等人创建的80 Million Tiny Images数据集的子集,=分别包含10类和100类对象。
CIFAR-10中每类对象都有6000张32x32的彩色图片组成,其中5000张作为训练集,1000张作为测试集。
CIFAR-10的对象包括: airplane, automobile, bird, cat, deer, dog, flog, horse, ship, truck
而CIFAR-100每类对象仅有600张图片,训练集和测试集总量同样是50000和10000.与CIFAR-10不同的是,CIFAR-100的对象被分为20种超类,因此每张图片都有两个标签,“粗糙”标签对应其超类,“精细”标签对应其精确类型,例如一张鲸鱼的图片有“水生哺乳动物”和“鲸鱼”两个标签。
官网中给出了3种类型的数据集,分别适用于Python, Matlab和C(二进制文件)。

3.Caltech

Caltech-101下载链接
Caltech-256下载链接
Caltech-101和Caltech-256是加州理工大学的图像数据集,官网中给的描述不是很详细,总的来说,前者有101类目标,后者有256类目标,每类目标的样本数从40-800不等。官网没有明确地划分出训练集和测试集,只给出了建议用于训练/测试地图片标号。官网还给出了一些基于该数据集的论文和结果,有兴趣可以自行查看。
数据集比较老,用的人也比较少。

4.PASCAL

PASCAL 数据集下载地址
PASCAL 是 Pattern Analysis, Statistic Modeling and Computational Learning的缩写,因PASCAL VOC(Visual Cbject Classes Challenge)出名,该竞赛从2005年开始举办,每年一届,直到2012年结束。任务包括分类,检测和分割。
以PASCAL VOC2012为例,其训练集包括11530张图片,其中含有27450个ROI和6929个分割区域,包含20种物体。

5.ImageNet

ImageNet官网地址
ImageNet是目前世界上最大的标注图片数据库。收录了20000多类目标超过1400万的彩色图片。这些图片都经过人工标注并进行了质量管控,其目标是为每一类目标提供1000张以上的标注图片。
看过深度学习论文的人应该都知道,大名鼎鼎的ILSVRC(ImageNet Large Scale Visual Recognition Challenge)采用的数据集就是ImageNet的子集。ImageNet上给出了历届ILSVRC(2010-2017)所用的数据集供人下载(不过好像已经失效了)。

ImageNet是一个用于大规模多分类(1000+类)任务的数据集。往年主流的网络如AlexNet, VGGNet, ResNet,GoogLeNet等都在ILSVRC上以其卓越的性能进入人们的眼球。SENet已经将ImageNet 子集的top-5分类错误率降低至了2.25%以下,但top-1错误率一直在20%附近徘徊。
ILSVRC竞赛包括图片分类/目标定位,目标检测,视频目标检测,场景分类。

6. MS COCO

MS COCO数据集官网
ILSVRC停办以后,MS COCO(Microsoft Common Objects in COntext)就成了CV领域最权威的竞赛。而COCO是微软2014年出资标注的数据集。COCO数据集含有20万张图片,涵盖80个类别共50多万的标注目标,平均每张图片含有7.2个目标,因此广泛地用于图像分割和目标检测。
微软在2014和2017年分别发布了两个版本的COCO数据集

7.Open Image Dataset

Open Image Dataset官网
Google的公开图像数据集,与此并行的是Google举办的Open Image Chanllenge挑战赛。
Open Image Dataset 共有5个版本,在官网上都可以找到。其中最新的Open Image V5 含有超过900w张认为标注图片(图片级标注/目标检测框/语义分割模板)。其中有190w张图片进行了目标检测标注,共含有600种物体超过1600w个检测框,是当前最大的目标检测数据集。
除此之外,Open Image Dataset 还对39w+图片进行了视觉关系(Visual Relationship)的标注,

常用CV数据集(持续更新中)相关推荐

  1. svn拉取文件合并_svn常用命令——-自用——-持续更新中 | 学步园

    ============================================================ 博文原创,转载请声明出处 电子咖啡(原id蓝岩) ============== ...

  2. linux技术笔记(常用命令)持续更新中。。。

    文章目录 1.Linux 下解压 .zip 和 .rar 文件 2. [Mac 终端命令大全](https://www.jianshu.com/p/3291de46f3ff) 3.Maven环境 本地 ...

  3. 你值得掌握的 Git分支等 常用命令 (持续更新中)

    https://blog.csdn.net/hanhanwanghaha宝藏女孩 欢迎您的关注! 欢迎关注微信公众号:宝藏女孩的成长日记 如有转载,请注明出处(如不注明,盗者必究) Git分支 一.本 ...

  4. linux 常用命令,持续更新中~

    文章目录 文件操作相关 ls -- list pwd -- print working directory cd --change directory mkdir -- make directorie ...

  5. 高通平台学习----常用缩写(持续更新中)

    缩写一英文首字符顺序排列 A APQ application processor qualcomn,高通应用处理器,实际就是没基带的soc ASM Ant_Switch Module 天线开关模块 B ...

  6. AWK文本分析工具-常用场景(持续更新中)

    AWK help document:http://www.gnu.org/software/gawk/manual/gawk.html 问题 awk命令 备注 对请求IP统计分组排序?     显示列 ...

  7. 快来看JS的的几个常用算法(持续更新中)

    数组去重 // 第一种方法let arr = [1,1,2,3,4];function fun(v) {return Array.from(new Set(v))}console.log(fun(ar ...

  8. idea中刷新项目快捷键_IntelliJ Idea中常用快捷键(持续更新中)

    alt+insert-----------创建包.类.文件等(本人笔记本电脑组合键为:fn+alt+insert) alt+enter------------导入包,补全内容,修改类名等 Ctrl+i ...

  9. 【FTP】FTP常用命令,持续更新中……

    登录 ftp [IP]↩ 用户名↩ 密码↩ 查看ftp下的文件列表 ls↩ 进入ftp下的文件夹 cd [文件夹名]↩ 上传文件 put [将要上传的文件路径(含后缀)] [上传后的文件名(含后缀)] ...

  10. SAP HR 常用函数*持续更新中...

    1.1   DAY_ATTRIBUTES_GET                      获取两个日期间的每一天的属性值 1.2   FIMA_DAYS_AND_MONTHS_AND_YEARS   ...

最新文章

  1. MySQL Profiling 的使用
  2. 监控系统 Prometheus 和 Zabbix 对比
  3. linux drupal 7安装教程,Linux下面Drupal 7.10的安装
  4. ubuntu deepin python/python3安装pip/pip3
  5. k8s如何设置虚拟内存_绝地求生内存优化设置教程(建议收藏)
  6. Java线程start()vs run()方法及示例
  7. 飞鸽传书绿色版 部分数据库被陆续公开了
  8. python优雅编程_Python——traceback的优雅处理
  9. 云计算学习笔记:基于阿里云ECS服务器搭建云上博客WordPress教程(详细图文版)
  10. 【渝粤题库】陕西师范大学180213《消费经济学》作业 (高起本)
  11. hdu2147PN图的画法
  12. 共享文件 麒麟系统_麒麟操作系统安装手册.doc
  13. Presto查询出现error executing query异常
  14. 整数dct matlab,关于离散余弦变换(DCT)
  15. 转:System32与SysWOW64的关系
  16. 关于HTML图片如何设置热区
  17. 百度云主机(配置、调试环境)文件上传(快速建站,实现首页访问) - FTP篇
  18. vue-baidu-map百度地图搜索功能,点击进行标点,获取经纬度坐标,百度地图使用黑色主题
  19. Stokes theorem
  20. 入行3D建模有什么职业可以选择?自学能学会3dsmax吗?

热门文章

  1. Linux搭建lnmp、nginx、mysql
  2. UOS系统龙芯架构deb安装包打包实践
  3. Android快速开发框架之xUtils---图片模块
  4. 【转载】入坑KeePass(七)Keepass 2.x 之 同步与触发器
  5. RV1126笔记一:环境搭建及SDK编译
  6. 计算机机房标准pdf,计算机机房建设标准(范文).pdf
  7. armbian 斐讯n1_记录一下斐讯N1盒子刷Armbian的各种坑
  8. python二手房使用教程_利用Python对链家网北京二手房进行简单数据分析
  9. 百度绿萝2.0上线后,新站该如何做SEO?
  10. ffmpeg h265