转自:http://blog.csdn.net/myarrow/article/details/51828681

1. CIFAR-10 & CIFAR-100

CIFAR-10包含10个类别,50,000个训练图像,彩色图像大小:32x32,10,000个测试图像。

(类别:airplane,automobile, bird, cat, deer, dog, frog, horse, ship, truck)

(作者:Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton)

(数据格式:Python版本、Matlab版本、二进制版本<for C程序>)

CIFAR-100与CIFAR-10类似,包含100个类,每类有600张图片,其中500张用于训练,100张用于测试;这100个类分组成20个超类。每个图像有一个"find" label和一个"coarse"label。

2. 图像分类结果及对应的论文

图像分类结果及应的论文,包含数据集:MNIST、CIFAR-10、CIFAR-100、STL-10、SVHN、ILSVRC2012 task 1

ILSVRC: ImageNet Large Scale Visual Recognition Challenge

3. ImageNet

ImageNet相关信息如下:

1)Total number of non-empty synsets: 21841
    2)Total number of images: 14,197,122
    3)Number of images with bounding box annotations: 1,034,908
    4)Number of synsets with SIFT features: 1000
    5)Number of images with SIFT features: 1.2 million

4. COCO

COCO(Common Objects in Context)是一个新的图像识别、分割、和字幕数据集,它有如下特点:

1)Object segmentation

2)Recognition in Context
    3)Multiple objects per image
    4)More than 300,000 images
    5)More than 2 Million instances
    6)80 object categories
    7)5 captions per image
    8)Keypoints on 100,000 people

COCO 2016 Detection Challenge(2016.6.1-2016.9.9)和COCO 2016 Keypoint Challenge(2016.6.1-2016.9.9)已经由Microsoft发起 由ECCV 2016(ECCV:European Conference On Computer Vision )。

4. 3D数据

1)RGB-D People Dataset

2)NYU Hand Pose Dataset code

3)Human3.6M (3D Human Pose Dataset)

- 《Iterated Second-Order Label Sensitive Pooling for 3D Human Pose Estimation》

5. 人脸Dataset

1)LFW (Labeled Faces in the Wild)

6. Stereo Datasets

2)Middlebury Stereo Datasets

3)KITTI Vision Benchmark Suite

7. 普林斯顿大学人工智能自动驾驶汽车项目

1)Deep Drive

2)Source Code and Data

特别地:各领域公开的数据集

https://zhuanlan.zhihu.com/p/25138563

点击打开链接

一些机器学习数据集(Dataset)相关推荐

  1. 机器学习数据集(Dataset)汇总

    1. CIFAR-10 & CIFAR-100 CIFAR-10包含10个类别,50,000个训练图像,彩色图像大小:32x32,10,000个测试图像. (类别:airplane,autom ...

  2. 如何打造高质量的机器学习数据集?这份超详指南不可错过

    作者 | 周岩,夕小瑶,霍华德,留德华叫兽 转载自知乎博主『运筹OR帷幄』 导读:随着计算机行业的发展,人工智能和数据科学近几年成为了学术和工业界关注的热点.特别是这些年人工智能的发展日新月异,每天都 ...

  3. 秘籍 | 机器学习数据集网址大全

    作者 | Will Badr 译者 | Linstancy 整理 | Jane 出品 | AI科技大本营(ID:rgznai100) 要找到一定特定的数据集可以解决各种机器学习问题,是一件很难的事情. ...

  4. 收藏 | 机器学习数据集汇总收集

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 仅作分享,不代表本公众号立场,侵权联系删除 转载于:机器学习算法与 ...

  5. 各领域机器学习数据集汇总

    大学公开数据集 (Stanford)69G大规模无人机(校园)图像数据集[Stanford] http://cvgl.stanford.edu/projects/uav_data/ 人脸素描数据集[C ...

  6. 【收藏】机器学习数据集列表:你需要收藏!

    ↑ 点击上方[计算机视觉联盟]关注我们 来源:Medium 编辑:三石 来自新智元 下面的ML大型数据集,总有一款适合你. 就目前来看,找到一个特定的数据集来解决各种机器学习问题,甚至进行实验还是比较 ...

  7. 8种寻找机器学习数据集的方法 | 附数据集资源

    乾明 发自 凹非寺 量子位 出品 | 公众号 QbitAI 在训练机器学习模型时,找到合适的数据集一直是个棘手的问题. 近日,亚马逊AWS高级技术顾问Will Badr介绍了8种寻找机器学习数据集的方 ...

  8. 力荐50个最实用的免费机器学习数据集

    首先,在搜索数据集时要记住这几点: 数据集不应该是混乱的,因为你不希望花费大量时间来清理数据. 数据集不应包含太多行或列,要很容易使用. 数据越干净越好,因为清理大型数据集可能非常耗时. 这个数据集应 ...

  9. 如何准备机器学习数据集_机器学习演练第一部分:准备数据

    如何准备机器学习数据集 Cleaning and preparing data is a critical first step in any machine learning project. In ...

最新文章

  1. Sequelize框架
  2. Ubuntu循环登录
  3. 今天开始复习toefl,mark一下
  4. jmeter 插件 监视器 图形界面使用
  5. Leetcode 335. 路径交叉(Self Crossing)
  6. 沈向洋、王海峰候选中国工程院院士!计算机领域7位入围增选
  7. java break与continue_java中的break与continue
  8. failed to initialize monitor thread
  9. linux安装开发工具
  10. matlab 函数pdf怎么用_怎么将Word转换成PDF?Word转PDF就得用这个工具
  11. 基于Spring Security Role过滤Jackson JSON输出内容
  12. win7电脑插音响没声音的解决教程--win10专业版
  13. 迷你助手世界隐私条款
  14. libmp4v2的编译及简单DEMO
  15. 单利终值和现值matlab,单利终值现值和复利终值现值公式
  16. 史上最全面的苏州工业园区虚拟住房补贴申请攻略
  17. TIA portal西门子博途安装时一直提示重启怎么办?
  18. android 触摸 唤醒屏幕,Android中屏幕保持唤醒
  19. LaTeX插入GIF的标准方法
  20. scroll-top 设置微信小程序滚动条位置

热门文章

  1. 【译】Bootstrap基本理念
  2. 2.30mongodb创建集合,数据管理2.31PHP的mongdb扩展
  3. 微信OAuth2.0网页授权设置一个域名需多个域名使用的问题
  4. unity3d常用组件及分析
  5. wordpress的手动更新
  6. 最简单的java WebService服务器端搭建
  7. EcmaScript正則表達式( 深入淺出系列之淺出 )
  8. java linux 字体设置_Linux操作系统JDK中文字体设置方法介绍
  9. 1-2-3 CodeForces - 863C(规律+思维)
  10. Mind Control CodeForces - 1291C(思维)