CIFAR-10

该数据集共有60000张彩色图像,这些图像是32*32,分为10个类,每类6000张图。这里面有50000张用于训练,构成了5个训练批,每一批10000张图;另外10000用于测试,单独构成一批。

测试批的数据里,取自10类中的每一类,每一类随机取1000张。抽剩下的就随机排列组成了训练批。注意一个训练批中的各类图像并不一定数量相同,总的来看训练批,每一类都有5000张图。

下面这幅图就是列举了10各类,每一类展示了随机的10张图片:

需要说明的是,这10类都是各自独立的,不会出现重叠。

数据的下载:

(共有三个版本:python,matlab,binary version 适用于C语言)

http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz

http://www.cs.toronto.edu/~kriz/cifar-10-matlab.tar.gz

http://www.cs.toronto.edu/~kriz/cifar-10-binary.tar.gz

你可以在cuda-convert的项目页面上找到此数据集上的一些基线可复制的结果。这个结果是由CNN卷积神经网络得到的。简要的说,在没有数据扩充的情况下,测试误差为18%,反之为11%。

数据集布局

Python/Matlab 版本

这两个数据形式是一样的,就以python为例。

该数据集文件包含data_batch1……data_batch5,和test_batch。他们都是由cPickle库产生的序列化后的对象(关于pickle,移步https://docs.python.org/3/library/pickle.html)。这里给出python2和python3的例程,他可以打开这样的pkl文件,返回一个字典结构的数据:

Python2:

1 def unpickle(file):2 import cPickle3 with open(file, 'rb') as fo:4 dict = cPickle.load(fo)5 return dict 

Python3:

1 def unpickle(file):2 import pickle3 with open(file, 'rb') as fo:4 dict = pickle.load(fo, encoding='bytes')5 return dict 

这样的话,每个batch文件包含一个字典,每个字典包含有:

  • Data

一个10000*3072的numpy数组(numpy:https://docs.scipy.org/doc/numpy-dev/user/quickstart.html),数据类型是无符号整形uint8。这个数组的每一行存储了32*32大小的彩色图像(32*32*3通道=3072)。前1024个数是red通道,然后分别是green,blue。另外,图像是以行的顺序存储的,也就是说前32个数就是这幅图的像素矩阵的第一行。

  • labels

一个范围在0-9的含有10000个数的列表(一维的数组)。第i个数就是第i个图像的类标。

数据集除了6个batch之外,还有一个文件batches.meta。它包含一个python字典对象,内容有:

一个包含10个元素的列表,每一个描述了labels array中每个数字对应类标的名字。比如:label_names[0] == "airplane

ciaodvd数据集的简单介绍_人工智能进阶-CIFAR-10数据集介绍相关推荐

  1. 新颖的自我介绍_非常有创意的自我介绍

    非常有创意的自我介绍 如果题主是指类似新同学新同事轮流自我介绍那种的话,个人经验如下. (注:本人以学生党角度试图向工作党方向加以考虑故语言较为亲民还请轻喷→_→) 对了,首先说明下,我把" ...

  2. cocostuff10k数据集介绍_(六)COCO数据集的简单介绍

    COCO通过大量使用Amazon Mechanical Turk来收集数据.COCO数据集现在有3种标注类型:object instances(目标实例), object keypoints(目标上的 ...

  3. matlab 对mnist手写数字数据集进行判决分析_人工智能TensorFlow(十四)MINIST手写数字识别...

    MNIST是一个简单的视觉计算数据集,它是像下面这样手写的数字图片: MNIST 每张图片还额外有一个标签记录了图片上数字是几,例如上面几张图的标签就是:5.0.4.1. MINIST数据 MINIS ...

  4. 用python做自我介绍_用python做个自我介绍(python入门教程)_逻辑教育

    原标题:用python做个自我介绍(python入门教程)_逻辑教育 本文涉及的python基础语法为:数据类型等 数字类型 1. 字符串的拼接 我们在上一章中已经简单介绍了一下字符串的创建方式,这里 ...

  5. 新颖的自我介绍_简短有创意的自我介绍

    简短有创意的自我介绍 简短有创意的自我介绍1 各位同仁好!小女初长成,学得深闺中;课业语文马马虎虎,相对数学一塌糊涂;承蒙大家关爱有佳,得以在此一展风姿,真是兴会兴会.若您有兴与我畅谈大千宇宙世界,请 ...

  6. 大数据面试3分钟自我介绍_面试时三分钟自我介绍,需要注意哪些问题?

    "面试20分钟,开头占大头."一个好的自我介绍真真真真的太太太重要了! 作为一个从业近10年的hr,在面试当中,如果应聘者给我们的第一印象很好,大方得体,他入选的概率就要大很多. ...

  7. 20200928 003.开发环境介绍_交互模式的使用_IDLE介绍和使用

    Python 开发环境 开发环境,英文是 IDE( Integrated Development Environment 集成开发环境 ). 不要纠结于使用哪个开发环境.开发环境本质上就是对 Pyth ...

  8. 大数据面试3分钟自我介绍_通用面试两分钟自我介绍范文5篇

    通用面试两分钟自我介绍范文 5 篇 面试两分钟自我介绍范文 ( 一 ) 各位考官好,今天能够站在这里参加面试,有机会向各位考官请教和学习,我感 到非常的荣幸.希望通过这次面试能够把自己展示给大家,希望 ...

  9. 新颖的自我介绍_有关最新颖的自我介绍

    有关最新颖的自我介绍 大家好,我叫肖沧明,小月肖,沧海月明.我是来自重庆的,我们这一届应该就只有我一个重庆人吧.在离开重庆的时候,我曾对我原来高中的同学保证,我会让这边的每一个人都知道,重庆的小伙子都 ...

最新文章

  1. 纪念逝去的头发--一次debug经历
  2. 【校园先行者】曲径通幽,我用阿里云部署的个人网站及挂机实践分享
  3. (3)数据库的建立和数据表的操作
  4. ps制作html图标素材,如何用PS制作一个简单的扁平化图标?
  5. 预训练语言模型论文分类整理:综述、基准数据集、PLM的设计和分析
  6. 阿里云助力江苏省财政厅力推统一公共支付平台
  7. 偏差与方差,欠拟合与过拟合
  8. 程序员鼓励师是什么?
  9. 深圳php程序培训班,深圳php编程培训班哪几个好
  10. C#编写的一个SFTP工具类
  11. VMware Horizon环境中的防病毒注意事项
  12. android 传感器使用与开发---陀螺仪传感器
  13. 一起学习荷花定律/金蝉定律和竹子定律
  14. APP添加人脸识别功能
  15. Python遥感影像拼接
  16. bypass分流抢票(火车、高铁)
  17. Coursera | Andrew Ng (01-week-2-2.17)—Jupyter _ ipython 笔记本的快速指南
  18. springboot集成elasticsearch集群出现java.net.SocketTimeoutException: 60 milliseconds timeout on connection
  19. 关于 mldonkey
  20. html调用天气预报wsdl服务,调用天气预报Web Service

热门文章

  1. Fortinet不断践行安全平台的战略保持长效增长
  2. 分布式事务方案这么多,到底应该如何选型?
  3. 微服务精华问答 | 为什么需要微服务?
  4. 我要自学网java jsp_学javaweb需要什么基础?零基础如何学习javaweb?
  5. matlab基本矩阵运算,matlab的矩阵基本运算问题已知A=[a,b,c;d,e,f;h,I,j],B=[l,m,n;x,y,z;q,o,p]...
  6. python解zuobiaoxi方程_滑坡稳定性分析程序初探---Python版!
  7. 树莓派 摄像头 php,树莓派3 之 USB摄像头安装和使用
  8. 腾讯位置服务地图选点这个怎么在小程序里面更新呀?
  9. Elasticsearch7.15.2 修改IK分词器源码实现基于MySql8的词库热更新
  10. VS Code Element 提示 VSCode-Element-Helper 插件