https://www.toutiao.com/a6708827091267224078/

CIFAR-10

该数据集共有60000张彩色图像,这些图像是32*32,分为10个类,每类6000张图。这里面有50000张用于训练,构成了5个训练批,每一批10000张图;另外10000用于测试,单独构成一批。

测试批的数据里,取自10类中的每一类,每一类随机取1000张。抽剩下的就随机排列组成了训练批。注意一个训练批中的各类图像并不一定数量相同,总的来看训练批,每一类都有5000张图。

下面这幅图就是列举了10各类,每一类展示了随机的10张图片:

需要说明的是,这10类都是各自独立的,不会出现重叠。

数据的下载:

(共有三个版本:python,matlab,binary version 适用于C语言)

http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz

http://www.cs.toronto.edu/~kriz/cifar-10-matlab.tar.gz

http://www.cs.toronto.edu/~kriz/cifar-10-binary.tar.gz

你可以在cuda-convert的项目页面上找到此数据集上的一些基线可复制的结果。这个结果是由CNN卷积神经网络得到的。简要的说,在没有数据扩充的情况下,测试误差为18%,反之为11%。

数据集布局

Python/Matlab 版本

这两个数据形式是一样的,就以python为例。

该数据集文件包含data_batch1……data_batch5,和test_batch。他们都是由cPickle库产生的序列化后的对象(关于pickle,移步https://docs.python.org/3/library/pickle.html)。这里给出python2和python3的例程,他可以打开这样的pkl文件,返回一个字典结构的数据:

Python2:

1 def unpickle(file):
2 import cPickle
3 with open(file, 'rb') as fo:
4 dict = cPickle.load(fo)
5 return dict

Python3:

1 def unpickle(file):
2 import pickle
3 with open(file, 'rb') as fo:
4 dict = pickle.load(fo, encoding='bytes')
5 return dict

这样的话,每个batch文件包含一个字典,每个字典包含有:

  • Data

一个10000*3072的numpy数组(numpy:https://docs.scipy.org/doc/numpy-dev/user/quickstart.html),数据类型是无符号整形uint8。这个数组的每一行存储了32*32大小的彩色图像(32*32*3通道=3072)。前1024个数是red通道,然后分别是green,blue。另外,图像是以行的顺序存储的,也就是说前32个数就是这幅图的像素矩阵的第一行。

  • labels

一个范围在0-9的含有10000个数的列表(一维的数组)。第i个数就是第i个图像的类标。

数据集除了6个batch之外,还有一个文件batches.meta。它包含一个python字典对象,内容有:

一个包含10个元素的列表,每一个描述了labels array中每个数字对应类标的名字。比如:label_names[0] == "airplane", label_names[1] == "automobile"

人工智能进阶-CIFAR-10数据集介绍相关推荐

  1. 【人工智能项目】ImageNet数据集介绍以及数字图像处理技术

    [人工智能项目]ImageNet数据集介绍以及数字图像处理技术 本次介绍一下imagenet数据集,并对imagenet数据集中的图片做一些数字图像处理预处理操作.那话不多说,搞起来!!! Image ...

  2. 深度学习入门——利用卷积神经网络训练CIFAR—10数据集

    CIFAR-10数据集简介 CIFAR-10是由Hinton的学生Alex Krizhevsky和Ilya Sutskever整理的一个用于普适物体的小型数据集.它一共包含10个类别的RGB彩色图片: ...

  3. 深度学习常用数据集介绍

    数据集大全 数据集大全 介绍 目前接触到的数据集 1. [MNIST](http://yann.lecun.com/exdb/mnist/) 2. [CIFAR-10 / CIFAR-100](htt ...

  4. 重磅开源人工智能大型场景草图数据集图像检索草图着色编辑和字幕

    重磅开源人工智能大型场景草图数据集图像检索草图着色编辑和字幕摘要:我们提供了第一个大型场景草图数据集SketchyScene,目的是推进对物体和场景层面的素描研究.该数据集是通过一个新颖且精心设计的众 ...

  5. 【知识星球】数据集板块重磅发布,海量数据集介绍与下载

    有三AI知识星球的"数据集板块"正式上线,提供数据集介绍,论文下载,数据集下载3大功能,那些因为网速问题,因为需要签license的蛋疼问题,从此不再成为问题! 有三AI知识星球- ...

  6. 【神经网络与深度学习】CIFAR10数据集介绍,并使用卷积神经网络训练图像分类模型——[附完整训练代码]

    [神经网络与深度学习]CIFAR-10数据集介绍,并使用卷积神经网络训练模型--[附完整代码] 一.CIFAR-10数据集介绍 1.1 CIFAR-10数据集的内容 1.2 CIFAR-10数据集的结 ...

  7. SPSS(十七)SPSS之判别分析进阶(图文+数据集)

    SPSS(十七)SPSS之判别分析进阶(图文+数据集) 为什么会有这些新模型的出现? 树模型结构 神经网络模型 传统模型的局限 任何统计模型都是对现实世界复杂联系的简化 统计理论假设对任何一个随机现象 ...

  8. STM32 进阶教程 10 - RAM中调试程序

    前言 在stm32开发过程中,程序调试是一个比较耗时且又重要的问题,特别是在固件代码达到一定的复杂度后,程序下载过程就一个比较耗时过程,同时STM32芯片有FLASH烧写次数有限,像103系列手册中标 ...

  9. DL之NN/CNN:NN算法进阶优化(本地数据集50000张训练集图片),六种不同优化算法实现手写数字图片识别逐步提高99.6%准确率

    DL之NN/CNN:NN算法进阶优化(本地数据集50000张训练集图片),六种不同优化算法实现手写数字图片识别逐步提高99.6%准确率 目录 设计思路 设计代码 设计思路 设计代码 import mn ...

  10. OHSUMED数据集介绍

    1. OHSUMED数据集介绍 本实验中采用OHSUMED测试数据集合(其也被用于第9 届国际文本检索竞赛TREC9 的文档过滤子竞赛).OHSUMED 数据集合由William Hersh和他的同事 ...

最新文章

  1. 深入理解 Mybatis 插件开发
  2. java面试 拦截器问题_面试必问:给我说一下Spring MVC拦截器的原理?
  3. 正则表达式处理的基本步骤
  4. OC基础 代理和协议
  5. 剑指offer:反转链表
  6. python降级pip_1.2 pip降级selenium3.0
  7. python中哈达玛积与矩阵乘法的区别
  8. 看网络电子围栏如何做好周界安防
  9. stl文件unity_Unity导入STL格式模型(一)
  10. 【安全】java的Jaas授权与鉴权
  11. 初探 amaze-vue( 基于vue.js封装的Amaze UI 组件库)
  12. 喜大普奔,VS Code 开启远程开发新时代!
  13. python爬取邮件内容_python 定时爬取内容并发送报告到指定邮箱
  14. csv数据导入mysql方法
  15. 复旦大学计算机a类专业,如何看待浙大A类学科39个,全国第一,录取分却比复旦、上交低?...
  16. r9270公版bios_R9280,R9270,HD7000,VBE7007.系显卡全套修改超频刷BIOS工具
  17. ewebeditor 3.8php漏洞,eWebEditor v3.8 列目录漏洞【asp版本】
  18. fadeOut和fadeIn
  19. 实现 Trie (前缀树)
  20. 解决Appium Desktop 测试中,元素不能准确定位的问题

热门文章

  1. github md文件里显示markdown公式的解决办法
  2. SQL begin end 块作用
  3. 深度学习崛起十年:“开挂”的OpenAI革新者
  4. 一文探索 JavaScript 最强大特性—函数表达式
  5. 读 博 失 败 的 10 大 作 死 方 法
  6. 报名 | 期末考后,快来打比赛赢万元奖金!(北京上海)
  7. 全国首个5G+AI的智慧交通管理示范应用成功开通!
  8. A Context-aware Attention Network for Interactive Question Answering--阅读笔记
  9. RTX 3090的深度学习环境配置指南:Pytorch、TensorFlow、Keras
  10. 程序员硬核资源:一本贼有趣的设计模式学习pdf