CIFAR10数据集介绍

CIFAR10数据集包括10类图像,每张图像的大小为32*32,包含如上图的十个类别的对象。每个类都包含6000张图片,总共有60000张图片,数据集平衡。其中,训练组图像包含50000张图片,测试集包含10000张图像。

数据集的下载

数据集地址:http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
也可以使用pytorch中的方法来获取数据集:

trainset = torchvision.datasets.CIFAR10(root='存储路径',train=True,download=True,transform = transform,)
testset = torchvision.datasets.CIFAR10(root='存储路径',train=False,download=True,transform = transform,)

下载后的数据集如下:

包含五个训练batch和一个测试batch,每个batch包含一万张图片。在做深度学习训练的时候直接从batch中读取数据就好,也可以转换为PNG或者JPG图片格式来再进行读取和查看图像数据。
读取代码如下:

# !/usr/bin/python3
# -*- coding:utf-8 -*-
# Author:WeiFeng Liu
# @Time: 2021/11/5 下午1:02import cv2
import numpy as np
from six.moves import cPickle as pickle
#解压缩二进制文件
def unpack(file):fo = open(file, "rb")dict = pickle.load(fo,encoding='iso-8859-1')fo.close()return dict## unpack trainsetfor i in range(1,6):data_name = "训练batch路径" + str(i)Xtr = unpack(data_name)print(data_name + 'is loading....')for j in range(10000):img = np.reshape(Xtr['data'][j],(3,32,32))img = img.transpose(1,2,0)img_name = 'train/' + str(Xtr['labels'][j]) + '_' + str(j+ (i-1)*10000) + '.jpg'cv2.imwrite(img_name,img)print(data_name + 'is loaded....')testXtr = unpack('测试batch路径')
for i in range(0,10000):img = np.reshape(testXtr['data'][i],(3,32,32))img = img.transpose(1,2,0)img_name = 'test/' + str(testXtr['labels'][i]) + '_' + str(i) + '.jpg'cv2.imwrite(img_name, img)

在python3中解压二进制文件要带上这一句:

 dict = pickle.load(fo,encoding='iso-8859-1')

否则会出现编码错误。

python读取CIFAR10数据集并将数据集转换为PNG格式存储相关推荐

  1. Python读取IRIS数据集并转换为PaddlePaddle中使用的reader

    背景信息 IRIS数据集是机器学习领域常用的一种数据集,但是PaddlePaddle预置数据集中并未包含,因此本文实现了使用Python读取下载的iris数据集文本文件并将其转换为reader的代码. ...

  2. 读取MNIST数据集并显示数据集图片 完全解析

    # coding: utf-8 import sys, os sys.path.append(os.pardir) # 为了导入父目录的文件而进行的设定 import numpy as np from ...

  3. python读取txt文件并将其转换为Dataframe格式

    对'LogiReg_data.txt'中的数据进行逻辑回归分析.完成下列工作: 读取数据并转换为DataFrame格式,将第一列的列标签设置为'参数1',第二列的列标签设置为'参数2',第三列的列标签 ...

  4. python读取mtcars数据集并实现以下操作_Python可视化43 | plotnine≈R语言ggplot2,43plotnineR...

    plotnine是 图层图形语法( The Grammar of Graphics )在python中的实现 ,是ggplot2的python办, 使用方法和ggplot2几乎一样 . 本文将 基于 ...

  5. Python读取CIFAR10数据集,附代码详解

    Python读取CIFAR10数据集 初次接触机器学习,用到的第一个数据集就是CIFAR10.这是一个小型数据集.一共包含 10 个类别的 RGB 彩色图 片:飞机( airplane ).汽车( a ...

  6. python怎么读取sav格式_利用Python读取外部数据文件

    利用Python读取外部数据文件 [color=rgb(0, 0, 0) !important]刘顺祥 [color=rgb(0, 0, 0) !important]摘要: 不论是数据分析,数据可视化 ...

  7. python读取excelsheet-一文看懂用Python读取Excel数据

    原标题:一文看懂用Python读取Excel数据 导读:现有的Excel分为两种格式:xls(Excel 97-2003)和xlsx(Excel 2007及以上). Python处理Excel文件主要 ...

  8. (超详细)读取mnist数据集并保存成图片

    mnist数据集介绍.读取.保存成图片 1.mnist数据集介绍: MNIST数据集是一个手写体数据集,简单说就是一堆这样东西  MNIST的官网地址是 MNIST; 通过阅读官网我们可以知道,这个数 ...

  9. python读取表格数据_Python读取Excel数据并根据列名取值

    一直想将自己接触到的东西梳理一遍,可就是迈不出第一步,希望从这篇总结开始不要再做行动的矮人了. 最近测试过程中需要用到python读取excel用例数据,于是去了解和学习了下xlrd库,这里只记录使用 ...

最新文章

  1. 2021年大数据ZooKeeper(三):Zookeeper数据模型和节点类型
  2. VDI序曲二十三 制作OFFICE 2003应用程序虚拟化序列
  3. SAP QM Basic Steps to Create Dynamic Modification Rule
  4. C# ASP.NET 开发指引简要
  5. mysql之左连接与右连接
  6. 使用curl工具测试SAP Spartacus的SSR模式是否工作正常
  7. 【LeetCode】剑指 Offer 54. 二叉搜索树的第k大节点
  8. easyUI 如何不跳转页面,只是加载替换center部分内容
  9. vuex 源码分析_Vuex源码解析(一):Module初始化
  10. Kraker:分布式密码爆破系统
  11. 国家企业信用信息公示系统爬取
  12. Android View事件分发机制
  13. 树莓派3B+温控风扇
  14. Hie with the Pie(Floyd+状压dp)
  15. 南京大学量子计算机陈教授,南京大学于扬教授应邀访问武汉物数所
  16. 英魂之刃服务器维护进不去,英魂之刃口袋版为什么进不去 进不去解决方法
  17. MS-DOS 命令例子
  18. 支付宝集五福,一个软件就够了~
  19. 移动端小案例(黑马面面)
  20. AJAX与JavaScript脚本语言

热门文章

  1. php 支付宝订单查询_5. PHP接入支付宝单笔订单查询接口
  2. PyTorch 和 Tensorflow 学哪个?上手简单的PyTorch考虑一下!
  3. 用开源的人工标注数据来增强RoFormer-Sim
  4. C++一学就废?试试这个项目包
  5. 直播预告 | 清华大学博士生牛艺霖:常识知识获取与常识推理
  6. 第七期 | 90天带学《机器学习》西瓜书+带打天池和达观杯AI大赛
  7. 经典论文复现 | PyraNet:基于特征金字塔网络的人体姿态估计
  8. 数学建模第五节2020.5.8-17补
  9. SQL学习---第一章
  10. 川崎焊接机器人编程实例_机器人现场编程-川崎机器人示教-综合命令.pptx