python读取CIFAR10数据集并将数据集转换为PNG格式存储
CIFAR10数据集介绍
CIFAR10数据集包括10类图像,每张图像的大小为32*32,包含如上图的十个类别的对象。每个类都包含6000张图片,总共有60000张图片,数据集平衡。其中,训练组图像包含50000张图片,测试集包含10000张图像。
数据集的下载
数据集地址:http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
也可以使用pytorch中的方法来获取数据集:
trainset = torchvision.datasets.CIFAR10(root='存储路径',train=True,download=True,transform = transform,)
testset = torchvision.datasets.CIFAR10(root='存储路径',train=False,download=True,transform = transform,)
下载后的数据集如下:
包含五个训练batch和一个测试batch,每个batch包含一万张图片。在做深度学习训练的时候直接从batch中读取数据就好,也可以转换为PNG或者JPG图片格式来再进行读取和查看图像数据。
读取代码如下:
# !/usr/bin/python3
# -*- coding:utf-8 -*-
# Author:WeiFeng Liu
# @Time: 2021/11/5 下午1:02import cv2
import numpy as np
from six.moves import cPickle as pickle
#解压缩二进制文件
def unpack(file):fo = open(file, "rb")dict = pickle.load(fo,encoding='iso-8859-1')fo.close()return dict## unpack trainsetfor i in range(1,6):data_name = "训练batch路径" + str(i)Xtr = unpack(data_name)print(data_name + 'is loading....')for j in range(10000):img = np.reshape(Xtr['data'][j],(3,32,32))img = img.transpose(1,2,0)img_name = 'train/' + str(Xtr['labels'][j]) + '_' + str(j+ (i-1)*10000) + '.jpg'cv2.imwrite(img_name,img)print(data_name + 'is loaded....')testXtr = unpack('测试batch路径')
for i in range(0,10000):img = np.reshape(testXtr['data'][i],(3,32,32))img = img.transpose(1,2,0)img_name = 'test/' + str(testXtr['labels'][i]) + '_' + str(i) + '.jpg'cv2.imwrite(img_name, img)
在python3中解压二进制文件要带上这一句:
dict = pickle.load(fo,encoding='iso-8859-1')
否则会出现编码错误。
python读取CIFAR10数据集并将数据集转换为PNG格式存储相关推荐
- Python读取IRIS数据集并转换为PaddlePaddle中使用的reader
背景信息 IRIS数据集是机器学习领域常用的一种数据集,但是PaddlePaddle预置数据集中并未包含,因此本文实现了使用Python读取下载的iris数据集文本文件并将其转换为reader的代码. ...
- 读取MNIST数据集并显示数据集图片 完全解析
# coding: utf-8 import sys, os sys.path.append(os.pardir) # 为了导入父目录的文件而进行的设定 import numpy as np from ...
- python读取txt文件并将其转换为Dataframe格式
对'LogiReg_data.txt'中的数据进行逻辑回归分析.完成下列工作: 读取数据并转换为DataFrame格式,将第一列的列标签设置为'参数1',第二列的列标签设置为'参数2',第三列的列标签 ...
- python读取mtcars数据集并实现以下操作_Python可视化43 | plotnine≈R语言ggplot2,43plotnineR...
plotnine是 图层图形语法( The Grammar of Graphics )在python中的实现 ,是ggplot2的python办, 使用方法和ggplot2几乎一样 . 本文将 基于 ...
- Python读取CIFAR10数据集,附代码详解
Python读取CIFAR10数据集 初次接触机器学习,用到的第一个数据集就是CIFAR10.这是一个小型数据集.一共包含 10 个类别的 RGB 彩色图 片:飞机( airplane ).汽车( a ...
- python怎么读取sav格式_利用Python读取外部数据文件
利用Python读取外部数据文件 [color=rgb(0, 0, 0) !important]刘顺祥 [color=rgb(0, 0, 0) !important]摘要: 不论是数据分析,数据可视化 ...
- python读取excelsheet-一文看懂用Python读取Excel数据
原标题:一文看懂用Python读取Excel数据 导读:现有的Excel分为两种格式:xls(Excel 97-2003)和xlsx(Excel 2007及以上). Python处理Excel文件主要 ...
- (超详细)读取mnist数据集并保存成图片
mnist数据集介绍.读取.保存成图片 1.mnist数据集介绍: MNIST数据集是一个手写体数据集,简单说就是一堆这样东西 MNIST的官网地址是 MNIST; 通过阅读官网我们可以知道,这个数 ...
- python读取表格数据_Python读取Excel数据并根据列名取值
一直想将自己接触到的东西梳理一遍,可就是迈不出第一步,希望从这篇总结开始不要再做行动的矮人了. 最近测试过程中需要用到python读取excel用例数据,于是去了解和学习了下xlrd库,这里只记录使用 ...
最新文章
- 2021年大数据ZooKeeper(三):Zookeeper数据模型和节点类型
- VDI序曲二十三 制作OFFICE 2003应用程序虚拟化序列
- SAP QM Basic Steps to Create Dynamic Modification Rule
- C# ASP.NET 开发指引简要
- mysql之左连接与右连接
- 使用curl工具测试SAP Spartacus的SSR模式是否工作正常
- 【LeetCode】剑指 Offer 54. 二叉搜索树的第k大节点
- easyUI 如何不跳转页面,只是加载替换center部分内容
- vuex 源码分析_Vuex源码解析(一):Module初始化
- Kraker:分布式密码爆破系统
- 国家企业信用信息公示系统爬取
- Android View事件分发机制
- 树莓派3B+温控风扇
- Hie with the Pie(Floyd+状压dp)
- 南京大学量子计算机陈教授,南京大学于扬教授应邀访问武汉物数所
- 英魂之刃服务器维护进不去,英魂之刃口袋版为什么进不去 进不去解决方法
- MS-DOS 命令例子
- 支付宝集五福,一个软件就够了~
- 移动端小案例(黑马面面)
- AJAX与JavaScript脚本语言
热门文章
- php 支付宝订单查询_5. PHP接入支付宝单笔订单查询接口
- PyTorch 和 Tensorflow 学哪个?上手简单的PyTorch考虑一下!
- 用开源的人工标注数据来增强RoFormer-Sim
- C++一学就废?试试这个项目包
- 直播预告 | 清华大学博士生牛艺霖:常识知识获取与常识推理
- 第七期 | 90天带学《机器学习》西瓜书+带打天池和达观杯AI大赛
- 经典论文复现 | PyraNet:基于特征金字塔网络的人体姿态估计
- 数学建模第五节2020.5.8-17补
- SQL学习---第一章
- 川崎焊接机器人编程实例_机器人现场编程-川崎机器人示教-综合命令.pptx