获取png格式的MNIST数据集
# 原始数据来自:
# https://github.com/myleott/mnist_png
# 但是这个数据的放置效果是这样的:
显然不好用.
于是进行转化,目标是所有图片都放在一起,然后生成一个"图片和类别名字对应"的train.csv
这样,MNIST数据格式就和kaggle比赛中的一致了.
新建一个origin文件夹,把train中上述所有文件夹剪切放入origin
然后运行以下代码,得到train.csv
import os
import pandas as pd
from pandas.core.frame import DataFrame#根据每个文件夹分别生成一个csv文件用来记录png图片和类别之间的关系
path="./origin/"train_df = pd.DataFrame(columns = ["pic_name", "label"]) for folder in os.listdir(path):sub_folder=path+folder#获得某个类别下面的所有文件列表,然后存入一个csvfile_lists=[f for f in os.listdir(sub_folder) if os.path.isfile(os.path.join(sub_folder, f))]# print("file_lists=",file_lists)labels=list(folder)*len(file_lists)#生成类别c={"pic_name":file_lists,"label":labels}data=DataFrame(c)train_df=pd.concat([train_df,data],ignore_index=True)# data.to_csv(folder+".csv",index=False)train_df.to_csv("train.csv",index=False)
#合并所有的csv,得到train.csv
然后所有文件从origin下面剪切到train中混合在一起,命令如下:
mv origin/*/*.png train/
由于MNIST中的test是验证集的意思,所以需要把上述步骤对test也操作一遍.
好了,最终结果如下:
https://github.com/appleyuchi/MNIST_PNG
获取png格式的MNIST数据集相关推荐
- python处理MNIST数据集
1. MNIST数据集 1.1 MNIST数据集获取 MNIST数据集是入门机器学习/模式识别的最经典数据集之一.最早于1998年Yan Lecun在论文: Gradient-based learni ...
- 使用Python解析MNIST数据集(IDX格式文件)
代码参考链接 mnist数据集idx格式文件: t10k-images-idx3-ubyte.gz:测试集数据 t10k-labels-idx1-ubyte.gz:测试集标签 train-images ...
- Dataset之MNIST:自定义函数mnist.load_mnist根据网址下载mnist数据集(四个ubyte.gz格式数据集文件)
Dataset之MNIST:自定义函数mnist.load_mnist根据网址下载mnist数据集(四个ubyte.gz格式数据集文件) 目录 下载结果 运行代码 下载结果 运行代码 mnist.py ...
- Theano mnist数据集格式
首先链接一篇大牛的Theano文档翻译:http://www.cnblogs.com/xueliangliu/archive/2013/04/03/2997437.html 里面有mnist.pkl. ...
- MNIST手写数字数据集格式,如何读取MNIST数据集?
数据集下载地址:http://yann.lecun.com/exdb/mnist/ TRAINING SET LABEL FILE (train-labels-idx1-ubyte):[offset] ...
- 坎坎坷坷的深度学习之路(三)-Hello world(2)-------MNIST数据集1-MNIST格式
上一次说了些来自官网,无聊透顶的tf介绍,这次开始研究MNIST.识别之前先来关注一下MNIST的文件格式. MNIST的数据集可以从 官网 处下载,一共包含4个文件(点击下面的文件名可直接下载) t ...
- 上海交大:我们做了一个医疗版MNIST数据集,发现常见AutoML算法没那么好用
机器之心报道 作者:魔王.张倩 上海交大研究人员创建新型开放医疗图像数据集 MedMNIST,并设计「MedMNIST 分类十项全能」,旨在促进 AutoML 算法在医疗图像分析领域的研究. 项目地址 ...
- 深度学习4:使用MNIST数据集(tensorflow)
本文将介绍MNIST数据集的数据格式和使用方法,使用到的是tensorflow中封装的类,包含代码. MNIST数据集来源于这里, 如果希望下载原始格式的数据集,可以从这里下载.而本文中讲解的是已经使 ...
- 我们做了一个医疗版MNIST数据集,发现常见AutoML算法没那么好用
作者|魔王.张倩 来源|机器之心 上海交大研究人员创建新型开放医疗图像数据集 MedMNIST,并设计「MedMNIST 分类十项全能」,旨在促进 AutoML 算法在医疗图像分析领域的研究. 在 A ...
最新文章
- mybatis 传递set集合
- json-schema 简介
- 物联网将迎丛林时代 细数物联网八大发展模式
- Django-启动文件的制作
- Open Flash Chart 图表组件
- 【JavaScript】变量
- 比特币被盗事件频发,这次是 6300 万美元
- ZOJ 3983 2017CCPC秦皇岛 C:Crusaders Quest
- django优化--ORM优缺点
- 吴恩达机器学习视频学习笔记(2)
- 去除右键菜单中图形属性、图形选项
- 武汉CMMI3-CMMI5三年到期后复审指南
- linux localhost发邮件失败,测试邮件系统:telnet localhost 25时的问题~
- 白盒测试哪种测试效果好_比较常用的白盒测试工具有哪些?
- 欧几里德与扩展欧几里德算法
- Java多线程实现多用户与服务端Socket通信
- 测试架构师修炼之道--读书笔记
- stc12c5a单片机c语言adc,STC12C5A60S2单片机的ADC采样程序分享
- 【Unity3D Shader编程】之八 Unity5新版Shader模板源码解析径向模糊屏幕特效的实现
- 淘宝技术四面,本以为三面过了就完了,没想到还有个交叉面试。
热门文章
- 驱动学习 - 加载.卸载驱动
- Kali获取不到IP解决方案
- Python编写自动化脚本(无验证码)
- mysql存储语句_MYSQL 常用语句保存
- 解决vue router使用 history 模式刷新后404问题
- cmder上传文件到服务器,wget 结合everything上传文件到服务器端(以及更改ip地址)...
- angularjsl路由_AngularJS实现路由实例
- Node.js 安装及配置
- 两列布局左边定宽,右边自适应
- 【BZOJ3676】 [Apio2014]回文串(SAM,manacher)