# 原始数据来自:
# https://github.com/myleott/mnist_png
# 但是这个数据的放置效果是这样的:

显然不好用.

于是进行转化,目标是所有图片都放在一起,然后生成一个"图片和类别名字对应"的train.csv

这样,MNIST数据格式就和kaggle比赛中的一致了.

新建一个origin文件夹,把train中上述所有文件夹剪切放入origin

然后运行以下代码,得到train.csv


import os
import pandas as pd
from pandas.core.frame import DataFrame#根据每个文件夹分别生成一个csv文件用来记录png图片和类别之间的关系
path="./origin/"train_df = pd.DataFrame(columns = ["pic_name", "label"]) for folder in os.listdir(path):sub_folder=path+folder#获得某个类别下面的所有文件列表,然后存入一个csvfile_lists=[f for f in os.listdir(sub_folder) if os.path.isfile(os.path.join(sub_folder, f))]# print("file_lists=",file_lists)labels=list(folder)*len(file_lists)#生成类别c={"pic_name":file_lists,"label":labels}data=DataFrame(c)train_df=pd.concat([train_df,data],ignore_index=True)# data.to_csv(folder+".csv",index=False)train_df.to_csv("train.csv",index=False)
#合并所有的csv,得到train.csv

然后所有文件从origin下面剪切到train中混合在一起,命令如下:

mv origin/*/*.png train/

由于MNIST中的test是验证集的意思,所以需要把上述步骤对test也操作一遍.

好了,最终结果如下:

https://github.com/appleyuchi/MNIST_PNG

获取png格式的MNIST数据集相关推荐

  1. python处理MNIST数据集

    1. MNIST数据集 1.1 MNIST数据集获取 MNIST数据集是入门机器学习/模式识别的最经典数据集之一.最早于1998年Yan Lecun在论文: Gradient-based learni ...

  2. 使用Python解析MNIST数据集(IDX格式文件)

    代码参考链接 mnist数据集idx格式文件: t10k-images-idx3-ubyte.gz:测试集数据 t10k-labels-idx1-ubyte.gz:测试集标签 train-images ...

  3. Dataset之MNIST:自定义函数mnist.load_mnist根据网址下载mnist数据集(四个ubyte.gz格式数据集文件)

    Dataset之MNIST:自定义函数mnist.load_mnist根据网址下载mnist数据集(四个ubyte.gz格式数据集文件) 目录 下载结果 运行代码 下载结果 运行代码 mnist.py ...

  4. Theano mnist数据集格式

    首先链接一篇大牛的Theano文档翻译:http://www.cnblogs.com/xueliangliu/archive/2013/04/03/2997437.html 里面有mnist.pkl. ...

  5. MNIST手写数字数据集格式,如何读取MNIST数据集?

    数据集下载地址:http://yann.lecun.com/exdb/mnist/ TRAINING SET LABEL FILE (train-labels-idx1-ubyte):[offset] ...

  6. 坎坎坷坷的深度学习之路(三)-Hello world(2)-------MNIST数据集1-MNIST格式

    上一次说了些来自官网,无聊透顶的tf介绍,这次开始研究MNIST.识别之前先来关注一下MNIST的文件格式. MNIST的数据集可以从 官网 处下载,一共包含4个文件(点击下面的文件名可直接下载) t ...

  7. 上海交大:我们做了一个医疗版MNIST数据集,发现常见AutoML算法没那么好用

    机器之心报道 作者:魔王.张倩 上海交大研究人员创建新型开放医疗图像数据集 MedMNIST,并设计「MedMNIST 分类十项全能」,旨在促进 AutoML 算法在医疗图像分析领域的研究. 项目地址 ...

  8. 深度学习4:使用MNIST数据集(tensorflow)

    本文将介绍MNIST数据集的数据格式和使用方法,使用到的是tensorflow中封装的类,包含代码. MNIST数据集来源于这里, 如果希望下载原始格式的数据集,可以从这里下载.而本文中讲解的是已经使 ...

  9. 我们做了一个医疗版MNIST数据集,发现常见AutoML算法没那么好用

    作者|魔王.张倩 来源|机器之心 上海交大研究人员创建新型开放医疗图像数据集 MedMNIST,并设计「MedMNIST 分类十项全能」,旨在促进 AutoML 算法在医疗图像分析领域的研究. 在 A ...

最新文章

  1. mybatis 传递set集合
  2. json-schema 简介
  3. 物联网将迎丛林时代 细数物联网八大发展模式
  4. Django-启动文件的制作
  5. Open Flash Chart 图表组件
  6. 【JavaScript】变量
  7. 比特币被盗事件频发,这次是 6300 万美元
  8. ZOJ 3983 2017CCPC秦皇岛 C:Crusaders Quest
  9. django优化--ORM优缺点
  10. 吴恩达机器学习视频学习笔记(2)
  11. 去除右键菜单中图形属性、图形选项
  12. 武汉CMMI3-CMMI5三年到期后复审指南
  13. linux localhost发邮件失败,测试邮件系统:telnet localhost 25时的问题~
  14. 白盒测试哪种测试效果好_比较常用的白盒测试工具有哪些?
  15. 欧几里德与扩展欧几里德算法
  16. Java多线程实现多用户与服务端Socket通信
  17. 测试架构师修炼之道--读书笔记
  18. stc12c5a单片机c语言adc,STC12C5A60S2单片机的ADC采样程序分享
  19. 【Unity3D Shader编程】之八 Unity5新版Shader模板源码解析径向模糊屏幕特效的实现
  20. 淘宝技术四面,本以为三面过了就完了,没想到还有个交叉面试。

热门文章

  1. 驱动学习 - 加载.卸载驱动
  2. Kali获取不到IP解决方案
  3. Python编写自动化脚本(无验证码)
  4. mysql存储语句_MYSQL 常用语句保存
  5. 解决vue router使用 history 模式刷新后404问题
  6. cmder上传文件到服务器,wget 结合everything上传文件到服务器端(以及更改ip地址)...
  7. angularjsl路由_AngularJS实现路由实例
  8. Node.js 安装及配置
  9. 两列布局左边定宽,右边自适应
  10. 【BZOJ3676】 [Apio2014]回文串(SAM,manacher)