首先链接一篇大牛的Theano文档翻译:http://www.cnblogs.com/xueliangliu/archive/2013/04/03/2997437.html

里面有mnist.pkl.gz 手动下载地址(因为代码里也有自动下载方法)

那么我不是做图像处理的,所以对图像的存储格式没有什么概念,我要以其他方式输入进theano程序中怎么办呢?

于是就得分析它的存储格式。代码(logistic_sgd.py,line 195)注释中说的已经很清楚了:

#train_set, valid_set, test_set format: tuple(input, target)
#input is an numpy.ndarray of 2 dimensions (a matrix)
#witch row's correspond to an example. target is a
#numpy.ndarray of 1 dimensions (vector)) that have the same length as
#the number of rows in the input. It should give the target
#target to the example with the same index in the input.

那么就是说train_X是一个rows行2列的矩阵,train_Y是一个rows维的向量,而train_set是train_X和train_Y的一个组合

那么我们只需要读文件构建矩阵和向量,然后share成theano程序里的类型就ok啦

===================割=========================

想不到后来又重拾DL,如今已经是今非昔比了啊

再次补充一下Mnist数据集的格式

import cPickle, gzip, numpy# Load the dataset
f = gzip.open('mnist.pkl.gz', 'rb')
train_set, valid_set, test_set = cPickle.load(f)
f.close()

事实证明它会返回一个tuple,分别是train vali test集。

每个集有两维,以train set为例,分别是(50000, 784) (50000,1)代表着5W个样本和5W个label,

每个样本有784个维度 = 28*28

转载于:https://www.cnblogs.com/zklidd/p/3886597.html

Theano mnist数据集格式相关推荐

  1. 图像集存储成MNIST数据集格式实现

    有时会用到将一组图像存放成MNIST中那样的数据格式,以便于用于网络的训练和测试,如MNSIT中的测试集标签t10k-labels.idx1-ubyte和测试集图像t10k-images.idx3-u ...

  2. Pytorch 实现全连接神经网络/卷积神经网络训练MNIST数据集,并将训练好的模型在制作自己的手写图片数据集上测试

    使用教程 代码下载地址:点我下载 模型在训练过程中会自动显示训练进度,如果您的pytorch是CPU版本的,代码会自动选择CPU训练,如果有cuda,则会选择GPU训练. 项目目录说明: CNN文件夹 ...

  3. Dataset之MNIST:自定义函数mnist.load_mnist根据网址下载mnist数据集(四个ubyte.gz格式数据集文件)

    Dataset之MNIST:自定义函数mnist.load_mnist根据网址下载mnist数据集(四个ubyte.gz格式数据集文件) 目录 下载结果 运行代码 下载结果 运行代码 mnist.py ...

  4. MNIST手写数字数据集格式,如何读取MNIST数据集?

    数据集下载地址:http://yann.lecun.com/exdb/mnist/ TRAINING SET LABEL FILE (train-labels-idx1-ubyte):[offset] ...

  5. 坎坎坷坷的深度学习之路(三)-Hello world(2)-------MNIST数据集1-MNIST格式

    上一次说了些来自官网,无聊透顶的tf介绍,这次开始研究MNIST.识别之前先来关注一下MNIST的文件格式. MNIST的数据集可以从 官网 处下载,一共包含4个文件(点击下面的文件名可直接下载) t ...

  6. 使用Python解析MNIST数据集(IDX格式文件)

    代码参考链接 mnist数据集idx格式文件: t10k-images-idx3-ubyte.gz:测试集数据 t10k-labels-idx1-ubyte.gz:测试集标签 train-images ...

  7. python 将MNIST数据集转为jpg图片格式

    下载的数据集格式是字节存储的,有时需要转为图片格式,以下以测试集为例子,说明python转换代码. IDX数据格式 这四个文件采用了IDX的文件格式,一种平铺直叙的方式: magic number s ...

  8. mnist数据集保存为图片

    #coding: utf-8 from tensorflow.examples.tutorials.mnist import input_data import scipy.misc import o ...

  9. 上海交大:我们做了一个医疗版MNIST数据集,发现常见AutoML算法没那么好用

    机器之心报道 作者:魔王.张倩 上海交大研究人员创建新型开放医疗图像数据集 MedMNIST,并设计「MedMNIST 分类十项全能」,旨在促进 AutoML 算法在医疗图像分析领域的研究. 项目地址 ...

最新文章

  1. Python 多线程抓取网页 牛人 use raw socket implement http request great
  2. 更换jdk Error:could not open '...jvm.cfg'解决方法
  3. 清空SQL Server数据库中所有表数据的方法(转)
  4. MySQL连接查询的分类
  5. jQuery Css方法
  6. 织梦会员登录PHP,DEDECMS会员登录后跳转首页的简单实现方法
  7. Java中JFrame怎样控制闪烁_在JFrame Java中闪烁
  8. 例行性工作 排程(crontab)
  9. linux上安装shell编辑器与linux运维面试题
  10. github上传自己的项目
  11. 英雄无敌6服务器在哪个文件夹,Win7系统无法运行英雄无敌6的两种原因和解决方法...
  12. php中glob怎么用,如何在php中利用glob函数对文件进行遍历
  13. 【BUAAOO】第四次博客作业
  14. Linux系统启动过程分析 -转
  15. ssh连接Linux很慢,且ssh传输文件很慢的解决方案
  16. Nginx教程(三) Nginx日志管理 (转)
  17. 深入浅出 SSL 管理配置实战
  18. Windows环境搭建Red5流媒体服务器指南
  19. [JOY]1143 飘飘乎居士的约会
  20. k8s 三种部署方式

热门文章

  1. VTK:网格之CellEdges
  2. VTK:图片之ImageNoiseSource
  3. VTK:图片之ImageWarp
  4. OpenCV语义细分深度学习网络的实例(附完整代码)
  5. Qt Creator将UI项目转换为应用程序
  6. OpenGL raytracer光线追踪的实例
  7. 右值引用和move语义?
  8. QML绘制不同类型的图表
  9. C++STL常用拷贝和替换算法
  10. C++虚析构和纯虚析构