这段时间,打算把TensorFlow再补补,提升一下技术水平~
希望我能坚持下来,抽空把这本书刷下来吧~

导入数据

  • 下面的代码会直接下载数据,如果没有那个文件夹的话,但是,如果有这个文件夹而且里面有那几个文件的话,就会直接调用那个数据。
  • 这次直接在网上搜MNIST下载,就知道怎么下载啦~ 这里我更关注TensorFlow和算法本身
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets('MNIST_data/', one_hot=True)
print(mnist.train.images.shape)
print(mnist.test.images.shape)

(55000, 784)
(10000, 784)

比较有意思的是,这里的labels的数据安排。

  • 比如说,这就是第一个图片的所对应的信息。表示是7。

[0, 0 ,0 , 0 ,0 ,0 ,0 , 1 ,0 ,0 ]

书中比较有意思的介绍了Softmax回归,之前虽然有用过Softmax,也大致知道意思,但却没有较为详细的了解过它。这倒是这次阅读的惊喜。

Softmax回归
Softmax回归,来自于Logistics 回归。只不过逻辑回归只是binary classification的活动,而Softmax就可以实现多元的回归的情况。
意思很简单,就是返回某个物体属于labels的概率集合。然后选择概率最大的label。

现在对每个类做分析。和Logistics regression一样,先会有一个线性函数来给每个类打分。同样的,这个分数是在实数范围内的,但是概率空间只有0和1,所以需要做个映射。

分数为(a, b, c)时,对应的概率分别为:

现在我们回想起logistics regression的sigmoid函数,会发现,其实就是假设了另外一个label的得分永远为0的情况。

所以Softmax模型其实为

继续实验部分

  • 导入tf包
import tensorflow as tf

tensorflow是静态图。其实很简单,就是我们需要手动的描述一张图。把整个图画完之后,再传递参数进去,让它自己开始运行(session)。

  • 描述这张图
  • 下面我们给出了几个定义。最后一个 其实表示的是真正的label值。而y是我们算出来的值。
x = tf.placeholder(tf.float32, [None, 784])
W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))
y = tf.nn.softmax(tf.matmul(x, W) + b)
y_ = tf.placeholder(tf.float32, [None, 10])
  • 给出损失函数和训练器
cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y)))  # 使用交叉熵
train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)
  • 创建会话并开始运行
sess = tf.InteractiveSession()  # 创建Session
tf.global_variables_initializer().run() # 给所有的变量初始化,分配内存
  • 训练, 每次用mini batch的思路选几个来做
  • 注意每次都需要把整个图跑一遍
for _ in range(1000):batch_xs, batch_ys = mnist.train.next_batch(100)sess.run(train_step, feed_dict={x:batch_xs, y_:batch_ys})
  • 算一下准确度
correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction,  tf.float32))
  • 输出一下:
print(sess.run(accuracy, feed_dict={x:mnist.test.images, y_:mnist.test.labels}))

Tips:如果想单独看下某个数据,可以使用下面的方法

a = sess.run(correct_prediction, feed_dict={x:mnist.test.images, y_:mnist.test.labels})

然后我们会很惊奇的发现,这其实是一个numpy的数据

使用卷积神经网络来实现

  • 创建占位符
x = tf.placeholder(tf.float32, [None, 784])
y_ = tf.placeholder(tf.float32, [None, 10])
x_image = tf.reshape(x, [-1, 28, 28, 1])
  • 创建复用的函数
def weight_variable(shape):initial = tf.truncated_normal(shape, stddev=0.1)return tf.Variable(initial)def bias_variable(shape):initial = tf.constant(0.1, shape=shape)return initialdef conv2d(x, W):return tf.nn.conv2d(x, W, strides=[1,1,1,1], padding='SAME')def max_pool_2x2(x):return tf.nn.max_pool(x, ksize=[1,2,2,1], strides=[1,2,2,1], padding='SAME')
  • 卷积
# 第一层卷积
W_conv1 = weight_variable([5,5,1,32])
b_conv1 = bias_variable([32])
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1)+b_conv1)
h_pool1 = max_pool_2x2(h_conv1)
# 第二层卷积
W_conv2 = weight_variable([5,5,32,64])
b_conv2 = bias_variable([64])
h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2)+b_conv2)
h_pool2 = max_pool_2x2(h_conv2)
  • 全连接层
# 全连接层
W_fc1 = weight_variable([7 * 7 * 64, 1024])
b_fc1 = weight_variable([1024])
h_pool2_flat = tf.reshape(h_pool2, [-1, 7 * 7 * 64])
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1)+b_fc1)
# 使用Dropout,防止过拟合
keep_prob = tf.placeholder(tf.float32)
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)
W_fc2 = weight_variable([1024, 10])
b_fc2 = weight_variable([10])
y_conv = tf.matmul(h_fc1_drop, W_fc2) + b_fc2
  • 误差和损失
cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_, logits=y_conv))
train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
correct_prediction = tf.equal(tf.argmax(y_conv,1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction,  tf.float32))
  • 训练
sess = tf.InteractiveSession()  # 创建Session
tf.global_variables_initializer().run() # 给所有的变量初始化,分配内存
for i in range(20000):batch = mnist.train.next_batch(50)if i % 1000 == 0:train_accuracy = accuracy.eval(feed_dict={x:batch[0], y_:batch[1], keep_prob:1.0})print(train_accuracy)train_step.run(feed_dict={x:batch[0], y_:batch[1], keep_prob:0.5})

结果可以达到接近100%~~~

Tensorflow精进之路(二):两层卷积神经网络模型训练MNIST相关推荐

  1. TensorFlow精进之路(三):两层卷积神经网络模型将MNIST未识别对的图片筛选出来

    1.概述 自从开了专栏<TensorFlow精进之路>关于对TensorFlow的整理思路更加清晰.上两篇讲到Softmax回归模型和两层卷积神经网络模型训练MNIST,虽然使用神经网络能 ...

  2. TensorFlow精进之路(十四):RNN训练MNIST数据集

    1.概述 前面介绍了RNN,这一节就用tensorflow的RNN来训练MNIST数据集,看看准确率如何. 2.代码实现 2.1.导入数据集 # encoding:utf-8 import tenso ...

  3. 图片2分类卷积神经网络模型训练、分类预测案例全过程(1)

    图片2分类卷积神经网络模型训练.分类预测案例全过程(1) 前言 (1)尽管目前有关卷积神经网络深度学习的相关材料较多,但深度学习牵涉到数据预处理.模型构建.模型调用等环节,我也是一个初学者,中间有很多 ...

  4. 图片2分类卷积神经网络模型训练、分类预测案例全过程(2)

    上一篇博客内容讲述了卷积神经网络模型构建.训练以及模型的保存,包括训练样本数据的预处理和喂给网络. 本篇博客内容讲述训练好的模型的应用和实际图片数据的分类预测. 图片2分类卷积神经网络模型训练.分类预 ...

  5. Python人脸微笑识别2-----Ubuntu16.04基于Tensorflow卷积神经网络模型训练的Python3+Dlib+Opencv实现摄像头人脸微笑检测

    Python人脸微笑识别2--卷积神经网络进行模型训练目录 一.微笑数据集下载 1.微笑数据集下载 2.创建人脸微笑识别项目 3.数据集上传至Ubuntu人脸微笑识别项目文件夹 二.Python代码实 ...

  6. tensorflow精进之路(二十六)——人脸识别(上)(MTCNN原理)

    1.概述 换了个固态硬盘,本想装最新的系统mint 19,谁知道却是个坑,NVIDIA驱动和CUDA工具老是装不上去,各种问题,折腾了几天,还是用回了原来的系统.不过,这次软件改了一下,使用了pyth ...

  7. tensorflow精进之路(二十三)——Object Detection API目标检测(上)(Fast R-CNN算法)

    1.概述 上一讲,我们使用slim库对图片进行检测,每个物品用同一种颜色标注,显得乱七八糟的.这一讲,我们来学习目标检测.目标检测就是,输入一张图片,输出是将该图片中所含的所有目标物体识别,并标记出他 ...

  8. tensorflow精进之路(二十五)——Object Detection API目标检测(下)(VOC数据集训练自己的模型进行目标检测)

    1.概述 上一讲,我们使用了别人根据COCO数据集训练好的模型来做目标检测,这一讲,我们就来训练自己的模型. 2.下载数据集 为了方便学习,我们先使用别人整理好的数据集来训练---VOC 2012数据 ...

  9. tensorflow精进之路(二十七)——人脸识别(中)(MTCNN人脸检查和人脸对齐+FaceNet模型)

    1.概述 上一讲,我们讲了人脸识别的基本原理,这一讲,我们用tensorflow来实现它. 2.下载LFW人脸数据集 2.1.LFW数据集简介 LFW人脸数据集主要用来研究非受限情况下的人脸识别问题, ...

最新文章

  1. 【数字信号处理】基本序列 ( 实指数序列 | 收敛序列 | 发散序列 )
  2. freamarker 模板中空格_高端商务公司介绍PPT模板
  3. 基于libmad的MP3解码播放器
  4. Python中的线程间通信
  5. WPF 实现音频播放动画控件
  6. P4551 最长异或路径
  7. 抽一个读者,送她一台MacBook!
  8. 应用ajax实现检测注册用户名是否已经存在
  9. 【原创】设计模式面对面之观察者模式
  10. C++ 虚函数表解析(转)
  11. 离散数学蕴含式的问题
  12. Ubuntu安装gcc编译器
  13. Linux命令大全(超详细版)
  14. Floyd最短路算法
  15. 一步一步编写12306抢票软件
  16. 大学生html5实训报告,大学生实训心得体会范文(精选5篇)
  17. 计算三角形网格的tangent space
  18. 那些年,Java程序员用过的开发工具
  19. 总结一下强大的ES6符号
  20. 【每日一题】快速检索

热门文章

  1. 【汇编语言与计算机系统结构笔记15】子程序设计:调用与返回,保护与恢复寄存器,子程序的参数传递,堆栈平衡,结构伪操作 STRUC
  2. jsp mysql demo_echart通过jsp连接查询mysql的demo - 贪吃蛇学院-专业IT技术平台
  3. ios block常见的错误(二)——循环引用
  4. 局域网中用centos6架设ftp服务器-配置文件说明
  5. 三维点云学习(3)4-Expectation-Maximization (EM)
  6. 十八、AR数据库的关联查询relations之单条数据查询
  7. 与 Netcraft 携手为 GlobalSign 的客户提供先进的保护措施以防止网站遭受恶意入侵和钓鱼攻击...
  8. docker安装sentinel的超简单步骤
  9. php 内存池,内存详解: 详解PHP内存池中的存储层_php
  10. 全国各地 DNS 服务器 IP 总汇