实验一:手写数字识别

一、实验目的

利用深度学习实现手写数字识别,当输入一张手写图片后,能够准确的识别出该图片中数字是几。输出内容是0、1、2、3、4、5、6、7、8、9的其中一个。

二、实验原理

(1)采用用全连接神经网络训练
全连接神经网络模型是一种多层感知机(MLP),感知机的原理是寻找类别间最合理、最具有鲁棒性的超平面,感知机最具代表的是SVM支持向量机算法。神经网络同时借鉴了感知机和仿生学,通常来说,动物神经接受一个信号后会发送各个神经元,各个神经元接受输入后根据自身判断,激活产生输出信号后汇总从而实现对信息源实现识别、分类,一个典型的神经网络如下图所示:

上图是典型的全连接神经网络模型(DNN),有的场合也称作深度神经网络,与传统的感知机不同,每个结点和下一层所有结点都有运算关系,这就是名称中‘全连接’的含义,在实践中全连接神经网络通常有多个隐藏层,增加隐藏层可以更好分离数据的特征,但过多的隐藏层也会增加训练时间以及产生过拟合。
在训练全连接神经网络时,先是通过前向传播,得到预测结果,再反向传播去调整模型权重。
(2)反向传播
反向传播根据前向传播产生的损失函数值,沿输出端向至输入端优化每层之间参数,在此过程中运算利用梯度下降法优化参数,神经网络求解参数本质上仍然是规划中求最优解问题,现代机器学习框架如Tensorflow、pytorch、keras将梯度下降法、Booting、Bagging这些优化中常用技巧封装起来,开发者只要专注于数据建模即可。
(3)训练mnist手写数字识别
利用交叉熵作为损失函数实现对minist数据集的识别,minist数据集是手写数字的图像样本,DNN识别图像的过程就是把图像正确的归为0-9这10个数字,所以这是一个分类算法的实现。

三、实验内容

【代码下载-实现不易,顺便star一下啦】https://github.com/823316627bandeng/TensorFlow2_keras_Demo-
(1)训练模型
数据集:采用TensorFlow2.3的TensorFlow-datasets内置的mnist数据集
神经网络:全连接
损失函数:分类交叉熵
优化器:Adam
评价准则:准确率
Epochs:100
(2)测试模型
测试集:采用TensorFlow2.3的TensorFlow-datasets内置的mnist数据集,形状改为28*28
(3)环境

Python 3.8
TensorFlow 2,3
Tensorflow_datasets 2.1
scipy
numpy
PIL
matplotlib
scipy

四、实验过程

源码下载
(1)导入包

import osimport scipy
import tensorflow as tf
import tensorflow_datasets as tfds
import matplotlib.pyplot as plt
import numpy as np
from PIL import Image

(2)导入Mnist数据集并标准化数据

# 载入mnist数据集
dataset, metadata = tfds.load("mnist", as_supervised=True, with_info=True)
mnist = tf.keras.datasets.mnist(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0
x_test, y_test = x_test / 255.0, y_test / 255.0

(3)搭建全连接模型

 model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),tf.keras.layers.Dense(128, activation=tf.nn.relu),tf.keras.layers.Dropout(0.2),tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

(4)训练模型并保存模型权重

  # 模型保存路径checkpoint_path = "model/cp.ckpt"checkpoint_dir = os.path.dirname(checkpoint_path)# 创建一个保存模型权重的回调cp_callback = tf.keras.callbacks.ModelCheckpoint(filepath=checkpoint_path,save_weights_only=True,verbose=1)# 训练模型的配置model.compile(optimizer='adam',loss='sparse_categorical_crossentropy', metrics=['accuracy'])# 开始训练模型model.fit(x_train, y_train,validation_data=(x_test, y_test),epochs=100,callbacks=[cp_callback])

(5)测试模型

    path = './test_pic/mnist_train_0.jpg'im = Image.open(path)plt.imshow(im)plt.show()pic = np.array(img2vec(path))print("\n识别结果:\n{}".format(np.argmax(model.predict(pic.reshape(1, 28, 28)))))print()

(6)工具函数,把图片统一大小并二值化

def img2vec(path):'''jpg转换为向量Args:path: the path of your pic'''try:im = Image.open(path).convert('L')im = im.resize((28, 28))tmp = np.array(im)vec = tmp.ravel()return vecexcept:print("图片不存在")

五、实验分析

(1)训练过程
Epoch=100,训练准确率能达到99.6%

Epoch 98/100
1850/1875 [============================>.] - ETA: 0s - loss: 0.0117 - accuracy: 0.9962
Epoch 00098: saving model to model/cp.ckpt
1875/1875 [==============================] - 3s 1ms/step - loss: 0.0118 - accuracy: 0.9962 - val_loss: 1.9510 - val_accuracy: 0.0000e+00
Epoch 99/100
1867/1875 [============================>.] - ETA: 0s - loss: 0.0121 - accuracy: 0.9962
Epoch 00099: saving model to model/cp.ckpt
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0121 - accuracy: 0.9962 - val_loss: 2.0950 - val_accuracy: 0.0000e+00
Epoch 100/100
1863/1875 [============================>.] - ETA: 0s - loss: 0.0113 - accuracy: 0.9961
Epoch 00100: saving model to model/cp.ckpt
1875/1875 [==============================] - 3s 1ms/step - loss: 0.0113 - accuracy: 0.9961 - val_loss: 1.8876 - val_accuracy: 0.0000e+00

(2)测试模型

保存mnist的200张图片作为预测使用,能准确预测出图片中的数字。

六、实验体会与心得

该手写数字识别是入门深度学习最简单的例子,数据集小,实现简单,通过对一个这个例子的实现,明白了深度学习的计算步骤。以及实现的流程。可以入门更难的例子。

【深度学习】手写数字识别Tensorflow2实验报告相关推荐

  1. 深度学习——手写数字识别

    深度学习--手写数字问题 前不久入门学习了Tensorflow深度学习框架,了解一下什么是神经网络和Tensorflow的简单使用.下面通过Tensorflow框架来建造神经网络模型来对手写数字进行训 ...

  2. 百度深度学习--手写数字识别之数据处理

    文章目录 概述 前提条件 读入数据并划分数据集 扩展阅读:为什么学术界的模型总在不断精进呢? 训练样本乱序.生成批次数据 校验数据有效性 机器校验 人工校验 封装数据读取与处理函数 异步数据读取 概述 ...

  3. 深度学习——手写数字识别底层实现

    内容再要 手写数字识别,早在20世纪前,杨立昆(Yann LeCun)就完成这项工作,并在1980年左右利用卷积神经网络完善了手写数字识别 代码实现 import tensorflow as tf i ...

  4. 【深度学习】猫狗识别TensorFlow2实验报告

    实验二:猫狗识别 一.实验目的 利用深度学习实现猫狗动物识别,采用Kaggle提供的公开数据集,训练深度学习模型,对测试集猫狗中的图片准确分类.通过该实验掌握深度学习中基本的CV处理过程. 二.实验原 ...

  5. python-机器学习-手写数字识别

    机器学习简单的来说,分为监督式学习和无监督式学习: 对于监督式学习就是需要人为的来告诉计算机这是什么,需要我们给他一个标签(答案). 无监督式学习就是不需要我们给出标签(答案). 图像识别(Image ...

  6. 机器学习之手写数字识别大作业报告

    写在前面 在选择特征的时候,曾纠结过是用颜色矩.像素值还是图片卷积过后的值作为特征,我选择了后者,因为个人觉得手写数字识别相对于水质颜色识别来说,更关注图片的二维结构信息,如果用颜色矩或者像素值作为特 ...

  7. python手写字体程序_深度学习---手写字体识别程序分析(python)

    我想大部分程序员的第一个程序应该都是"hello world",在深度学习领域,这个"hello world"程序就是手写字体识别程序. 这次我们详细的分析下手 ...

  8. 深度学习 手写字体识别

    数据集介绍: mnist数据集使用tensorflow封装好的数据(包含6000张训练数据,1000张测试数据),图片大小为28x28. 在神经网络的结构上,一方面需要使用激活函数去线性化.另一方面需 ...

  9. 基于Python的BP网络实现手写数字识别

    资源下载地址:https://download.csdn.net/download/sheziqiong/86790047 资源下载地址:https://download.csdn.net/downl ...

最新文章

  1. Apache Common HttpClient使用之七种武器
  2. linux ctime 时间戳,Linux时间戳atime ctime mtime区别及相关命令
  3. 从FM推演各深度学习CTR预估模型
  4. 那个抗血栓机器人_美国DJO抗血栓压力袜
  5. JavaScript 验证 API中的setCustomValidity()方法
  6. 机顶盒怎样配置服务器信息,网络机顶盒 桌面配置服务器
  7. app开发的三大技术框架
  8. 在计算机英语中 input的意思是,计算机英语词汇解释
  9. pytorch学习6:norm函数--范数的理解和计算
  10. VC 使用msxml6.dll动态链接库中的函数读写XML文件
  11. snaker并行任务示例
  12. Kotlin细节十五:作用域函数与 this it 关键字
  13. Linux C 网络编程 仿照网盘的功能
  14. 切图教程,app切图命名总结
  15. Linux常用操作和命令
  16. 科达实战应用平台服务器ip,H3C ME5000与科达MCU KDV8000A级联的互通案例配置
  17. CPU 主频,核数 参数解读 物理CPU,逻辑CPU,物理核 概念辨析
  18. 一行代码解决约瑟夫问题(我要开始装B了)
  19. 网址-m3u8-ts-多线程-mp4
  20. VINS技术路线与代码详解

热门文章

  1. SpringBoot程序排除@Configuration配置类
  2. 【python量化交易学习】从tushare获取股票交易数据,存入后再从mysql或excel读取数据,筛选股票,用pyecharts画出K线图。
  3. 五一游天坛,体验超震撼的大像素全景
  4. word使用:默认粘贴方式的更改
  5. 自己动手写H3C校园网登录客户端(Linux平台版)
  6. 2012-2-15雨
  7. java实现OCR图文识别Tess4j,高准确率高效率
  8. 如何将数据从旧PC传输到新Mac
  9. 我的世界服务器自动刷矿机,我的世界刷矿机MOD
  10. SQLMAP-POST注入