教你如何用Keras搭建分类神经网络
摘要:本文主要通过Keras实现了一个分类学习的案例,并详细介绍了MNIST手写体识别数据集。
本文分享自华为云社区《[Python人工智能] 十七.Keras搭建分类神经网络及MNIST数字图像案例分析》,作者: eastmount 。
一.什么是分类学习
1.Classification
回归问题,它预测的是一个连续分布的值,例如房屋的价格、汽车的速度、Pizza的价格等。而当我们遇到需要判断一张图片是猫还是狗时,就不能再使用回归解决了,此时需要通过分类学习,把它分成计算机能够识别的那一类(猫或狗)。
如上图所示,通常来说,计算机处理的东西和人类有所不同,无论是声音、图片还是文字,它们都只能以数字0或1出现在计算机神经网络里。神经网络看到的图片其实都是一堆数字,对数字的加工处理最终生成另一堆数字,并且具有一定认知上的意义,通过一点点的处理能够得知计算机到底判断这张图片是猫还是狗。
分类(Classification) 属于有监督学习中的一类,它是数据挖掘、机器学习和数据科学中一个重要的研究领域。分类模型类似于人类学习的方式,通过对历史数据或训练集的学习得到一个目标函数,再用该目标函数预测新数据集的未知属性。分类模型主要包括两个步骤:
- 训练。给定一个数据集,每个样本都包含一组特征和一个类别信息,然后调用分类算法训练模型。
- 预测。利用生成的模型对新的数据集(测试集)进行分类预测,并判断其分类结果。
通常为了检验学习模型的性能会使用校验集。数据集会被分成不相交的训练集和测试集,训练集用来构造分类模型,测试集用来检验多少类标签被正确分类。
那么,回归和分类有什么区别呢?
分类和回归都属于监督学习,它们的区别在于:回归是用来预测连续的实数值,比如给定了房屋面积来预测房屋价格,返回的结果是房屋价格;而分类是用来预测有限的离散值,比如判断一个人是否患糖尿病,返回值是“是”或“否”。也就是说,明确对象属于哪个预定义的目标类,预定义的目标类是离散值时为分类,连续值时为回归。
2.MNIST
MNIST是手写体识别数据集,它是非常经典的一个神经网络示例。MNIST图片数据集包含了大量的数字手写体图片,如下图所示,我么可以尝试用它进行分类实验。
MNIST数据集是含标注信息的,上图分别表示数字5、0、4和1。该数据集共包含三部分:
- 训练数据集:55,000个样本,mnist.train
- 测试数据集:10,000个样本,mnist.test
- 验证数据集:5,000个样本,mnist.validation
通常,训练数据集用来训练模型,验证数据集用来检验所训练出来的模型的正确性和是否过拟合,测试集是不可见的(相当于一个黑盒),但我们最终的目的是使得所训练出来的模型在测试集上的效果(这里是准确性)达到最佳。
如下图所示,数据是以该形式被计算机所读取,比如28*28=784个像素点,白色的地方都是0,黑色的地方表示有数字的,总共有55000张图片。
MNIST数据集中的一个样本数据包含两部分内容:手写体图片和对应的label。这里我们用xs和ys分别代表图片和对应的label,训练数据集和测试数据集都有xs和ys,使用mnist.train.images和mnist.train.labels表示训练数据集中图片数据和对应的label数据。
如下图所示,它表示由2828的像素点矩阵组成的一张图片,这里的数字784(2828)如果放在我们的神经网络中,它就是x输入的大小,其对应的矩阵如下图所示,类标label为1。
最终MNIST的训练数据集形成了一个形状为55000*784位的tensor,也就是一个多维数组,第一维表示图片的索引,第二维表示图片中像素的索引(tensor中的像素值在0到1之间)。
这里的y值其实是一个矩阵,这个矩阵有10个位置,如果它是1的话,它在1的位置(第2个数字)上写1,其他地方写0;如果它是2的话,它在2的位置(第3个数字)上写1,其他位置为0。通过这种方式对不同位置的数字进行分类,例如用[0,0,0,1,0,0,0,0,0,0]来表示数字3,如下图所示。
mnist.train.labels是一个55000*10的二维数组,如下图所示。它表示55000个数据点,第一个数据y表示5,第二个数据y表示0,第三个数据y表示4,第四个数据y表示1。
知道了MNIST数据集的组成,以及x和y具体的含义,我们就开始编写Keras吧!
二.Keras实现MNIST分类
本文通过Keras搭建一个分类神经网络,再训练MNIST数据集。其中X表示图片,28*28,y对应的是图像的标签。
第一步,导入扩展包。
import numpy as np
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense, Activation
from keras.optimizers import RMSprop
第二步,载入MNIST数据及预处理。
- X_train.reshape(X_train.shape[0], -1) / 255
将每个像素点进行标准化处理,从0-255转换成0-1的范围。 - np_utils.to_categorical(y_train, nb_classes=10)
调用up_utils将类标转换成10个长度的值,如果数字是3,则会在对应的地方标记为1,其他地方标记为0,即{0,0,0,1,0,0,0,0,0,0}。
由于MNIST数据集是Keras或TensorFlow的示例数据,所以我们只需要下面一行代码,即可实现数据集的读取工作。如果数据集不存在它会在线下载,如果数据集已经被下载,它会被直接调用。
# 下载MNIST数据
# X shape(60000, 28*28) y shape(10000, )
(X_train, y_train), (X_test, y_test) = mnist.load_data()# 数据预处理
X_train = X_train.reshape(X_train.shape[0], -1) / 255 # normalize
X_test = X_test.reshape(X_test.shape[0], -1) / 255 # normalize# 将类向量转化为类矩阵 数字 5 转换为 0 0 0 0 0 1 0 0 0 0 矩阵
y_train = np_utils.to_categorical(y_train, num_classes=10)
y_test = np_utils.to_categorical(y_test, num_classes=10)
第三步,创建神经网络层。
前面介绍创建神经网络层的方法是定义之后,利用add()添加神经层。
- model = Sequential()
- model.add(Dense(output_dim=1, input_dim=1))
而这里采用另一种方法,在Sequential()定义的时候通过列表添加神经层。同时需要注意,这里增加了神经网络激励函数并调用RMSprop加速神经网络。
- from keras.layers import Dense, Activation
- from keras.optimizers import RMSprop
该神经网络层为:
- 第一层为Dense(32, input_dim=784),它将传入的784转换成32个输出
- 该数据加载一个激励函数Activation(‘relu’),并转换成非线性化数据
- 第二层为Dense(10),它输出为10个单位。同时Keras定义神经层会默认其输入为上一层的输出,即32(省略)
- 接着加载一个激励函数Activation(‘softmax’),用于分类
# Another way to build your neural net
model = Sequential([Dense(32, input_dim=784), # 输入值784(28*28) => 输出值32Activation('relu'), # 激励函数 转换成非线性数据Dense(10), # 输出为10个单位的结果Activation('softmax') # 激励函数 调用softmax进行分类])# Another way to define your optimizer
rmsprop = RMSprop(lr=0.001, rho=0.9, epsilon=1e-08, decay=0.0) #学习率lr# We add metrics to get more results you want to see
# 激活神经网络
model.compile(optimizer = rmsprop, # 加速神经网络loss = 'categorical_crossentropy', # 损失函数metrics = ['accuracy'], # 计算误差或准确率)
第四步,神经网络训练及预测。
print("Training")
model.fit(X_train, y_train, nb_epoch=2, batch_size=32) # 训练次数及每批训练大小print("Testing")
loss, accuracy = model.evaluate(X_test, y_test)print("loss:", loss)
print("accuracy:", accuracy)
完整代码:
# -*- coding: utf-8 -*-
"""
Created on Fri Feb 14 16:43:21 2020
@author: Eastmount CSDN YXZ
O(∩_∩)O Wuhan Fighting!!!
"""
import numpy as np
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense, Activation
from keras.optimizers import RMSprop#---------------------------载入数据及预处理---------------------------
# 下载MNIST数据
# X shape(60000, 28*28) y shape(10000, )
(X_train, y_train), (X_test, y_test) = mnist.load_data()# 数据预处理
X_train = X_train.reshape(X_train.shape[0], -1) / 255 # normalize
X_test = X_test.reshape(X_test.shape[0], -1) / 255 # normalize# 将类向量转化为类矩阵 数字 5 转换为 0 0 0 0 0 1 0 0 0 0 矩阵
y_train = np_utils.to_categorical(y_train, num_classes=10)
y_test = np_utils.to_categorical(y_test, num_classes=10)#---------------------------创建神经网络层---------------------------
# Another way to build your neural net
model = Sequential([Dense(32, input_dim=784), # 输入值784(28*28) => 输出值32Activation('relu'), # 激励函数 转换成非线性数据Dense(10), # 输出为10个单位的结果Activation('softmax') # 激励函数 调用softmax进行分类])# Another way to define your optimizer
rmsprop = RMSprop(lr=0.001, rho=0.9, epsilon=1e-08, decay=0.0) #学习率lr# We add metrics to get more results you want to see
# 激活神经网络
model.compile(optimizer = rmsprop, # 加速神经网络loss = 'categorical_crossentropy', # 损失函数metrics = ['accuracy'], # 计算误差或准确率)#------------------------------训练及预测------------------------------
print("Training")
model.fit(X_train, y_train, nb_epoch=2, batch_size=32) # 训练次数及每批训练大小
print("Testing")
loss, accuracy = model.evaluate(X_test, y_test)print("loss:", loss)
print("accuracy:", accuracy)运行代码,首先会下载MNIT数据集。
Using TensorFlow backend.
Downloading data from https://s3.amazonaws.com/img-datasets/mnist.npz
11493376/11490434 [==============================] - 18s 2us/step
接着输出两次训练的结果,可以看到误差不断减小、正确率不断增大。最终测试输出的误差loss为“0.185575”,正确率为“0.94690”。
如果读者想更直观地查看我们数字分类的图形,可以定义函数并显示。
此时的完整代码如下所示:
# -*- coding: utf-8 -*-
"""
Created on Fri Feb 14 16:43:21 2020
@author: Eastmount CSDN YXZ
O(∩_∩)O Wuhan Fighting!!!
"""
import numpy as np
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense, Activation
from keras.optimizers import RMSprop
import matplotlib.pyplot as plt
from PIL import Image#---------------------------载入数据及预处理---------------------------
# 下载MNIST数据
# X shape(60000, 28*28) y shape(10000, )
(X_train, y_train), (X_test, y_test) = mnist.load_data()#------------------------------显示图片------------------------------
def show_mnist(train_image, train_labels):n = 6m = 6fig = plt.figure()for i in range(n):for j in range(m):plt.subplot(n,m,i*n+j+1)index = i * n + j #当前图片的标号img_array = train_image[index]img = Image.fromarray(img_array)plt.title(train_labels[index])plt.imshow(img, cmap='Greys')plt.show()show_mnist(X_train, y_train)# 数据预处理
X_train = X_train.reshape(X_train.shape[0], -1) / 255 # normalize
X_test = X_test.reshape(X_test.shape[0], -1) / 255 # normalize# 将类向量转化为类矩阵 数字 5 转换为 0 0 0 0 0 1 0 0 0 0 矩阵
y_train = np_utils.to_categorical(y_train, num_classes=10)
y_test = np_utils.to_categorical(y_test, num_classes=10)#---------------------------创建神经网络层---------------------------
# Another way to build your neural net
model = Sequential([Dense(32, input_dim=784), # 输入值784(28*28) => 输出值32Activation('relu'), # 激励函数 转换成非线性数据Dense(10), # 输出为10个单位的结果Activation('softmax') # 激励函数 调用softmax进行分类])# Another way to define your optimizer
rmsprop = RMSprop(lr=0.001, rho=0.9, epsilon=1e-08, decay=0.0) #学习率lr# We add metrics to get more results you want to see
# 激活神经网络
model.compile(optimizer = rmsprop, # 加速神经网络loss = 'categorical_crossentropy', # 损失函数metrics = ['accuracy'], # 计算误差或准确率)#------------------------------训练及预测------------------------------
print("Training")
model.fit(X_train, y_train, nb_epoch=2, batch_size=32) # 训练次数及每批训练大小
print("Testing")
loss, accuracy = model.evaluate(X_test, y_test)print("loss:", loss)
print("accuracy:", accuracy)
点击关注,第一时间了解华为云新鲜技术~
教你如何用Keras搭建分类神经网络相关推荐
- 不到 200 行代码,教你如何用 Keras 搭建生成对抗网络(GAN)
不到 200 行代码,教你如何用 Keras 搭建生成对抗网络(GAN) 生成对抗网络(Generative Adversarial Networks,GAN)最早由 Ian Goodfello ...
- Keras——用Keras搭建分类神经网络
文章目录 1.前言 2.用Keras搭建分类神经网络 2.1.导入必要模块 2.2.数据预处理 2.3.搭建模型 2.4.激活模型 2.5.训练+测试 1.前言 今天用 Keras 来构建一个分类神经 ...
- [Python人工智能] 十七.Keras搭建分类神经网络及MNIST数字图像案例分析
从本专栏开始,作者正式研究Python深度学习.神经网络及人工智能相关知识.前一篇文章详细讲解了Keras环境搭建.入门基础及回归神经网络案例.本篇文章将通过Keras实现分类学习,以MNIST数字图 ...
- Keras——用Keras搭建线性回归神经网络
文章目录 1.前言 2.用Keras搭建线性回归神经网络 2.1.导入必要模块 2.2.创建数据 2.3.搭建模型 2.4.激活模型 2.5.训练+测试 1.前言 神经网络可以用来模拟回归问题 (re ...
- Python-深度学习-学习笔记(13):keras搭建卷积神经网络(对二维数据进行一维卷积)
Python-深度学习-学习笔记(13):keras搭建卷积神经网络(对二维数据进行一维卷积) 卷积神经网络进行图像分类是深度学习关于图像处理的一个应用,卷积神经网络的优点是能够直接与图像像素进行卷积 ...
- cnn神经网络可以用于数据拟合吗_使用Keras搭建卷积神经网络进行手写识别的入门(包含代码解读)...
本文是发在Medium上的一篇博客:<Handwritten Equation Solver using Convolutional Neural Network>.本文是原文的翻译.这篇 ...
- 30行代码就可以实现看图识字!python使用tensorflow.keras搭建简单神经网络
文章目录 搭建过程 1. 引入必需的库 2. 引入数据集 3. 搭建神经网络层 4. 编译神经网络模型 5. 训练模型 效果测试 大概几个月前,神经网络.人工智能等概念在我心里仍高不可攀,直到自己亲身 ...
- 用Keras搭建一个神经网络实现糖尿病检测
这几天一直在弄导师交代的数据分析任务,从此博客中收到很大启发,原来的博客地址:搭建神经网络 教程概述 这里不需要编写太多的代码,不过我们将一步步慢慢地告诉你怎么以后怎么创建自己的模型. 教程将会涵盖以 ...
- 利用keras搭建AlexNet神经网络识别kaggle猫狗图片
AlexNet结构 keras代码 from PIL import Image import numpy as np from keras.utils import to_categoricalpat ...
最新文章
- linux系统无法挂载U盘
- 【spring】专项配置文件的使用
- 搞科研不如当老师香?南科大助理教授“跳槽”深圳中学当老师
- 【面试题】python怎么合并两个字典
- 你真的会二分查找吗?
- 工业机器人什么情况下会出现奇点_功夫机器人周全:复合作业机器人规模应用的奇点有多远?...
- Configure Javadoc and Source Code for JRE in Eclipse JDT
- 喜大普奔,VS Code 开启远程开发新时代!
- python 【递归 及 二分法】
- 开源嵌入式linux,移植开源软件到嵌入式Linux系统技术攻略
- unity学习笔记-uniwebview3的使用以及一些补充(视频问题已解决)
- Linux下LOIC的下载和应用
- vivo nex免Root使用空调狗
- 运动控制系统常用传感器介绍
- ConstraintLayout比重和宽高比这样用
- 1.4 安装Kali Linux
- 百度API---详解
- 二叉树基础题(五):二叉树的下一个节点最低公共祖先节点
- TBase数据库开源后重磅升级,复杂查询性能最高提升十倍
- 基于python的可视化成绩分析