记一次基于卷积神经网络（CNN）的验证码图片识别

前几天搭建好了tensorflow2的环境，今天来试验一下神奇的机器学习。
先简单编写一个java程序，收集了10000多个验证码图片，全部进行人工标注（训练素材点击下载），其中600多个用来检验预测结果。

先声明一下，验证码是从真实网站上爬取的，如下图，验证码中包含大写字母和数字，文字有旋转，背景和前景色是随机变化的，有斑点和曲线以及短划线干扰，字体看着有点像华文仿宋，大家可以根据是否对自己有用选择下载。

所有图片都已经经过人工标注，如以上验证码图片被标记为 2s6h-1586808953525-23a8680c-a80a-4deb-b1ca-a959c73a6c2f.jpg

使用以下代码进行训练，开始运行时要加载所有图片，时间有点长，大概1、2分钟，要耐心等待

# coding:utf-8import numpy as np
import tensorflow as tf#模型文件保存的路径
SAVE_PATH = "E:/tensorflow/vcode-analyzer/"#验证码长宽
IMAGE_WIDTH = 130
IMAGE_HEIGHT = 40#验证码可能出现的字符
number = ['2', '3', '4', '5', '6', '7', '8', '9']
ALPHABET = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'J', 'K', 'L', 'M', 'N', 'P', 'Q', 'R', 'S', 'T', 'U','V', 'W', 'X', 'Y']CHAR_SET = number + ALPHABET
CHAR_SET_LEN = len(CHAR_SET)#验证码长度
MAX_CAPTCHA = 4#训练批次的大小
BATCH_SIZE = 128
EPOCH = 4#每次训练是否将错误记录打印出来
TRAIN_DEBUG = 0def text2vec(text):vector = np.zeros([MAX_CAPTCHA, CHAR_SET_LEN])try:for i, c in enumerate(text):idx = CHAR_SET.index(str(c, encoding = "utf-8").upper())vector[i][idx] = 1.0except:print("exception: " + str(text[0], encoding = "utf-8").upper()+ str(text[1], encoding = "utf-8").upper()+ str(text[2], encoding = "utf-8").upper()+ str(text[3], encoding = "utf-8").upper())return vectordef vec2text(vec):text = []for i, c in enumerate(vec):text.append(CHAR_SET[c])return "".join(text)current_index = 0train_images = []
train_texts = []def load_all_train_data(image_path):global train_imagesglobal train_textsPATH = image_pathtrain_files = tf.data.Dataset.list_files(PATH+'*.jpg')def load_image(image_file, is_train):image = tf.io.read_file(image_file)image = tf.image.decode_jpeg(image)image = tf.image.rgb_to_grayscale(image)return imagetrain_iter = iter(train_files)for x in train_iter:paths = tf.strings.split(x, '\\').numpy()text = tf.strings.substr(paths[len(paths)-1], 0, 4, unit='BYTE', name=None)train_texts.append(text2vec(tf.strings.bytes_split(text).numpy()))train_images.append(load_image(x, True))return def get_next_batch(batch_size=128):global train_imagesglobal current_indexbatch_x = np.zeros([batch_size, IMAGE_HEIGHT, IMAGE_WIDTH, 1])batch_y = np.zeros([batch_size, MAX_CAPTCHA, CHAR_SET_LEN])for i in range(batch_size):if current_index >= len(train_images):current_index = current_index - len(train_images)if current_index < 0:current_index = 0batch_x[i, :] = train_images[current_index]batch_y[i, :] = train_texts[current_index]current_index = current_index + 1return batch_x, batch_ydef crack_captcha_cnn():model = tf.keras.Sequential()model.add(tf.keras.layers.Conv2D(32, (2, 2)))model.add(tf.keras.layers.PReLU())model.add(tf.keras.layers.AveragePooling2D((2, 2)))model.add(tf.keras.layers.Conv2D(64, (3, 3)))model.add(tf.keras.layers.PReLU())model.add(tf.keras.layers.MaxPool2D((2, 2)))model.add(tf.keras.layers.Conv2D(128, (5, 5)))model.add(tf.keras.layers.PReLU())model.add(tf.keras.layers.MaxPool2D((2, 2)))model.add(tf.keras.layers.Flatten())model.add(tf.keras.layers.Dense(MAX_CAPTCHA * CHAR_SET_LEN))model.add(tf.keras.layers.Reshape([MAX_CAPTCHA, CHAR_SET_LEN]))model.add(tf.keras.layers.Softmax())return modeldef train(pat):load_all_train_data(pat)try:model = tf.keras.models.load_model(SAVE_PATH + 'model')except Exception as e:print('#######Exception', e)model = crack_captcha_cnn()model.compile(optimizer='Adam',metrics=['accuracy'],loss='categorical_crossentropy')for times in range(500000):batch_x, batch_y = get_next_batch(BATCH_SIZE)print('times=', times, ' batch_x.shape=',batch_x.shape, ' batch_y.shape=', batch_y.shape)model.fit(batch_x, batch_y, epochs=EPOCH)if TRAIN_DEBUG == 1:v1 = np.argmax(model.predict(batch_x), axis=2)v2 = np.argmax(batch_y, axis=2)vlen = len(v1)for i in range(vlen):if (v1[i] == v2[i]).all():passelse:print("TRAIN_DEBUG: 实际 " + vec2text(v2[i]) + ", 预测 " + vec2text(v1[i]))if 0 == times % 50:print("save model at times=", times)model.save(SAVE_PATH + 'model')def predict(pat):load_all_train_data(pat)model = tf.keras.models.load_model(SAVE_PATH + 'model')success = 0count = 1000for _ in range(count):data_x, data_y = get_next_batch(1)prediction_value = model.predict(data_x)data_y = vec2text(np.argmax(data_y, axis=2)[0])prediction_value = vec2text(np.argmax(prediction_value, axis=2)[0])if data_y.upper() == prediction_value.upper():print("y预测=", prediction_value, "y实际=", data_y, "预测成功。")success += 1else:print("y预测=", prediction_value, "y实际=", data_y, "预测失败。")print("预测", count, "次", "成功率 =", success / count)passif __name__ == "__main__":#传入训练、预测图片集的路径#所有图片命名格式约定为 222s-xxxxxxxxxxxx.jpg#222s为正确验证码,xxx为任意字符train("D:\\projects\\vcode\\imgs-train\\")#train("D:\\projects\\vcode\\imgs-coded\\")predict("D:\\projects\\vcode\\imgs-coded\\")

收敛的很快，大概几百次循环loss就降到了0.1以下，accuracy持续稳定在0.9以上。

save model at times= 300
times= 301  batch_x.shape= (128, 40, 130, 1)  batch_y.shape= (128, 4, 31)
Train on 128 samples
Epoch 1/4
128/128 [==============================] - 0s 656us/sample - loss: 0.1081 - accuracy: 0.9805
Epoch 2/4
128/128 [==============================] - 0s 593us/sample - loss: 0.0164 - accuracy: 0.9941
Epoch 3/4
128/128 [==============================] - 0s 617us/sample - loss: 0.0134 - accuracy: 0.9961
Epoch 4/4
128/128 [==============================] - 0s 570us/sample - loss: 0.0012 - accuracy: 1.0000
times= 302  batch_x.shape= (128, 40, 130, 1)  batch_y.shape= (128, 4, 31)
Train on 128 samples

350次训练后，切换到测试集进行预测

y预测= AX74 y实际= AX74 预测成功。
y预测= UWCB y实际= UWCB 预测成功。
y预测= 6YKS y实际= 6YKS 预测成功。
y预测= DLUT y实际= DLUT 预测成功。
y预测= RK86 y实际= RK86 预测成功。
y预测= YMFV y实际= YMFV 预测成功。
y预测= 9F3K y实际= 9E3K 预测失败。
y预测= JY5D y实际= JY5D 预测成功。
y预测= WT93 y实际= HT93 预测失败。
y预测= G9NG y实际= G9NG 预测成功。
预测 1000 次 成功率 = 0.76

76%的正确率，还不错！要知道，除去加载图片的时间，实际训练的时间还不到1分钟……

可以查看后一篇：发布验证码图片识别服务

记一次基于卷积神经网络（CNN）的验证码图片识别相关推荐

【图像识别】基于卷积神经网络cnn实现银行卡数字识别matlab源码
1 基于卷积神经网络cnn实现银行卡数字识别模型模型参考这里. 2 部分代码 %印刷体识别 clc;clear;close all; addpath('util/'); addpath('data/ ...
基于卷积神经网络 CNN 的猫狗识别详细过程
目录一.卷积神经网络(CNN) 1.1 卷积 1.2 前馈神经网络 1.3 卷积神经网络(CNN) 二.配置环境三.猫狗数据分类建模 3.1 猫狗图像预处理 3.2 猫狗分类的实例--基准模型 3 ...
基于卷积神经网络(CNN)的猫狗识别
目录引言 1.什么是卷积神经网络? 1.1什么是神经网络? 1.2什么是卷积? 2.准备工作 2.1一些知识: 2.2keras 2.3Conv2D 2.4 MaxPooling2D 3.基于卷积神 ...
【图像识别】基于卷积神经网络CNN手写数字识别matlab代码
1 简介针对传统手写数字的随机性,无规律性等问题,为了提高手写数字识别的检测准确性,本文在研究手写数字区域特点的基础上,提出了一种新的手写数字识别检测方法.首先,对采集的手写数字图像进行预处理,由于 ...
基于Tensorflow和CNN实现验证码图片识别
卷积神经网络自从被提出开始,就受到人们的广泛欢迎,它在图像识别.语音识别.自然语言处理任务中扮演着重要的角色,在此基础上衍生出的网络模型更是层出不穷.进行验证码识别时,使用传统的Tesseract O ...
基于卷积神经网络CNN的水果分类预测，卷积神经网络水果等级识别
目录背影卷积神经网络CNN的原理卷积神经网络CNN的定义卷积神经网络CNN的神经元卷积神经网络CNN的激活函数卷积神经网络CNN的传递函数卷积神经网络CNN水果分类预测基本结构主要参 ...
基于卷积神经网络VGG实现水果分类识别
基于卷积神经网络VGG实现水果分类识别一. 前言二. 模型介绍三. 数据处理四. 模型搭建 4.1 定义卷积池化网络 4.2 搭建VGG网络 4.3 参数配置 4.4 模型训练 4.5 绘制l ...
基于卷积神经网络VGG的猫狗识别
!有需要本项目的实验源码的可以私信博主! 摘要:随着大数据时代的到来,深度学习.数据挖掘.图像处理等已经成为了一个热门研究方向.深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超 ...
PyTorch之LeNet-5：利用PyTorch实现最经典的LeNet-5卷积神经网络对手写数字图片识别CNN
PyTorch之LeNet-5:利用PyTorch实现最经典的LeNet-5卷积神经网络对手写数字图片识别CNN 目录训练过程代码设计训练过程代码设计 #PyTorch:利用PyTorch实现 ...
基于卷积神经网络的温室黄瓜病害识别系统
基于卷积神经网络的温室黄瓜病害识别系统 1.研究思路针对温室现场采集的黄瓜病害图像中含有较多光照不均匀和复杂背景等噪声的情况,采用了一种复合颜色特征(combinations of color fe ...

记一次基于卷积神经网络（CNN）的验证码图片识别

记一次基于卷积神经网络（CNN）的验证码图片识别相关推荐

最新文章

热门文章

记一次 基于 卷积神经网络（CNN）的 验证码图片识别

记一次 基于 卷积神经网络（CNN）的 验证码图片识别相关推荐

最新文章

热门文章

记一次基于卷积神经网络（CNN）的验证码图片识别

记一次基于卷积神经网络（CNN）的验证码图片识别相关推荐