1.网络模型

方案，如图所示。

先对图片，用hu矩进行特征提取，每个图片产生7个特征值。这7个特征值作为数据，再加上一个标签值。然后送入BP神经网络中，进行模型的训练。模型训练好后，就可以使用模型，对一个新的图片，进行分类识别了。

2.数据集制作

图片数据集是NEU surface defect database，东北大学热轧带钢表面缺陷数据集，该数据集是东北大学的宋克臣等老师收集的。

数据集收集了夹杂（ inclusion ）、划痕（ scratches ）、压入氧化皮（ rolled-inscale ）、裂纹（ cracks ）、麻点（ pitted ）和斑块（ patches ）6种缺陷，每种缺陷300张，图像尺寸为200×200。

我们选取了裂纹（ cracks ）、夹杂（ inclusion ）和麻点（ pitted ）三类缺陷各100副图像，制作数据集。使用Hu不变矩进行特征提取后，就有了300个样本的特征。240个作为训练集，60个作为验证集。

其中，裂纹类图片的标签，记为0，夹杂类图片的标签，记为1，麻点类图片的标签，记为2。（后面会进行one-hot操作，因此记为数字几并不重要，注意对应关系即可）

然后使用Hu矩对这300幅图片，继续特征提取，得到hu值。就制作成了数据集。（但该数据集并不好，因为只含有缺陷图像，不含无缺陷的图像。也就是数据集中只有正例，没有反例。当训练好模型后，在测试模型时，用一个无缺陷图片，则模型会把它分类成三类缺陷中概率最大的那一类。）

#Hu不变矩代码 python+opencv
def Hu_moments(img):'''opencv_python自带求矩以及不变矩的函数:param img: 灰度图像，对于二值图像来说就只有两个灰度0和255:return: 返回以10为底对数化后的hu不变矩'''moments = cv2.moments(img)  # 返回的是一个字典，三阶及以下的几何矩（mpq）、中心矩(mupq)和归一化的矩(nupq)humoments = cv2.HuMoments(moments)  # 根据几何矩（mpq）、中心矩(mupq)和归一化的矩(nupq)计算出hu不变矩# 因为直接计算出来的矩可能很小或者很大，因此取对数好比较,这里的对数底数为e,通过对数除法的性质将其转换为以10为底的对数humoment = (np.log(np.abs(humoments))) / np.log(10)humoment = np.reshape(humoment,(1,7))[0]return humoment
if __name__ == '__main__':img = cv2.imread('3.png', 0) #读入图片#对于300幅图片求hu值的操作，笔者建议读者写代码，依次读入文件下的所有图片，求hu值，并把值写入hu.csv文件中sys_humoments = hu_moments(img)print('Hu不变矩为：\n', sys_humoments)

另外，观察这7个hu值的数据，发现有些数据数量差别有些大，量大的可能对结果有更大的影响，因此，可以对数据先做归一化处理，消除数值本身量度大小对模型的影响。(笔者并未做归一化处理，建议读者可以做一下，而且建议使用Z-score标准化方法，因其适合分类问题。)

3.模型训练、保存、加载和使用

a.这里专门定义了一个数据处理类DealDataset，用来把自己的数据加载，处理成DataLoader类需要的格式。

b.因为使用了交叉熵损失函数(Cross Entropy)，包含了激活和one-hot操作做，所以模型的最后输出不做激活，不做one-hot.

c.模型的保存和加载使用

torch.save(model, 'BPnet.pt') #保存训练好的模型
model_dict=torch.load('BPnet.pt')#加载训练好的模型'''
用一个数据，测试模型，看其分类结果
'''
array = [-2.98191252,-9.420647126,-12.1779162,-12.69555161,-25.77957309,-17.64040682,-25.14359491]
# list 转 numpy
#np.array(array)#  numpy转化为tensor :b = torch.from_numpy(a)     b=torch.Tensor(a) #
test = torch.Tensor(array)
print(test)
pre = model_dict(test)
print(pre)
out = pre.argmax(dim=1)  # 取出预测的最大值的索引，从0开始，所以0是第一类
print(out)
m = int(out)
print(m)  #输出哪一类对应的类别标签（0，1，2）

全部代码（bp网络由pytorch框架构建）

import numpy as np
import torchfrom torch import nn
from torch.autograd import Variableimport torch.optim as optim
import torch.nn.functional as F
import pandas as pd
import matplotlib.pyplot as plt
import randomfrom torch.utils.data import Dataset, DataLoader # 该接口主要用来将自定义的数据读取接口的输出或者PyTorch已有的数据读取接口的输入按照batch size封装成Tensor
from torch.utils.data import random_split# Step 1:============================准备数据===================class DealDataset(Dataset):"""加载数据、把数据转化为DataLoader类需要的格式，都可以在这里完成"""def __init__(self):xy = np.loadtxt('./hu.csv', delimiter=',', dtype=np.float32)  # 使用numpy读取数据self.x_data = torch.from_numpy(xy[:, 0:-1])self.y_data = torch.from_numpy(xy[:, -1]).long()self.len = xy.shape[0]def __getitem__(self, index):return self.x_data[index], self.y_data[index]def __len__(self):return self.len# https: // blog.csdn.net / zw__chen / article / details / 82806900# Step 2:============================定义模型===================
# 定义一个类，继承自 torch.nn.Module，torch.nn.Module是callable的类
# 在整个类里面重新定义一个标准的BP全连接神经网络，网络一共是三层（算上输入层）
# 其中输入层7个节点，输出层是3个节点，隐藏层是5个节点。
# 我们使用了Relu的激活函数，而不是sigmoid激活函数
# 整个子类需要重写forward函数，data = DealDataset()# 输入层4个节点，隐藏层7个，输出层3个(100,010,001三类)
class Net(torch.nn.Module):def __init__(self):super(Net,self).__init__()self.linear1 = torch.nn.Linear(7,5)self.linear2 = torch.nn.Linear(5,3)def forward(self,x):x = x.view(-1,7) # 改变张量形状。把输入展开成若干行，7列x = F.leaky_relu(self.linear1(x))return self.linear2(x) #最后一层不做激活，因为下一步输入到交叉损失函数中，交叉熵包含了激活层# 创建和实例化一个整个模型类的对象
model = Net()# 原文链接：https://blog.csdn.net/t18438605018/article/details/122137737# 打印出整个模型
#print(model)# Step 3:============================定义损失函数和优化器===================
# 定义 loss 函数，这里用的是交叉熵损失函数(Cross Entropy)，包含了激活层和one-hot操作做，所以模型的最后输出不做激活，不做one-hot.# 我们优先使用随机梯度下降，lr是学习率: 0.1criterion = torch.nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01) #, momentum= 0.5train_set, test_set = random_split(data,lengths=[240, 60])  #300个样本，按8:2划分训练集和验证集train_data = DataLoader(train_set, batch_size=4, shuffle=False)  # 训练数据
test_data = DataLoader(test_set, batch_size=4, shuffle=False)  # 测试数据# Step 4:============================开始训练网络===================
# 为了实时观测效果，我们每一次迭代完数据后都会，用模型在测试数据上跑一次，看看此时迭代中模型的效果。
# 用数组保存每一轮迭代中，训练的损失值和精确度，也是为了通过画图展示出来。
train_losses = []
train_acces = []
# 用数组保存每一轮迭代中，在测试数据上测试的损失值和精确度，也是为了通过画图展示出来。
eval_losses = []
eval_acces = []for e in range(100):# 4.1==========================训练模式==========================train_loss = 0train_acc = 0model.train()   # 将模型改为训练模式# 每次迭代都是处理一个小批量的数据，batch_size是64for im, label in train_data:im = Variable(im)label = Variable(label)# 计算前向传播，并且得到损失函数的值out = model(im)loss = criterion(out, label)# 反向传播，记得要把上一次的梯度清0，反向传播，并且step更新相应的参数。optimizer.zero_grad()loss.backward()optimizer.step()# 记录误差train_loss += loss.item()# 计算分类的准确率out_t = out.argmax(dim=1) #取出预测的最大值的下标索引，从0开始num_correct = (out_t == label).sum().item()acc = num_correct / im.shape[0]train_acc += acctrain_losses.append(train_loss / len(train_data))train_acces.append(train_acc / len(train_data))# 4.2==========================每次进行完一个训练迭代，就去测试一把看看此时的效果==========================# 在测试集上检验效果eval_loss = 0eval_acc = 0model.eval()  # 将模型改为预测模式# 每次迭代都是处理一个小批量的数据，batch_size是128for im, label in test_data:im = Variable(im)  # torch中训练需要将其封装即Variable，此处封装像素即784label = Variable(label)  # 此处为标签out = model(im)  # 经网络输出的结果loss = criterion(out, label)  # 得到误差# 记录误差eval_loss += loss.item()# 记录准确率out_t = out.argmax(dim=1)  # 取出预测的最大值的索引num_correct = (out_t == label).sum().item()  # 判断是否预测正确acc = num_correct / im.shape[0]  # 计算准确率eval_acc += acceval_losses.append(eval_loss / len(test_data))eval_acces.append(eval_acc / len(test_data))print('epoch: {}, Train Loss: {:.6f}, Train Acc: {:.6f}, Eval Loss: {:.6f}, Eval Acc: {:.6f}'.format(e, train_loss / len(train_data), train_acc / len(train_data),eval_loss / len(test_data), eval_acc / len(test_data)))torch.save(model, 'BPnet.pt')
model_dict=torch.load('BPnet.pt')
array = [-2.98191252,-9.420647126,-12.1779162,-12.69555161,-25.77957309,-17.64040682,-25.14359491]
# list 转 numpy
#np.array(array)#  numpy转化为tensor :b = torch.from_numpy(a)     b=torch.Tensor(a) #
test = torch.Tensor(array)
print(test)
pre = model_dict(test)
print(pre)
out = pre.argmax(dim=1)  # 取出预测的最大值的索引，从0开始，所以0是第一类
print(out)
m = int(out)
print(m)  #输出哪一类对应的类别标签（0，1，2）plt.title('train loss')
plt.plot(np.arange(len(train_losses)), train_losses)
plt.plot(np.arange(len(train_acces)), train_acces)
plt.title('train acc')
plt.plot(np.arange(len(eval_losses)), eval_losses)
plt.title('test loss')
plt.plot(np.arange(len(eval_acces)), eval_acces)
plt.title('test acc')
plt.show()

如果读者需要hu.csv文件和代码，可评论区留言留下邮箱！

感谢大家支持，给笔者一个关注吧！

如果读者希望使用TensorFlow框架，可参考笔者上篇博客：
特征提取+BP神经网络，实现对图像的分类

Hu不变矩+BP神经网络，实现对图像的分类（pytorch实现）相关推荐

Python实现BP神经网络ANN单隐层分类模型项目实战
说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 1.项目背景 BP(back propagation)神经网络是1986年由R ...
Hu不变矩原理及opencv实现
http://blog.csdn.net/qq_26898461/article/details/47123405 几何矩是由Hu(Visual pattern recognition by mome ...
【图像处理】——Python实现图像特征提取BP神经网络实现图像二分类
目录一.图像特征提取二.BP实现图像二分类 1.输入层.隐层.输出层结点个数设置 (1)one hot码(假设是n分类问题) (2)一个输出,输出层结点为1 一.图像特征提取图像具有灰度特征.G ...
bp神经网络图像特征提取,一文搞定bp神经网络
本人新手,在做BP神经网络的时候遇到了一个问题 5 不知你是不是用matlab的神经网络工具箱,因为一般神经网络都是成批处理的,每一次调整都会综合所有样本的误差进行调整,而不是一类一类图片的去调整,所 ...
机器学习图像特征提取—Hu矩（Hu不变矩）原理及代码
目录 1 矩的概念 2 Hu不变矩 3 利用opencv-python计算Hu矩 1 矩的概念图像识别的一个核心问题是图像的特征提取,简单描述即为用一组简单的数据(图像描述量)来描述整个图像,这组数 ...
bp神经网络图像特征提取,BP神经网络图像识别
BP神经网络的原理的BP什么意思人工神经网络有很多模型,但是日前应用最广.基本思想最直观.最容易被理解的是多层前馈神经网络及误差逆传播学习算法(ErrorBack-Prooaeation),简称为B ...
基于神经网络的文字识别,神经网络如何识别图像
ocr文字识别系统 . OCR软件OCR(OpticalCharacterRecognition)软件是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗.亮的模式确定其形状,然后用字符 ...
BP神经网络公式推导及实现(MNIST)
BP神经网络的基础介绍见:http://blog.csdn.net/fengbingchun/article/details/50274471,这里主要以公式推导为主. BP神经网络又称为误差反向传播 ...
BP神经网络与卷积神经网络（CNN）
BP神经网络与卷积神经网络(CNN) 1.BP神经网络 1.1 神经网络基础神经网络的基本组成单元是神经元.神经元的通用模型如图 1所示,其中常用的激活函数有阈值函数.sigmoid函数和双曲正 ...

Hu不变矩+BP神经网络，实现对图像的分类（pytorch实现）

文章目录

1.网络模型

2.数据集制作

3.模型训练、保存、加载和使用

Hu不变矩+BP神经网络，实现对图像的分类（pytorch实现）相关推荐

最新文章

热门文章