图像辨识系统神经网络图,图像识别技术神经网络

如何通过人工神经网络实现图像识别

。

人工神经网络（ArtificialNeuralNetworks）（简称ANN）系统从20世纪40年代末诞生至今仅短短半个多世纪，但由于他具有信息的分布存储、并行处理以及自学习能力等优点，已经在信息处理、模式识别、智能控制及系统建模等领域得到越来越广泛的应用。

尤其是基于误差反向传播（ErrorBackPropagation）算法的多层前馈网络（Multiple-LayerFeedforwardNetwork）(简称BP网络)，可以以任意精度逼近任意的连续函数，所以广泛应用于非线性建模、函数逼近、模式分类等方面。

目标识别是模式识别领域的一项传统的课题，这是因为目标识别不是一个孤立的问题，而是模式识别领域中大多数课题都会遇到的基本问题，并且在不同的课题中，由于具体的条件不同，解决的方法也不尽相同，因而目标识别的研究仍具有理论和实践意义。

这里讨论的是将要识别的目标物体用成像头(红外或可见光等)摄入后形成的图像信号序列送入计算机，用神经网络识别图像的问题。

一、BP神经网络BP网络是采用Widrow-Hoff学习算法和非线性可微转移函数的多层网络。一个典型的BP网络采用的是梯度下降算法，也就是Widrow-Hoff算法所规定的。

backpropagation就是指的为非线性多层网络计算梯度的方法。一个典型的BP网络结构如图所示。我们将它用向量图表示如下图所示。

其中：对于第k个模式对，输出层单元的j的加权输入为该单元的实际输出为而隐含层单元i的加权输入为该单元的实际输出为函数f为可微分递减函数其算法描述如下：（1）初始化网络及学习参数，如设置网络初始权矩阵、学习因子等。

（2）提供训练模式，训练网络，直到满足学习要求。（3）前向传播过程：对给定训练模式输入，计算网络的输出模式，并与期望模式比较，若有误差，则执行（4）；否则，返回（2）。

（4）后向传播过程：a.计算同一层单元的误差；b.修正权值和阈值；c.返回（2）二、BP网络隐层个数的选择对于含有一个隐层的三层BP网络可以实现输入到输出的任何非线性映射。

增加网络隐层数可以降低误差，提高精度，但同时也使网络复杂化，增加网络的训练时间。误差精度的提高也可以通过增加隐层结点数来实现。一般情况下，应优先考虑增加隐含层的结点数。

三、隐含层神经元个数的选择当用神经网络实现网络映射时，隐含层神经元个数直接影响着神经网络的学习能力和归纳能力。

隐含层神经元数目较少时，网络每次学习的时间较短，但有可能因为学习不足导致网络无法记住全部学习内容；隐含层神经元数目较大时，学习能力增强，网络每次学习的时间较长，网络的存储容量随之变大，导致网络对未知输入的归纳能力下降，因为对隐含层神经元个数的选择尚无理论上的指导，一般凭经验确定。

四、神经网络图像识别系统人工神经网络方法实现模式识别，可处理一些环境信息十分复杂，背景知识不清楚，推理规则不明确的问题，允许样品有较大的缺损、畸变，神经网络方法的缺点是其模型在不断丰富完善中，目前能识别的模式类还不够多，神经网络方法允许样品有较大的缺损和畸变，其运行速度快，自适应性能好，具有较高的分辨率。

神经网络的图像识别系统是神经网络模式识别系统的一种，原理是一致的。一般神经网络图像识别系统由预处理，特征提取和神经网络分类器组成。预处理就是将原始数据中的无用信息删除，平滑，二值化和进行幅度归一化等。

神经网络图像识别系统中的特征提取部分不一定存在，这样就分为两大类：①有特征提取部分的：这一类系统实际上是传统方法与神经网络方法技术的结合，这种方法可以充分利用人的经验来获取模式特征以及神经网络分类能力来识别目标图像。

特征提取必须能反应整个图像的特征。但它的抗干扰能力不如第2类。

②无特征提取部分的：省去特征抽取，整副图像直接作为神经网络的输入，这种方式下，系统的神经网络结构的复杂度大大增加了，输入模式维数的增加导致了网络规模的庞大。

此外，神经网络结构需要完全自己消除模式变形的影响。但是网络的抗干扰性能好，识别率高。当BP网用于分类时，首先要选择各类的样本进行训练，每类样本的个数要近似相等。

其原因在于一方面防止训练后网络对样本多的类别响应过于敏感，而对样本数少的类别不敏感。另一方面可以大幅度提高训练速度，避免网络陷入局部最小点。

由于BP网络不具有不变识别的能力，所以要使网络对模式的平移、旋转、伸缩具有不变性，要尽可能选择各种可能情况的样本。

例如要选择不同姿态、不同方位、不同角度、不同背景等有代表性的样本，这样可以保证网络有较高的识别率。

构造神经网络分类器首先要选择适当的网络结构：神经网络分类器的输入就是图像的特征向量；神经网络分类器的输出节点应该是类别数。隐层数要选好，每层神经元数要合适，目前有很多采用一层隐层的网络结构。

然后要选择适当的学习算法，这样才会有很好的识别效果。

在学习阶段应该用大量的样本进行训练学习，通过样本的大量学习对神经网络的各层网络的连接权值进行修正，使其对样本有正确的识别结果，这就像人记数字一样，网络中的神经元就像是人脑细胞，权值的改变就像是人脑细胞的相互作用的改变，神经网络在样本学习中就像人记数字一样，学习样本时的网络权值调整就相当于人记住各个数字的形象，网络权值就是网络记住的内容，网络学习阶段就像人由不认识数字到认识数字反复学习过程是一样的。

神经网络是按整个特征向量的整体来记忆图像的，只要大多数特征符合曾学习过的样本就可识别为同一类别，所以当样本存在较大噪声时神经网络分类器仍可正确识别。

在图像识别阶段，只要将图像的点阵向量作为神经网络分类器的输入，经过网络的计算，分类器的输出就是识别结果。五、仿真实验1、实验对象本实验用MATLAB完成了对神经网络的训练和图像识别模拟。

从实验数据库中选择0～9这十个数字的BMP格式的目标图像。图像大小为16×8像素，每个目标图像分别加10％、20％、30％、40％、50％大小的随机噪声，共产生60个图像样本。

将样本分为两个部分，一部分用于训练，另一部分用于测试。实验中用于训练的样本为40个，用于测试的样本为20个。随机噪声调用函数randn(m,n)产生。

2、网络结构本试验采用三层的BP网络，输入层神经元个数等于样本图像的象素个数16×8个。隐含层选24个神经元，这是在试验中试出的较理想的隐层结点数。

输出层神经元个数就是要识别的模式数目，此例中有10个模式，所以输出层神经元选择10个，10个神经元与10个模式一一对应。

3、基于MATLAB语言的网络训练与仿真建立并初始化网络% ================S1 = 24;% 隐层神经元数目S1 选为24[R,Q] = size(numdata);[S2,Q] = size(targets);F = numdata;P=double(F);net = newff(minmax(P),[S1 S2],{'logsig''logsig'},'traingda','learngdm')这里numdata为训练样本矩阵，大小为128×40，targets为对应的目标输出矩阵，大小为10×40。

newff(PR,[S1S2…SN],{TF1TF2…TFN}，BTF,BLF,PF)为MATLAB函数库中建立一个N层前向BP网络的函数，函数的自变量PR表示网络输入矢量取值范围的矩阵[Pminmax];S1~SN为各层神经元的个数；TF1~TFN用于指定各层神经元的传递函数；BTF用于指定网络的训练函数；BLF用于指定权值和阀值的学习函数；PF用于指定网络的性能函数，缺省值为‘mse’。

设置训练参数net.performFcn = 'sse'; %平方和误差性能函数 = 0.1; %平方和误差目标 = 20; %进程显示频率net.trainParam.epochs = 5000;%最大训练步数 = 0.95; %动量常数网络训练net=init(net);%初始化网络[net,tr] = train(net,P,T);％网络训练对训练好的网络进行仿真D=sim(net,P);A = sim(net,B);B为测试样本向量集,128×20的点阵。

D为网络对训练样本的识别结果，A为测试样本的网络识别结果。实验结果表明：网络对训练样本和对测试样本的识别率均为100％。如图为64579五个数字添加50%随机噪声后网络的识别结果。

六、总结从上述的试验中已经可以看出，采用神经网络识别是切实可行的，给出的例子只是简单的数字识别实验，要想在网络模式下识别复杂的目标图像则需要降低网络规模，增加识别能力，原理是一样的。

谷歌人工智能写作项目：神经网络伪原创

图像识别系统有几种方式？具体是什么？

图片识别的实现基础是由图像处理、计算机视觉和模糊识别等多学科实现的，现阶段市面上已经有很多像图普科技成熟大厂可以提供智能审核的软件写作猫。

在人工智能中，实现图像识别有一种算法是基于深度学习多层神经网络实现的，主要是基于模仿人的神经网络，以神经元为单位，算法包含输入层，多个节点输出层，以及权重值，需要大量的训练样本去调整模型以达到误差值最小。

图像处理具体包括编码、压缩、增强、分割；图像识别包括特征提取、特征选择和分类分析，对图像类别和结构进行分析；图像理解包括机器学习和深度学习，即是对图像描述和解释。

本人毕设题目是关于神经网络用于图像识别方面的，但是很没有头续~我很不理解神经网络作用的这一机理

。

我简单说一下，举个例子，比如说我们现在搭建一个识别苹果和橘子的网络模型：我们现在得需要两组数据，一组表示特征值，就是网络的输入（p），另一组是导师信号，告诉网络是橘子还是苹果（网络输出t）：我们的样本这样子假设（就是）：pt10312142这两组数据是这样子解释的：我们假设通过3个特征来识别一个水果是橘子还是苹果：形状，颜色，味道，第一组形状、颜色、味道分别为：103（当然这些数都是我随便乱编的，这个可以根据实际情况自己定义），有如上特征的水果就是苹果（t为1），而形状、颜色、味道为：214的表示这是一个橘子（t为2）。

好了，我们的网络模型差不多出来了，输入层节点数为3个（形状、颜色，味道），输出层节点为一个（1为苹果2为橘子），隐藏层我们设为一层，节点数先不管，因为这是一个经验值，还有另外的一些参数值可以在matlab里设定，比如训练函数，训练次数之类，我们现在开始训练网络了，首先要初始化权值，输入第一组输入：103,网络会输出一个值，我们假设为4，那么根据导师信号（正确的导师信号为1，表示这是一个苹果）计算误差4-1=3，误差传给bp神经网络，神经网络根据误差调整权值，然后进入第二轮循环，那么我们再次输入一组数据：204（当仍然你可以还输入103，而且如果你一直输入苹果的特征，这样子会让网络只识别苹果而不会识别橘子了，这回明白你的问题所在了吧），同理输出一个值，再次反馈给网络，这就是神经网络训练的基本流程，当然这两组数据肯定不够了，如果数据足够多，我们会让神经网络的权值调整到一个非常理想的状态，是什么状态呢，就是网络再次输出后误差很小，而且小于我们要求的那个误差值。

接下来就要进行仿真预测了t_1=sim(net,p)，net就是你建立的那个网络，p是输入数据，由于网络的权值已经确定了，我们这时候就不需要知道t的值了，也就是说不需要知道他是苹果还是橘子了，而t_1就是网络预测的数据，它可能是1或者是2，也有可能是1.3，2.2之类的数（绝大部分都是这种数），那么你就看这个数十接近1还是2了，如果是1.5，我们就认为他是苹果和橘子的杂交，呵呵，开玩笑的，遇到x=2.5，我一般都是舍弃的，表示未知。

总之就是你需要找本资料系统的看下，鉴于我也是做图像处理的，我给你个关键的提醒，用神经网络做图像处理的话必须有好的样本空间，就是你的数据库必须是标准的。

至于网络的机理，训练的方法什么的，找及个例子用matlab仿真下，看看效果，自己琢磨去吧，这里面主要是你隐含层的设置，训练函数选择及其收敛速度以及误差精度就是神经网络的真谛了，想在这么小的空间给你介绍清楚是不可能的，关键是样本，提取的图像特征必须带有相关性，这样设置的各个阈值才有效。

OK，好好学习吧，资料去matlab中文论坛上找，在不行就去baudu文库上，你又不需要都用到，何必看一本书呢！祝你顺利毕业！

为什么全连接神经网络在图像识别中不如卷积神经网络

输入数据是n*n的像素矩阵，再使用全连接神经网络，那么参数的个数会是指数级的增长，需要训练的数据太多。

而CNN的话，可以通过共享同一个参数，来提取特定方向上的特征，所以训练量将比全连接神经网络小了很多。

训练一个图像识别分类的卷积神经网络，使用什么配置的电脑比较好

。

看你的描述这么专业，最后怎么问的有点外行，既然系统做图像识别的学习，肯定是需要大数据配合，电脑哪里处理的了，要用服务器，如果是初级应用，那么性能不一定要多强，两台入门级的服务器吧，因为可以支持多线程处理，为了节约，可以买国产的塔式服务器，便宜而且可以不用机柜，现在的服务器大多也都是千兆网卡了，不用特意要求，主要在内存和硬盘，现在的服务器瓶颈就是数据读取速度，资金允许就配固态盘做数据盘，配合前兆网卡和两台服务器处理能力，完美的学习环境。

有什么好的图像识别教程，主要是讲原理的？

图像的组成：图像由什么组成的，这个问题不是通常意义上的概念，它不是指图片里面有什么我们可以看到的东西，而是图像的光学组成概念。即图像是由很多具备色彩种类、亮度等级等信息的基本像素点所组成的。

图像的识别：计算机初始状态只能识别像素点上的基本信息，这个和生物的视觉是一样的，生物之所以可以分辨物体是由于生物神经系统对原始图像处理后的结果。

而计算机的图像识别也是一个将原始光学信息进行逻辑分类处理的过程。

【图为大脑神经元】图像识别的要点：图像识别编程就是对原始图像点信息的综合处理，图像识别通常有轮廓识别、特征识别、色彩识别、材质识别、物体识别等等。

一般根据颜色、亮度等信息得出物体的轮廓，依据轮廓所对应的数据来确定轮廓的内容是什么物体或是什么特征，及特征及物体的判断离不开轮廓及对应逻辑数据的处理。

而材质识别的特点是根据问题的反光程度来识别，其同样离不开轮廓的识别及逻辑数据的判断。因此在图像识别中，轮廓识别是重中之重。

图像识别编程的要点：图像识别编程时务必将通常的图像概念刻意淡化而侧重为视觉数据的逻辑化，并通宵人类识别数据是的依据。即人脑识别图像的逻辑判断依据从而得出正确的逻辑编程思路。

5图片编程的注意事项：图片编程时不要将简单的处理繁杂化，同时明确要识别图像的目的及可以忽略细节的程度。尽量避免非逻辑必备信息的参杂，这个对于需要高速识别内容的项目尤为重要。

END注意事项有概念不清晰的请至网上自行查阅。文中内容纯属个人经验，对借鉴此产生的后果概不负责。