图像处理用什么神经网络,神经网络输入图片大小

目前进行图像处理,通常使用什么神经网络

谷歌人工智能写作项目：神经网络伪原创

哪些神经网络可以用在图像特征提取上

BP神经网络、离散Hopfield网络、LVQ神经网络等等都可以文案狗。

1.BP（Back Propagation）神经网络是1986年由Rumelhart和McCelland为首的科学家小组提出，是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经网络模型之一。

BP网络能学习和存贮大量的输入-输出模式映射关系，而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法，通过反向传播来不断调整网络的权值和阈值，使网络的误差平方和最小。

BP神经网络模型拓扑结构包括输入层（input）、隐层(hidden layer)和输出层(output layer)。

2.Hopfiled神经网络是一种递归神经网络，由约翰·霍普菲尔德在1982年发明。Hopfield网络是一种结合存储系统和二元系统的神经网络。

它保证了向局部极小的收敛，但收敛到错误的局部极小值（local minimum），而非全局极小（global minimum）的情况也可能发生。Hopfiled网络也提供了模拟人类记忆的模型。

3.LVQ神经网络由三层组成，即输入层、隐含层和输出层，网络在输入层与隐含层间为完全连接，而在隐含层与输出层间为部分连接，每个输出层神经元与隐含层神经元的不同组相连接。

隐含层和输出层神经元之间的连接权值固定为1。输入层和隐含层神经元间连接的权值建立参考矢量的分量（对每个隐含神经元指定一个参考矢量）。在网络训练过程中，这些权值被修改。

隐含层神经元（又称为Kohnen神经元）和输出神经元都具有二进制输出值。

当某个输入模式被送至网络时，参考矢量最接近输入模式的隐含神经元因获得激发而赢得竞争，因而允许它产生一个“1”，而其它隐含层神经元都被迫产生“0”。

与包含获胜神经元的隐含层神经元组相连接的输出神经元也发出“1”，而其它输出神经元均发出“0”。产生“1”的输出神经元给出输入模式的类，由此可见，每个输出神经元被用于表示不同的类。

为什么有图卷积神经网络？

本质上说，世界上所有的数据都是拓扑结构，也就是网络结构，如果能够把这些网络数据真正的收集、融合起来，这确实是实现了AI智能的第一步。

所以，如何利用深度学习处理这些复杂的拓扑数据，如何开创新的处理图数据以及知识图谱的智能算法是AI的一个重要方向。

深度学习在多个领域的成功主要归功于计算资源的快速发展（如 GPU）、大量训练数据的收集，还有深度学习从欧几里得数据（如图像、文本和视频）中提取潜在表征的有效性。

但是，尽管深度学习已经在欧几里得数据中取得了很大的成功，但从非欧几里得域生成的数据已经取得更广泛的应用，它们需要有效分析。

如在电子商务领域，一个基于图的学习系统能够利用用户和产品之间的交互以实现高度精准的推荐。在化学领域，分子被建模为图，新药研发需要测定其生物活性。

在论文引用网络中，论文之间通过引用关系互相连接，需要将它们分成不同的类别。自2012年以来，深度学习在计算机视觉以及自然语言处理两个领域取得了巨大的成功。

假设有一张图，要做分类，传统方法需要手动提取一些特征，比如纹理，颜色，或者一些更高级的特征。然后再把这些特征放到像随机森林等分类器，给到一个输出标签，告诉它是哪个类别。

而深度学习是输入一张图，经过神经网络，直接输出一个标签。特征提取和分类一步到位，避免了手工提取特征或者人工规则，从原始数据中自动化地去提取特征，是一种端到端（end-to-end）的学习。

相较于传统的方法，深度学习能够学习到更高效的特征与模式。图数据的复杂性对现有机器学习算法提出了重大挑战，因为图数据是不规则的。

每张图大小不同、节点无序，一张图中的每个节点都有不同数目的邻近节点，使得一些在图像中容易计算的重要运算（如卷积）不能再直接应用于图。此外，现有机器学习算法的核心假设是实例彼此独立。

然而，图数据中的每个实例都与周围的其它实例相关，含有一些复杂的连接信息，用于捕获数据之间的依赖关系，包括引用、朋友关系和相互作用。最近，越来越多的研究开始将深度学习方法应用到图数据领域。

受到深度学习领域进展的驱动，研究人员在设计图神经网络的架构时借鉴了卷积网络、循环网络和深度自编码器的思想。为了应对图数据的复杂性，重要运算的泛化和定义在过去几年中迅速发展。

怎样获得图片的像素作为神经网络的输入

卷积神经网络有以下几种应用可供研究： 1、基于卷积网络的形状识别物体的形状是人的视觉系统分析和识别物体的基础，几何形状是物体的本质特征的表现，并具有平移、缩放和旋转不变等特点，所以在模式识别领域，对于形状的分析和识别具有十分重要的意义，而二维图像作为三维图像的特例以及组成部分，因此二维图像的识别是三维图像识别的基础。

2、基于卷积网络的人脸检测卷积神经网络与传统的人脸检测方法不同，它是通过直接作用于输入样本，用样本来训练网络并最终实现检测任务的。

它是非参数型的人脸检测方法，可以省去传统方法中建模、参数估计以及参数检验、重建模型等的一系列复杂过程。本文针对图像中任意大小、位置、姿势、方向、肤色、面部表情和光照条件的人脸。

3、文字识别系统在经典的模式识别中，一般是事先提取特征。提取诸多特征后，要对这些特征进行相关性分析，找到最能代表字符的特征，去掉对分类无关和自相关的特征。

然而，这些特征的提取太过依赖人的经验和主观意识，提取到的特征的不同对分类性能影响很大，甚至提取的特征的顺序也会影响最后的分类性能。同时，图像预处理的好坏也会影响到提取的特征。

卷积神经网络为什么适合图像处理？

神经网络的本质就在于做信息形式的变换,而要想做数据的处理,首要解决的问题就是如何将数据张量化,问题就在于卷积神经网络要处理的数据必须是向量形式,对于图像这种数据类型来说,如果将其展开成一维的向量,且不说得到向量的维数过高,网络太深导致网络中参数太多,图像中的空间信息也会丢失。

而卷积神经网络能够用卷积的方式从原信息中提取"部分特定的信息(信息跟卷积核相关)",且对于二维的图像来说是原生支持的(不需要处理),这就保留了图像中的空间信息,而空间信息是具有可平移性质的.。

并且卷积神经网络的参数就只是卷积核的参数以及偏置(Bias),而卷积核的参数可以做到共享,卷积核也可以用多个,从多个角度对原图像解读。

这就是卷积神经网络的几个特点:局部感知,参数共享,多核,平移不变性正是因为这些特点,在图像领域处理上,卷积神经网络取代了人工神经网络。卷积神经网络 (CNN) 是当今最流行的模型之一。

这种神经网络计算模型使用多层感知器的变体，并包含一个或多个可以完全连接或池化的卷积层。这些卷积层创建了记录图像区域的特征图，该区域最终被分成矩形并发送出去进行非线性处理。

优点：图像识别问题的非常高的准确性。自动检测重要特征，无需任何人工监督。权重共享。缺点：CNN 不对物体的位置和方向进行编码。缺乏对输入数据空间不变的能力。需要大量的训练数据。

深度学习作为输入的图像一般是矢量图吗

深度学习作为输入的图像一般为矢量图。在电脑中，图像有两种表达方式，一种叫做位图，另一种叫做矢量图。位图是把一幅彩色图像分成许许多多像素，用若干位数字来指定每个像素的颜色、亮度等属性。

因此一幅位图就由许许多多描述每个像素的数据构成，这种表示方法很直观，而且能够很精细地描述图像。位图一般可以通过扫描仪、数码相机等设备获得。影响位图大小的因素是图像的分辨率和颜色数。

矢量图是由一系列电脑指令来表示一幅图，比如画点、画线的指令等，用数学表达式来表示一幅图。在显示图像时，电脑是一边计算一边显示的。矢量图文件的大小取决于完成图像绘制工作所需的指令条数。

矢量图容易做到对图像的移动、缩放和旋转等等。相同的或者类似的图像可以当作构成复杂图像的构件，把它们存放在图库中，以缩短绘图时间，减少矢量图文件的大小。

对于一幅很复杂的彩色照片，则很难用数学表达式来表达，这时往往用位图来表示。一般位图文件比矢量图的文件要大。

位图是由像素组成的，在放大位图的时候，如果没有特殊的处理，位图会变得很粗糙，原因是图像的尺寸变大了，而像素的数量却没有改变。

矢量图在放大时，不会出现这种失真，因为矢量图中存放的是绘制图像的信息，不会因为图像大小的改变而改变。希望我能帮助你解疑释惑。