机器学习-卷积神经网络简介
一、简介
CNN由对输入进行过滤(卷积)以获得有用信息的层组成。 这些卷积层具有可以学习的参数(内核),因此可以自动调整这些过滤器以提取针对手头任务的最有用信息,而无需选择特征。 CNN最好与图像一起使用。 普通神经网络不适用于图像分类问题。
二、普通神经网络的比较
在正常的神经网络上,我们需要将图像转换为单个1d向量,然后将数据发送到完全连接的隐藏层。 在这种情况下,每个神经元每个神经元都有参数。
正常情况下,[CONV-> ReLU-> Pool-> CONV-> ReLU-> Pool-> FC-> Softmax_loss(训练期间)]模式是很常见的。
主角卷积层:
卷积神经网络上最重要的操作是卷积层,想象一下,如果我们用5x5x3对该图像进行卷积(滤波器深度必须与输入的深度相同),则得到一个32x32x3的图像(结果是激活图28x28x1)。
滤镜将在所有图像上寻找特定的事物,这意味着仅使用一个滤镜将在整个图像中寻找图案。
现在考虑我们希望卷积层寻找6种不同的东西。 在这种情况下,我们的卷积层将具有6个5x5x3滤镜。 每个人都在寻找图像上的特定图案。
顺便说一下,卷积本身就是线性运算,如果我们不想遭受线性分类器的相同问题,我们需要在卷积层的末尾添加一个非线性层(通常是Relu)。使用卷积作为模式匹配的另一个重要点是我们要在图像上搜索的对象的位置不相关。 在神经网络的情况下,模型/假设将在训练过程中在对象所在的确切位置上学习对象。
卷积层Hyper参数
这些是用于配置卷积层的参数;
内核大小(K):较小为佳(但如果位于第一层,则需要大量内存);
步幅(S):内核窗口将滑动多少像素(在转换层中通常为1,在合并层中通常为2);
零填充(填充):在图像边界上放置零,以使转换输出大小与输入大小相同(F = 1,PAD = 0; F = 3,PAD = 1; F = 5,PAD = 2; F = 7,PAD = 3);
过滤器数量(F):转换层将查找的图案数量。
默认情况下,卷积输出的结果始终小于输入。 为了避免这种行为,我们需要使用填充。 要计算卷积输出(激活图)大小,我们需要以下公式:
在这里,我们将看到卷积窗口在输入图像上滑动并更改其中一些超参数的示例:
卷积,无填充且步幅为1
在这里,我们有一个输入4x4与一个滤波器3x3(K = 3)卷积,其步幅(S = 1)和填充(pad = 0)。
填充和步长为1的卷积
现在我们有一个输入5x5与一个滤波器3x3(k = 3)卷积,其步幅(S = 1)和填充(pad = 1)。 在某些库中,有一个功能始终可以计算正确的填充量,以使输出空间尺寸与输入尺寸保持“相同”。
内存量
在这里,我们展示了如何计算卷积层上所需的内存量。
输入:32x32x3、32x32 RGB图像
CONV:内核(F):5x5,步幅:1,Pad:2,numFilters:10,当我们使用填充时,我们的输出量将为32x32x10,因此以字节为单位的内存量为:10240字节
因此,内存量基本上只是4d张量的输出体积的乘积。
三、总结
本篇文章我们初步的带大家了解了卷积的一些现实中的实际用例,同时对其进行了必要的分析,下面将继续对这部分的内容进行深入的介绍。
备注:
点击下面链接,进入奥比中光开发者社区,了解更多3D视觉技术信息:https://developer.orbbec.com.cn/
或扫描下方二维码,进入奥比中光开发者社区:
机器学习-卷积神经网络简介相关推荐
- 【数据挖掘】卷积神经网络 ( 视觉原理 | CNN 模仿视觉 | 卷积神经网络简介 | 卷积神经网络组成 | 整体工作流程 | 卷积计算图示 | 卷积计算简介 | 卷积计算示例 | 卷积计算参数 )
文章目录 I . 人类的视觉原理 II . 卷积神经网络 模仿 视觉原理 III . 卷积神经网络简介 IV . 卷积神经网络 组成 V . 卷积神经网络 工作流程 VI . 降低样本参数数量级 VI ...
- 卷积神经网络简介(Convolutional Neural Networks,简称CNN)
原文地址:卷积神经网络简介(Convolutional Neural Networks,简称CNN) 作者:josephzh0423 卷积神经 网络是 近年发展起来,并引起广泛重视的一种高效识别方法. ...
- 【CS231n】五、卷积神经网络简介CNN学习笔记_一只神秘的大金毛_新浪博客
1.历史简介 The Mark 1 Perceptron machine was the first implementation of the perceptron algorithm. 其只有f ...
- 【CS231n】五、卷积神经网络简介CNN学习笔记
1.历史简介 The Mark 1 Perceptron machine was the first implementation of the perceptron algorithm. 其只有f ...
- 白话机器学习-卷积神经网络CNN
一 背景 在卷积神经网络CNN 出现之前,图像对于人工智能来说就是一个灾难,主要是有两个原因: 图像需要处理的数据量太大,导致成本很高,效率很低: 图像在数值化的过程中很难保留原有的特征,导致图像处理 ...
- 机器学习|卷积神经网络(CNN) 手写体识别 (MNIST)入门
人工智能,机器学习,监督学习,神经网络,无论哪一个都是非常大的话题,都覆盖到可能就成一本书了,所以这篇文档只会包含在 RT-Thread 物联网操作系统,上面加载 MNIST 手写体识别模型相关的部分 ...
- 卷积云神经网络_卷积神经网络简介
广告 一.卷积 我们在 2 维上说话.有两个 的函数 f(x, y) 和 g(x, y) .所谓 f 和 g 的卷积就是一个新的 的函数 c(x, y) .通过下式得到: 这式子的含义是:遍览从负无穷 ...
- 经典的卷积神经网络简介
引言 本文主要用于对7个经典卷积神经网络的初识,大致了解各个网络提出的背景,以及各自对卷积神经网络发展的作用(即网络的特点). 经典的卷积神经网络: LeNet AlexNet ZF Net VGG ...
- 机器学习——卷积神经网络计算
卷积运算与相关运算 在计算机视觉领域,卷积核.滤波器通常为较小尺寸的矩阵,比如3×33×3.5×55×5等,数字图像是相对较大尺寸的2维(多维)矩阵(张量),图像卷积运算与相关运算的关系如下图所示(图 ...
最新文章
- 属性字符串(富文本)的使用
- RGB与16进制颜色转换的原理
- 简单的VC 操作XML 文件的的方法
- linux 新建用户和权限分配
- HBase-Shell-数据结构-原理
- OpenStack、Docker、KVM被评为最火的云开源项目
- nullable field verification in gateway backend
- PNAS新研究:剑桥学者发现,有些 AI 模型无法被计算
- java day37【web相关概念回顾 、web服务器软件:Tomcat 、Servlet入门学习】
- 商品类别推荐系统:LightGBM模型
- const常类型说明
- macOS Monterey下找到桌面图片存放路径
- jQuery图片LightBox插件 点击图片放大 支持移动手机
- 常见的视频格式以及视频编解码标准(附带OpenCV实现视频的读取与保存)
- LR 类分析方法总结
- TTL电平信号和RS232信号波形对比
- TCP,UDP,IP,数据链路层头部详解
- html5在线学习系统,Canvas LMS 在线学习管理系统
- 运维信息系统 (Devops Information System)开发日志
- Python3爬取企查查网站的企业年表并存入MySQL