胶囊神经网络模型简介

Convolutional Neural Networks (CNN) have been the backbone of the image classification and object detection developments seen over the past years. To achieve improving error rates on the famous ImageNet classification contest, CNN architectures became deeper and deeper and introduced skip layers (residual layers) between near layers and layers “deeper into” the model.

卷积神经网络(CNN)已成为过去几年中图像分类和对象检测发展的骨干力量。 为了在著名的ImageNet分类竞赛中提高错误率,CNN架构变得越来越深,并在近层和“更深入”模型的层之间引入了跳过层(残留层)。

CNN的局限性 (Limitations of CNNs)

However, besides all successes CNNs have major drawbacks. On a high level these limitations are:1. Focus on object existence, not localization2. Overlapping objects / Segmentation is a hard task3. Low 3D viewpoint variation

但是,除了所有成功之外,CNN都有很多缺点。 从总体上讲,这些限制是:1。 关注对象的存在,而不是本地化2。 重叠对象/细分是一项艰巨的任务3。 低3D视点变化

These limitations can be explained by the overall architecture used in CNNs. In each convolutional layer so called Feature Maps try to learn image features (e.g. lines, corners) based on image gradients. Before the output of one convolutional layer is fed into the next convolutional layer, a MaxPooling layer typically shrinks the feature resolution by factor 4 by only keeping the maximum value across a 2x2 pooling window. While this progressing feature map shrinkage allows the CNN to learn higher-level concepts in deeper layers and reduces computational complexity, we achieve viewpoint invariance, but we also lose the pose and location information of the object the detected by the CNN. Especially, we lose the relative spatial relationships between features. So far object detection/localization algorithms (SSD, YOLOv3) circumvented this limitation by performing image classification in parallel in multiple pre-selected frame within the original image. [1][2]

这些限制可以通过CNN中使用的整体体系结构来解释。 在每个卷积层中,所谓的特征贴图尝试根据图像梯度学习图像特征(例如,线,角)。 在将一个卷积层的输出馈送到下一个卷积层之前,MaxPooling层通常仅通过在2x2合并窗口中保持最大值将特征分辨率缩小4倍。 尽管这种不断发展的特征图收缩使CNN可以在更深的层中学习更高级的概念并降低计算复杂度,但我们实现了视点不变性,但同时也丢失了CNN检测到的物体的姿态和位置信息。 特别是,我们失去了要素之间的相对空间关系。 到目前为止,对象检测/定位算法(SSD,YOLOv3)通过在原始图像内的多个预选帧中并行执行图像分类来规避了此限制。 [1] [2]

胶囊网络 (Capsule Networks)

To provide a solution Sara Sabour, Nicholas Frosst and Geoffrey E Hinton proposed the use of Capsules in their seminal paper “Dynamic Routing Between Capsules” [3]. In the most high-level notion, Capsule Networks do not forward individual neuron activations from one layer to the next layer, but instead each capsule represents a small nested neural network which outputs a whole vector. The total length of a capsule’s output vector encodes the probability that a certain feature has been detected. The direction of the vector lengths helps representing the state of the detected feature (e.g. location, pose, scale). When a feature moves across the image, the length of the vector should stay the same (as the feature will til be detected), but the vector’s direction will change. This behavior was called activity equivariance by Hinton.

为了提供解决方案,Sara Sabour,Nicholas Frosst和Geoffrey E Hinton在其开创性论文“胶囊之间的动态路由”中提出了使用胶囊的方法[3]。 在最高级的概念中,胶囊网络不会将单个神经元激活从一层转发到下一层,而是每个胶囊代表一个小的嵌套神经网络,该神经网络输出整个矢量。 胶囊输出矢量的总长度编码检测到某个特征的概率。 向量长度的方向有助于表示检测到的特征的状态(例如,位置,姿势,比例)。 当特征在图像上移动时,矢量的长度应保持不变(因为将检测到该特征),但是矢量的方向将改变。 这种行为被欣顿称为活动等方差。

A capsule sj then does not forward its output vector vj blindly to every capsule in the next layer. Instead, a capsule predicts the output of all capsules in the next layer given its own output vector vj and the respective coupling coefficient cij and forwards its output only to that capsule whose predicted output results in the largest vector. By this “next-layer output prediction” capsulesj ensures that it selects the most appropriate capsule for a given higher-level feature. Depending on the resulting next-layer output vector, the coupling coefficient cij be updated.

这样,胶囊s j不会盲目地将其输出向量v j转发给下一层中的每个胶囊。 取而代之的是,胶囊在给定其自身的输出矢量v j和相应的耦合系数c ij的情况下,预测下一层中所有胶囊的输出,并将其输出仅转发到其胶囊的预测输出导致最大矢量。 通过这种“下一层输出预测”,胶囊j确保为给定的较高级特征选择最合适的胶囊。 取决于所得的下一层输出矢量,耦合系数c ij被更新。

Source: Sara Sabour @ CVPR2019 — Capsule Tutorial [4]
来源:Sara Sabour @ CVPR2019 —胶囊教程[4]

Each capsule’s state sj is calculated as the weighted sum of the matrix multiplication of output/prediction vectors of the capsules from the lower layer with the coupling coefficient cij between sj and the respective lower-level capsule si.

每个胶囊的状态s j被计算为来自下层的胶囊的输出/预测矢量的矩阵乘积的加权和, 其中 ,s j与相应的下层胶囊si之间具有耦合系数c ij

Of course, capsules in the first capsule layer of a capsule network calculate their activation based on the input from the previous convolution layer. In this case, no coupling coefficient cij exists.

当然,胶囊网络的第一胶囊层中的胶囊基于来自先前卷积层的输入来计算其激活。 在这种情况下,不存在耦合系数c ij

As the capsule’s output vector indicates the probability of having detected a certain feature, capsule sj’s output vector vj is “squashed”, so that long vectors sum up to 1 max and short vectors are close to zero.

由于胶囊的输出向量指示检测到某个特征的可能性,因此胶囊s j的输出向量v j被“压缩”,因此长向量的总和为1个最大值,而短向量的总和接近零。

The coupling coefficients cij defines the “activation routing” between a capsule and all potential parent capsules in the next layer and sum to 1. The softmax-like calculation ensure that the most likely “parent” capsule gets the “most” of capsule sj’s output.

耦合系数c ij定义了胶囊与下一层中所有潜在父胶囊之间的“激活路线”,总和为1。类似softmax的计算可确保最可能的“父”胶囊获得s的“最大”。 j的输出。

By following the presented calculations, the routing preferences between capsules and the prediction of next layer activations, Capsule Network claim to address the CNN limitations listed above, especially modelling stronger feature relationships then CNN could represent which is a very strong tool to boost image segmentation.

通过遵循提出的计算,胶囊之间的路由选择以及对下一层激活的预测,胶囊网络声称可以解决上面列出的CNN局限性,特别是建模更强的特征关系,然后CNN可以代表这是一个非常强大的工具,可以促进图像分割。

胶囊网络用例 (Capsule Networks Use Cases)

The CapsNet architecture represent a baseline implementation of Capsule Networks for the MNIST dataset. CapsNet not only achieves state-of-the-art CNN performance in digit classification, but it especially excels in the MultiMNIST dataset where each image includes 2 overlapping digits.

CapsNet体系结构表示MNIST数据集的Capsule Networks的基线实现。 CapsNet不仅在数字分类方面达到了最先进的CNN性能,而且在每个图像包含2个重叠数字的MultiMNIST数据集中尤其出色。

The CapsNet was designed with an initial classical convolutional layer, followed by 2 capsule layers.

CapsNet的设计具有初始经典卷积层,然后是2个胶囊层。

Source: Dynamic Routing Between Capsules, Sabour, Frosst, Hinton [3]
来源:胶囊,Sabour,Frosst,Hinton之间的动态路由[3]

At the CVPR 2019 conference several capsule use cases were presented. The left image below demonstrates how CapsNet is able to correctly detect overlapping digits due to the feature bonding between capsules. The right image demonstrates how SegCaps, a segmentation network with capsules, achieves more accurate results in segmenting granular retinal vessels.

在CVPR 2019会议上,提出了几种胶囊用例。 下图左图展示了CapsNet如何通过胶囊之间的特征键正确检测重叠的数字。 右图显示了带有胶囊的分割网络SegCaps如何在分割视网膜颗粒血管中获得更准确的结果。

Source: Sara Sabour @ CVPR2019 — Capsule Tutorial [4], Rodney Lalonde @ CVPR2019 — Capsule Tutorial [4]
来源:Sara Sabour @ CVPR2019 —胶囊教程[4],Rodney Lalonde @ CVPR2019 —胶囊教程[4]

翻译自: https://medium.com/@mike.leske/introduction-to-capsule-networks-66ebcdde4837

胶囊神经网络模型简介


http://www.taodudu.cc/news/show-2383972.html

相关文章:

  • 在matlab中饼图种类,Excel2016中饼图的常见类型及绘制方法
  • Excel作图-制作复合饼图
  • Tableau——嵌套组合饼图
  • echarts——饼图
  • 模仿excel复合饼图 (饼-柱)
  • ECharts 饼图的合并显示
  • ms office word2013教程 - 文字处理之插入复合条饼图
  • python 饼图笔记 两个饼图 双饼图 复合饼图 两个饼图 环形图
  • echarts模仿excel复合饼图(饼-饼)
  • 复合饼图的地图
  • python生成饼图文件_python 生成复合饼图
  • python生成复合饼图
  • html使用highcharts绘制饼图,Highcharts绘制饼图的简单实例
  • 用excel制作双层饼图_原创教程:用Excel做动态双层饼图
  • Java使用jfreechart画饼图_JFreeChart饼图
  • canvas双层复合饼图及点击效果的实现
  • Power bi 3.14 饼图
  • python绘制饼图explode_python - 使用Python生成复合饼图或饼图饼图 - 堆栈内存溢出...
  • R语言—热力地图复合气泡饼图
  • 计算机一级三维饼图,计算机考试excel制作复合饼图的方法
  • html5饼图的制作方法,excel2010复合饼图制作方法
  • 用excel制作双层饼图_教程:用Excel做饼图之复合饼图与双层饼图(2)
  • echarts实现复合饼图
  • EXCEL复合条饼图制作
  • WORD之文字处理之插入复合条饼图
  • Excel的复合条饼图制作
  • 希捷硬盘异响
  • 服务器硬盘开机吱吱响,硬盘吱吱响怎么回事?电脑硬盘响动原因和解决方法
  • 关于小米笔记本Pro内部风扇异响问题解决方法
  • ThinkPad T440屏幕关闭之后硬盘狂响的解决方案

胶囊神经网络模型简介_胶囊网络简介相关推荐

  1. Visio卷积神经网络模型(三)-网络卷积层示意图

    就绘制这样的 一个卷积计算  示意图 这个的思路:就像上一篇 (二)一样,先绘制网格正方形,然后组合,然后旋转一定角度.就完成了. 这就是一个基本的思路. 下面开始 然后,去除填充,修改线框粗细和颜色 ...

  2. 第05章 深度卷积神经网络模型

    序言 1. 内容介绍   本章介绍深度学习算法-卷积神经网络用于 图片分类 的应用,主要介绍主流深度卷积神经网络 (CNN) 模型,包括 ResNet DenseNet SeNet 的算法模型.数学推 ...

  3. bp神经网络预测模型优点,什么是BP神经网络模型?

    灰色理论预测和BP神经网络预测哪个难 谷歌人工智能写作项目:神经网络伪原创 初学者对BP神经网络的疑惑 伤寒.副伤寒流行预测模型(BP神经网络)的建立 由于目前研究的各种数学模型或多或少存在使用条件的 ...

  4. 数学建模神经网络应用,构建神经网络模型方法

    数学模型的建立与求解 . 8.3.2.1数学模型的求解本次研究采用地下水数值模拟软件ProcessingModflow,利用美国地质调查局所开发的三维有限差分地下水流模型Modflow(Modular ...

  5. 神经网络模型的基本原理,神经网络模型的结构是

    简述人工神经网络的结构形式 神经网络有多种分类方式,例如,按网络性能可分为连续型与离散型网络,确定型与随机型网络:按网络拓扑结构可分为前向神经网络与反馈神经网络.本章土要简介前向神经网络.反馈神经网络 ...

  6. 神经网络模型怎么训练,神经网络模型数学建模

    Hopfield 神经网络有哪几种训练方法 人工神经网络模型主要考虑网络连接的拓扑结构.神经元的特征.学习规则等.目前,已有近40种神经网络模型,其中有反传网络.感知器.自组织映射.Hopfield网 ...

  7. bp神经网络模型拓扑结构,bp神经网络的建模步骤

    如何建立bp神经网络预测 模型 . 建立BP神经网络预测模型,可按下列步骤进行:1.提供原始数据2.训练数据预测数据提取及归一化3.BP网络训练4.BP网络预测5.结果分析现用一个实际的例子,来预测2 ...

  8. 神经网络模型的工作过程,神经网络模型训练过程

    利用人工神经网络建立模型的步骤 人工神经网络有很多种,我只会最常用的BP神经网络.不同的网络有不同的结构和不同的学习算法.简单点说,人工神经网络就是一个函数.只是这个函数有别于一般的函数.它比普通的函 ...

  9. 如何搭建神经网络模型,神经网络建立数学模型

    如何用visio画卷积神经网络图.图形类似下图所示 . 大概试了一下用visio绘制这个图,除了最左面的变形图片外其余基本可以实现(那个图可以考虑用其它图像处理软件比如Photoshop生成后插入vi ...

  10. 人工神经网络之BP神经网络模型

    一.什么是BP BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网 ...

最新文章

  1. 创建一个属于自己的名称空间.
  2. 压缩备份日志 java_自动压缩备份日志文件到指定备份目录脚本
  3. SAP S/4HANA product search generated SQL statement的生产原理介绍
  4. ES6-15 map与set
  5. boot界面上下键调节键不能动_为什么电脑一开机就自动进入BIOS界面
  6. linux modbus工具,基于ARM-Linux的Modbus串口服务器设计
  7. 根据IDC的数据,全球融合系统市场在2019年第四季度同比增长1.1%
  8. 博客目录 Blog directory
  9. 建模国赛2016A-系泊系统的设计优秀论文
  10. 20201022-成信大-C语言程序设计-20201学期《C语言程序设计B》C-trainingExercises19
  11. 如何保证MQ消息队列的高可用
  12. android人脸识别的背景图_Android原生人脸识别Camera2+FaceDetector 快速实现人脸跟踪...
  13. cad转excel插件c2e_cad表格转换器2016
  14. 8.1 - mysql 基本知识
  15. 判断char*是否为utf8编码
  16. 【五一专属活动】向所有热爱分享的“技术劳动者”致敬
  17. arx开发版本对照表
  18. 帝国时代2决定版服务器维护,帝国时代2决定版闪退问题解决方法
  19. Editplus下载安装
  20. docker 配置国内镜像源不起作用

热门文章

  1. android js 回调函数,Javascript回调函数传递给Android
  2. 计算机无法启动bios,笔记本进不了bios的解决方法
  3. 传言阿里P10赵海平,被P11多隆判定3.25离职,如何评价阿里 P10 赵海平对王垠的面试?
  4. Tableau如何取消合并单元格【技巧分享】
  5. 站长 给windows7的系统保留分区设置驱动器号
  6. php换脸,PS换脸术 蒙娜丽莎图片换脸教程
  7. 虚拟机运行python_《虚》字意思读音、组词解释及笔画数 - 新华字典 - 911查询
  8. 海底捞“清疮”300店:千亿龙头的虚与实
  9. 苹果logo_苹果 ARM Mac 发布会独特标志 Logo 亮相:橙色、红色、紫色和蓝色色调...
  10. 如何精确理解leader布置的任务