点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★,与你不见不散

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:新智元,外媒

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

来自意大利的科学家提出了一种新型的胶囊网络,相对传统的CNN,仅需要原始版本胶囊网络参数的2%,就可以在多个数据集上获得最先进的结果。此外,他们还引入了一种基于自注意机制的非迭代路由算法,可以有效应对后续层胶囊数量减少的问题。

我们都知道深度卷积神经网络是依靠大量的数据和具有大量特征映射的层来完成学习和更新的,这个过程并不是非常高效,对于大型数据集来说,这意味着有大量冗余的特征检测器。

针对这一问题,胶囊网络是一个有发展潜力的解决方案——它可以扩展当前的卷积网络,并可以令人工视觉感知到高效编码所有特征仿射变换的过程。

由于内在具有更好的概括能力,一个胶囊网络理论上可以使用相当少的参数数量,并获得更好的结果。

可惜的是,注意到这一点的人并不多。

不过,近日,来自意大利的研究者提出了一种高效的自注意路由胶囊网络(Capsule Network with Self-Attention Routing, Efficient-CapsNet):

他们深入研究了胶囊网络的的效率,并在参数仅仅有16万的情况下,将网络的性能推到了极致。

在实验部分,研究者证明,他们提出的架构,在参数量降低为原始CAPSNET的2%的情况下,还可以在三个不同的数据集上实现最先进的结果。

此外,研究者用一个新颖的非迭代、高度并行的的路由算法替代了动态路由,利用自我注意机制,这种新颖的算法可以很容易地对小数量的胶囊进行处理。

最后,研究者还在其他胶囊上做了额外的实验,结果证明了Efficient-CapsNet的有效性,也证明了胶囊网络可以有效嵌入更为泛化的可视化表示这一特点。

该论文的贡献主要在于:

  • 深入研究了基于胶囊的网络的泛化能力,与以前的文献研究相比,大大减少了可训练参数的数量

  • 概念化和开发了基于胶囊的高效、高度可复制的深度学习神经网络,并能够在三个不同的数据集上达到最先进的结果

  • 引入了一种新颖的非迭代、高度并行的路由算法,即使胶囊数量减少了,该算法也能利用自我注意机制来对其进行有效的路由

论文中的所有训练和测试代码都是开源的,可以公开使用,论文地址如下:

https://arxiv.org/pdf/2101.12491.pdf

三层宝塔结构:两层不同卷积处理+自注意力机制

Efficient-CapsNet的总体架构如下图所示:

图:Efficient-CapsNet的总体架构示意图

主胶囊利用深度可分卷积,来创建它们所代表的特征的向量表示。另一方面,卷积层的第一个堆栈将输入张量映射到一个高维空间,从而促进了胶囊的创建。

该网络可以被分为三个不同的部分,其中前两个主要实现了胶囊层和输入空间之间的交互。每个胶囊利用下面的卷积层过滤器,将像素强度转换为它所代表的特征的矢量表示。

因此,在一个活跃胶囊内的神经元活动,体现了它在训练过程中学习到代表样本的各种属性。这些属性可以包括许多不同类型的实例化参数,如姿态、纹理、变形,以及特征本身的存在。

在这一部分的实现中,由胶囊表示的实体出现的概率用每个向量的长度来表示。这一点与下面的自我注意路由算法是兼容的。

网络的最后一部分在自我注意算法下运行,将低级胶囊路由到了它们所代表的整体。

图:网络的第一部分,可以被建模为将输入图像映射到高维空间的单函数转换。然后,通过深度可分离卷积得到主胶囊层,这大大减少了制作胶囊所需的参数数量。

图4:自注意力层,这一层的胶囊对它们所属的整体做出预测

操作简单,参数量大幅降低,效果依然显著

在实验部分,可以看出,Efficient-CapsNet所包含的参数量非常少:

图:计算成本和必要操作方面的比较。

Efficient-CapsNet除了拥有较少的可训练参数,在效率方面也更高

下面是在数字重构上的表现:

图:即使有不同的架构策略和训练目标,所有的网络都能够嵌入输入数字的不同属性,并只保留重要的细节

下面是在在MNIST分类任务上的测试错误率:

这是Efficient-CapsNet与近十年最先进方法的效果对比:

下面是在smallNORB分类任务上的测试错误率:

更多详细信息请参考链接:

https://arxiv.org/pdf/2101.12491.pdf

end

我是王博Kings,一名985AI博士,在Github上开源了机器学习、深度学习等一系列手推笔记,获得了不少同学的支持。

这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 

目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟

王博Kings 的公众号,欢迎关注,干货多多

王博Kings的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(上)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(下)

博士笔记 | 周志华《机器学习》手推笔记第九章聚类

博士笔记 | 周志华《机器学习》手推笔记第十章降维与度量学习

博士笔记 | 周志华《机器学习》手推笔记第十一章特征选择与稀疏学习

博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论(上)

博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论(下)

博士笔记 | 周志华《机器学习》手推笔记第十三章半监督学习

博士笔记 | 周志华《机器学习》手推笔记第十四章概率图模型

点个在看支持一下吧

全新胶囊网络Efficient-CapsNet效果显著!相关推荐

  1. Hinton:胶囊网络的专利是我的了!

    作者 | 陈大鑫 昨日,Reddit上有热心网友发现深度学习之父.图灵奖得主Hinton等人为胶囊(神经)网络申请了专利,该专利于2017年12月15日提交,于今年9月10日在网上发布,目前还未正式生 ...

  2. Hinton的胶囊网络不太行?CVPR Oral论文:不比卷积网络更「强」

    来源:机器学习研究组订阅 在一篇 CVPR 2021 Oral 论文中,来自慕尼黑大学.微软亚研的研究者对胶囊网络和卷积网络进行了全面的对比.一系列实验表明,一些被认为对胶囊网络(CapsNet)至关 ...

  3. Hinton:胶囊网络的专利是我的了

    2020-09-24 04:21:08 作者 | 陈大鑫 昨日,Reddit上有热心网友发现深度学习之父.图灵奖得主Hinton等人为胶囊(神经)网络申请了专利,该专利于2017年12月15日提交,于 ...

  4. 基于胶囊网络的轴承故障诊断(代码实现)

    1 简介 胶囊网络(CapsNet)由 Hinton 于2017年10月在<Dynamic Routing Between Capsules>中提出,目的在于解决 CNN 只能提取特征,而 ...

  5. 关于胶囊之间的动态路由的理解(基于Hinton的胶囊网络)

    原文章:https://blog.csdn.net/bhneo/article/details/79391469 本文介绍了由Sara Sabour,Nicholas Frosst和Geoffrey ...

  6. 胶囊网络显神威:Google AI和Hinton团队检测到针对图像分类器的对抗攻击

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自新智元.   新智元报道   来源:VB 编辑:范媛媛,元子 [新智元导读]对抗攻击正越来越多地被有"防御意识"的新攻击打 ...

  7. 关于矩阵胶囊与EM路由的理解(基于Hinton的胶囊网络)

    本文介绍了Hinton的第二篇胶囊网络论文"Matrix capsules with EM Routing",其作者分别为Geoffrey E Hinton.Sara Sabour ...

  8. 论文阅读_胶囊网络CapsNet

    介绍 英文题目:Dynamic Routing Between Capsules 中文题目:胶囊之间的动态路由 论文地址:https://papers.nips.cc/paper/2017/file/ ...

  9. 翻译:揭开胶囊网络CapsNet的神秘面纱

    近年来,深度学习风靡全球.从自动驾驶汽车到预测性广告,它不可避免地成为我们日常生活的重要组成部分. 杰弗里·辛顿 (Geoffrey Hinton) 被认为是将深度学习带回主流并在很大程度上负责今天的 ...

最新文章

  1. ubuntu18.04 实现中文化 中文输入法
  2. Linux下安装java(Ubuntu为例)
  3. [POJ1741]Tree
  4. 华硕主板X99-E WS/USB 3.1 Intel Realsense D435摄像头掉线是否与Intel推行的xhci有关?
  5. Tensorflow1.x 和 2.x如何读取ckpt中保存了那些参数
  6. 大数高精运算-----乘法
  7. C#中集合接口关系笔记
  8. java JDBC操作MySQL数据库
  9. 上市4年,现在苹果要停产它了
  10. 聚类分析 距离 matlab,matlab聚类分析_matlab
  11. linux http嗅探工具 httpry
  12. 解决谷歌浏览器提示Google账号无法登录提示浏览器或应用不安全问题
  13. 初识MIMO(二):MIMO的信道容量及其仿真
  14. 净亏10.89亿欧元!法雷奥:2021年仍需保持谨慎,ADAS业务表现最佳
  15. php极验证,geetest
  16. (GPS移植三部曲)Linux下移植GPS应用程序之常见问题的分析与解决方法之三
  17. 磁带数据存储器制作过程记录
  18. CCF计算机认证注意事项
  19. idea字体大小放大和缩小的快捷键设置
  20. 在调试里看NV驱动栈溢出导致的连环死锁

热门文章

  1. 太原理工大学自考计算机应用难,太原理工大学人工智能精彩试题+问题详解
  2. php 非侵入式,Tideways和xhgui打造PHP非侵入式监控平台
  3. sql批量插入数据mysql_MYSQL批量插入数据库实现语句性能分析
  4. Argument list too long 文件数过多
  5. MySQL实现远程备份的原理_mysql实现自动远程备份一办法
  6. python多任务_【python】多任务(1. 线程)
  7. linux exfat分区格式化,技术|如何在 Linux 上将 USB 盘格式化为 exFAT
  8. java8 stream遍历_Java8中用法优雅的 Stream,性能也优雅吗?
  9. 冒泡排序提前终止条件_“离职要提前30天通知”这9种误区,你踩过几个?
  10. OGNL、EL表达式——Struts