文章目录

  • 前言
  • 1. 介绍
  • 2. 简单介绍以下深度可分离卷积
  • 3. PConv
    • 3.1 部分卷积PConv的设计
    • 3.2 PConv 之后的 Point-Wise Convolution
    • 3.3 PConv的代码
  • 4. 基于PConv的视觉骨干模型 FasterNet
    • 4.1 实现细节
    • 4.2 Normalization 层和激活函数的使用
    • 4.3 代码实现
  • 5. PConv具有更高的FLOPS
  • 6. 总结
  • Reference

前言


为了设计快速神经网络,许多工作都集中在减少浮点运算(FLOPs)的数量上。然而,作者观察到FLOPs的这种减少不一定会带来延迟的类似程度的减少。这主要源于每秒低浮点运算(FLOPS)效率低下。

为了实现更快的网络,作者重新回顾了FLOPs的运算符,并证明了如此低的FLOPS主要是由于运算符的频繁内存访问,尤其是深度卷积。因此,本文提出了一种新的partial convolution(PConv),通过同时减少冗余计算和内存访问可以更有效地提取空间特征。

基于PConv进一步提出FasterNet,这是一个新的神经网络家族,它在广泛的设备上实现了比其他网络高得多的运行速度,而不影响各种视觉任务的准确性。例如,在ImageNet-1k上小型FasterNet-T0在GPU、CPU和ARM处理器上分别比MobileVitXXS快3.1倍、3.1倍和2.5倍,同时准确度提高2.9%。

大模型FasterNet-L实现了令人印象深刻的83.5%的TOP-1精度,与Swin-B不相上下,同时GPU上的推理吞吐量提高了49%,CPU上的计算时间也节省了42%。

论文链接

【论文笔记】FasterNet:Run, Don’t Walk: Chasing Higher FLOPS for Faster Neural Networks相关推荐

  1. 【论文解析】Run, Don’t Walk: Chasing Higher FLOPS for Faster Neural Networks

    <Run, Don't Walk: Chasing Higher FLOPS for Faster Neural Networks> Pconv 论文链接:https://paperswi ...

  2. FatesrNet:Run, Don‘t Walk: Chasing Higher FLOPS for Faster Neural Networks

    概述:为了实现更快的网络,作者重新回顾了FLOPs的运算符,并证明了如此低的FLOPS主要是由于运算符的频繁内存访问,尤其是深度卷积.因此,作者提出了一种新的partial convolution(P ...

  3. 【论文研读】【医学图像分割】【BCRNN】Fine-grained Recurrent Neural Networks for Automatic Prostate Segmentation ...

    [论文研读][医学图像分割][BCRNN]Fine-grained Recurrent Neural Networks for Automatic Prostate Segmentation inUl ...

  4. 【论文笔记】Urban change detection for multispectral earth observation using convolution neural network

    论文 论文题目:URBAN CHANGE DETECTION FOR MULTISPECTRAL EARTH OBSERV ATIONUSING CONVOLUTIONAL NEURAL NETWOR ...

  5. Re2:读论文 CS-GNN Measuring and Improving the Use of Graph Information in Graph Neural Networks

    诸神缄默不语-个人CSDN博文目录 论文下载地址:https://openreview.net/attachment?id=rkeIIkHKvS&name=original_pdf 代码:yi ...

  6. AlexNet论文翻译(中英文对照版)-ImageNet Classification with Deep Convolutional Neural Networks

    图像分类经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为中英文对照版,纯中文版请稳步:[AlexNet纯中文版] ImageNet Classification with De ...

  7. 论文那些事—DeepFool: a simple and accurate method to fool deep neural networks

    DeepFool: a simple and accurate method to fool deep neural networks 1.摘要及背景 提出Deepfool算法,对比FGSM和I-BL ...

  8. 经典论文重读---风格迁移篇(一):Image Style Transfer Using Convolutional Neural Networks

    核心思想 采用深层卷积网络提取图像风格特征与内容,并将其进行融合生成效果很好的艺术图. 引言部分 将一幅图像的风格迁移到另一副图像可以看作是纹理迁移的一个分支.对于纹理迁移,它的目标是从源图合成一种纹 ...

  9. 【论文笔记】sigmod15-COMMIT A Scalable Approach to Mining Communication Motifs from Dynamic Networks

    相关资源 论文地址 硕士毕业论文 代码(仅有可执行文件) 作者主页 问题 本文的问题是:动态时序图中挖掘motif,可以认为是在时序图中挖掘频繁子图.子图中的边满足相同的顺序. 在有向.无标签.有重边 ...

最新文章

  1. 运动目标检测ViBe算法
  2. java中怎样存储遍历的数据_【数据算法】Java实现二叉树存储以及遍历
  3. C语言怎么保留n位小数并且四舍五入(附带两种简单方法)
  4. SQL Server表结构和数据导入到MySQL
  5. hadoop3.2.1和java1.7版本不兼容解决方案(virtualBox下ubuntu环境linux系统)
  6. WordPress后台添加侧边栏菜单
  7. linux内核分析第五次实验
  8. 中文文本拼写检查错误纠正方案整理
  9. springboot整合lua脚本
  10. 基于matlab的64QAM通信系统的仿真
  11. 大数据技术就在生活中: 登机牌、阅卷与 Map-Reduce(归约)
  12. 移植ethtool至ARM板
  13. 全能UI设计师到底需要具备哪些能力呢?
  14. PYqt5制作登陆界面
  15. 人脸识别 宿舍门禁系统(python qt opencv带数据库)
  16. 实时全局光照RSM-Reflective Shadow Maps(RSM)
  17. sql 查询 同一手机号的 姓名 相同 的所有学生的信息
  18. oracle里面的terminate,c++  ooci  oracle中的ResultSet详解
  19. 如何评估一款AR眼镜——常见的AR功能与眼镜参数
  20. 绝对有价值,欢迎收藏

热门文章

  1. PC机并口和并口打印机
  2. java连接SQL Server数据库失败学习小结
  3. 连接数据孤岛,巨杉数据库与 Tapdata 联合共建开放数据生态
  4. 自动循迹小车系统方案设计(二)
  5. mysql 2038年问题_时间戳(UnixTimestamp)与 《2038年问题》
  6. 1036: 分段函数求值(C语言)
  7. python开发app需要多久_python数据库开发app
  8. 输入三角形的三条边,先判断是否可以构成三角形,如果可以,则进一步求三角形的周长和面积,否则报错“无法构成三角形!”
  9. 货款违约预测第二周周报
  10. Binder到底是什么鬼东西