【导读】自从2012年深度学习兴起以来,深度,宽度,多尺度,分辨率,group数目,注意力模块等等都是影响卷积神经网络性能的关键因素。因此,后面大多网络比如:VGGNet、HighwayNet、ResNet、IResNet等通过增加网络的深度来提高性能,而Inception系列则是从宽度层面逐渐提高卷积神经网络性能. 详细解读见一文详解Inception家族的前世今生(从InceptionV1-V4、Xception)附全部代码实现  ResNeXt则从增加Group数量的方法来提高网络模型性能。SENet、CBAM、SKNet则是引入注意力模块来提升卷积神经网络模型性能。而本文将主要介绍首个仅需12层(从depth维度来看)的网络就能在ImageNet上达到80.7%的Top-1准确率,它通过利用并行子结构成功地构建了一个高性能的「非深度」神经网络,该网络在 ImageNet上Top-1 Acc 达到了80.7%、在 CIFAR10 上达到96.12%、在 CIFAR100 上达到了81.35%的top-1 准确率。在进一步迁移到下游任务时,它在标准公开数据集MS-COCO 上达到 48% AP .

  • 论文地址:https://arxiv.org/abs/2110.07641

  • 代码地址:https://github.com/murufeng/awesome_lightweight_networks/blob/main/light_cnns/mobile_real_time_network/parnet.py

本文提出了一种新架构ParNet:用较浅的网络层数实现了较高的模型性能 。ParNet包含用于处理不同分辨率输入的并行子结构,我们将这些并行子结构称之为streams 。不同streams的特征在网络的后期进行融合,融合的特征将用于下游任务。另外,在ParNet block中,作者为了解决原始的3x3卷积感受野范围受限的问题,主要提出了以下两点方案:

  1. 使用类似Rep-VGG的block模块,并构建SSE 模块来增强感受野.

  2. 为了增强网络的非线性表达能力,使用SiLU激活函数替代了ReLU.

ParNet架构示意图如下:

除了RepVGG-SSE块的输入和输出具有相同的大小外,ParNet还包含下采样和融合块。模块降低分辨率并增加宽度以实现多尺度(multi-scale)处理,而融合块主要用来组合来自多个分辨率的信息,有助于减少推理期间的延迟。为了在小深度下实现高性能,作者采用并行计算的方式来加快神经网络的推理过程,具体表现为:通过增加宽度、分辨率和流数量来扩展ParNet的结构。具体如下:

  1. 在降采样 block 中添加了一个与卷积层并行的单层 SE 模块。

  2. 在 1×1 卷积分支中添加了 2D 平均池化。

  3. 融合 block 额外包含了一个串联(concatenation)层。由于串联,融合 block 的输入通道数是降采样 block 的两倍。

其中降采样和融合 block 的示意图如下所示。

网络结构如下:

代码实现如下:

import torch
from light_cnns import parnet_s
model = parnet_s()
model.eval()
print(model)
input = torch.randn(1, 3, 256, 256)
y = model(input)
print(y.size())

实验结果展示

后续我们将针对具体视觉任务集成更多的轻量级网络架构。希望本项目既能让深度学习初学者快速入门,又能更好地服务科研学术和工业研发社区。

后续将持续更新模型轻量化处理的一系列方法,包括:剪枝,量化,知识蒸馏等等,欢迎大家Star和Follow.

Github地址:https://github.com/murufeng/awesome_lightweight_networks

推荐阅读

  • 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

  • MobileViT: 一种更小,更快,高精度的轻量级Transformer端侧网络架构(附代码实现)

  • 【移动端最强架构】LCNet吊打现有主流轻量型网络(附代码实现)

  • 基于Attention机制的轻量级网络架构以及代码实现

  • 深度学习中的轻量级网络架构总结与代码实现

  • 一文详解Inception家族的前世今生(从InceptionV1-V4、Xception)附全部代码实现

  • 华为2012实验室诺亚方舟实验室招聘视觉感知算法实习生

欢迎大家加入DLer-计算机视觉&Transformer群!

大家好,这是计算机视觉&Transformer论文分享群里,群里会第一时间发布最新的Transformer前沿论文解读及交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、视频超分、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如Transformer+上交+小明)

仅需12层网络,在ImageNet上准确率达到80.7%!普林斯顿大学最新提出ParNet!相关推荐

  1. Centos 7升级内核到5.12有线网络连不上

    Centos 7升级内核到5.12有线网络连不上 检查网络适配器 安装Realtek驱动 安装驱动遇到的问题 检查网络适配器 输入ifconfig查看有没有enp3网络适配器,如果没有说明有可能新内核 ...

  2. 【愚公系列】2021年12月 网络工程-路由器上配置DHCP中继

    文章目录 前言 一.在三层路由器上部署DHCP服务器: 二.配置DHCP中继: 三.删除配置: 前言 DHCPRelay(DHCPR)DHCP中继(也叫做DHCP中继代理)是一个小程序,其可以实现在不 ...

  3. html第8章作业,天地劫手游:归真第八章仅需12分钟全成就抄作业视频

    第八章归真轻松有趣,视频无随机流程,按部就班抄作业即可. 关卡跳转时间戳: 8-2 →3分18秒 8-3 →4分32秒 8-4 →6分26秒 8-5 →8分33秒 8-6 →11分05秒 精简攻略(我 ...

  4. 12层也能媲美ResNet?YOLOv4一作邓嘉团队提出ParNet:非深度网络!

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨happy 转载自丨极市平台 导读 是否有可能构建一个高性能的Non-deep(非深度)神经网络 ...

  5. 12层也能媲美ResNet?邓嘉团队提出最新力作ParNet,ImageNet top1精度直冲80.7%

    作者丨happy 编辑丨极市平台 导读 是否有可能构建一个高性能的Non-deep(非深度)神经网络呢 ?普林斯顿大学的Jia Deng团队的最新力作ParNet:凭借12层的深度网络在ImageNe ...

  6. “非深度网络”12层打败50层,普林斯顿+英特尔:更深不一定更好

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI "深度" ...

  7. 12层打败50层,ParNet 普林斯顿+英特尔:更深不一定更好

    网友实现的: https://github.com/Pritam-N/ParNet/blob/main/parnet.py 2021.11.1,还没代码: https://github.com/ima ...

  8. 非深度网络 Non-deep Network:低延迟平行网络 ParNet,仅 12 层媲美 ResNet

    Non-deep Network Ankit Goyal1,2   Alexey Bochkovskiy2   Jia Deng1   Vladlen Koltun2 1Princeton Unive ...

  9. 神经网络其实并不需要那么深!普林斯顿大学英特尔提出ParNet,12层的网络就能达到80%以上的准确率!...

    关注公众号,发现CV技术之美 本文分享论文『Non-deep Networks』,由普林斯顿大学&英特尔联合提出<ParNet>,表示深度神经网络其实并不需要那么深!12层的网络就 ...

最新文章

  1. 用简单的C语言实现多任务轮流切换(模拟操作系统线程机制)【转】
  2. Java7/8 中的 HashMap 和 ConcurrentHashMap 全解析
  3. win10运行C语言的程序,win10系统运行软件提示应用程序发生异常0xc0000409的具体教程...
  4. lis最长上升子序列o(nlogn)优化
  5. python shutil模块用法实例分析_Python shutil模块用法实例分析
  6. 牛客网-数据结构笔试题目(二)-万万没想到之抓捕孔连顺思路解析(附源码)
  7. Hadoop源代码分析之Configuration
  8. Atitit 软件架构方法的进化与演进cs bs soa roa  msa  attilax总结
  9. 微机原理课程设计-接口芯片编程记录
  10. ubnt路由器虚拟服务器,UBNT UAP系列 Wi-Fi设置教程 装修必看
  11. 10个让你相见恨晚的iOS Swift动画框架!
  12. Tomcat部署及优化
  13. java实现多态在工资系统中的应用:给出一个根据雇员类型,利用多态性完成工资单计算的程序。
  14. 抖音怎么宣传自己的东西?通过什么方式去宣传?
  15. osgEarth使用笔记4——加载矢量数据
  16. Win11老是弹出输入体验怎么办
  17. 20210905 Ax=b的解的三种情况
  18. ubuntu物理机用virtualbox安装win7进行单片机实验
  19. N1盒子op系统nps内网穿透对接腾讯云傻妞
  20. 上海科技大学和南方科技大学计算机,上海科技大学和南方科技大学哪个好?哪个更容易考?...

热门文章

  1. 数据结构--KMP算法总结
  2. 关于帧中继的点对点实验
  3. python主辅线程_python主线程捕获子线程的方法
  4. java pagemodel,Java PageModel
  5. 2021年3月19日 百度开发实习面试(质量效能研发部)(一面)
  6. ValueError: Classification metrics can‘t handle a mix of multiclass and unknown targets
  7. 带有BERT模型代码的BILSTM+BERT+CRF
  8. spring使用AOP注解三步曲
  9. php时间之差,PHP获得任意时间与当前时间的时间差
  10. 甘利俊一 | 信息几何法:理解深度神经网络学习机制的重要工具