DL之ShuffleNetV2:ShuffleNetV2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

目录

ShuffleNetV2算法的简介(论文介绍)

1、论文特点

2、基于硬件平台的性能分析

3、该论文实验采用的硬件

7、实验结果

ShuffleNetV2算法的架构详解

ShuffleNetV2算法的案例应用


相关文章
DL之ShuffleNet:ShuffleNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
DL之ShuffleNet:ShuffleNet算法的架构详解
DL之ShuffleNetV2:ShuffleNetV2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
DL之ShuffleNetV2:ShuffleNetV2算法的架构详解

ShuffleNetV2算法的简介(论文介绍)

ShuffleNetV2是ShuffleNet的升级版本。

Abstract  
      Currently, the neural network architecture design is mostly  guided by the indirect metric of computation complexity, i.e., FLOPs.  However, the direct metric, e.g., speed, also depends on the other factors  such as memory access cost and platform characterics. Thus, this work  proposes to evaluate the direct metric on the target platform, beyond  only considering FLOPs. Based on a series of controlled experiments,  this work derives several practical guidelines for efficient network design.  Accordingly, a new architecture is presented, called ShuffleNet V2.  Comprehensive ablation experiments verify that our model is the stateof-the-art  in terms of speed and accuracy tradeoff.  
Keywords: CNN architecture design, efficiency, practical
摘要
      目前,神经网络体系结构设计大多以计算复杂度的间接度量为指导,即FLOPs。然而,直接度量(如速度)也取决于其他因素,如内存访问成本和平台特性。因此,这项工作建议评估目标平台上的直接指标,而不仅仅是考虑故障。在一系列受控实验的基础上,得出了有效网络设计的几种实用指导原则。因此,提出了一种新的体系结构,称为ShuffleNet V2。综合消融实验验证了我们的模型在速度和精度上是最先进的。
关键词:CNN架构设计;高效;实用
Conclusion  
      We propose that network architecture design should consider the direct metric  such as speed, instead of the indirect metric like FLOPs. We present practical  guidelines and a novel architecture, ShuffleNet v2. Comprehensive experiments  verify the effectiveness of our new model. We hope this work could inspire future  work of network architecture design that is platform aware and more practical.
结论
      我们建议网络架构设计应考虑直接指标如速度,而不是间接指标(如FLOPs)。我们提出了实用的指南和一个新颖的体系结构,ShuffleNet v2.。综合实验验证新模型的有效性。我们希望这项工作能够激发未来网络架构设计的工作,使其具有平台意识和更实用性。

论文
Ningning Ma, XiangyuZhang, Hai-Tao Zheng, Jian Sun.
ShuffleNetV2: Practical Guidelines for Efficient CNN Architecture Design. ECCV 2018.
https://arxiv.org/abs/1807.11164

1、论文特点

度量标准太单一:目前,神经网络架构设计主要由计算复杂度的间接度量(即FLOPs)所指导。然而,直接度量(例如,执行速度)还取决于诸如存储器访问成本和平台特性之类的其他因素。因此,作者建议评估目标平台上的直接度量,而不仅仅考虑FLOPs。
     ShuffleNetV2采用更好的度量标准:基于一系列对照实验,该论文为有效的网络设计提供了一些实用指南,并提出了一种称为ShuffleNetV2的新架构。

2、基于硬件平台的性能分析

1、四种不同计算复杂度的硬件平台上,测量四种网络架构的准确度(验证集上的ImageNet分类),速度和FLOPs

在两个具有四种不同计算复杂度的硬件平台上测量四种网络架构的准确度(验证集上的ImageNet分类),速度和FLOPs。
(a,c)GPU结果,batchsize= 8.(b,d)ARM结果,batchsize= 1。在所有情况下,性能最佳的算法,即论文提出的ShuffleNetv2(位于右上角区域)的准确度、复杂度都有明显提高。

2、ShuffeNetv1 和 MobileNetv2 两个架构在不同计算平台上的分解
      在两个具有代表性的最先进的网络架构上运行时分解:ShuffeNetv1 (1×, g = 3) 和 MobileNetv2 (1×).
      Run time decomposition on two representative state-of-the-art network architectures, ShuffeNetv1 (1×, g = 3) and MobileNetv2 (1×). 比如卷积操作、Shuffle操作、Elemwise逐点操作等操作所需时间占比分布图,明显的看出:
(1)、卷积操作占用了大部分的计算量,Elemwise逐点操作次之。
(2)、不同的操作平台,比如卷积操作占用时间也不一样。

3、间接指标(FLOPs)和直接指标(速度)之间的差异

分析——问题原因:间接指标(FLOPs)和直接指标(速度)之间的差异可归因于两个主要原因:

  • 1、首先,FLOPs没有考虑几个对速度有相当影响的重要因素
    (1)、一个这样的因素是存储器访问成本(MAC,memory access cost )。在诸如组卷积的某些操作中,这种成本占运行时的很大一部分。它可能是具有强大计算能力的设备(例如GPU)的瓶颈。在网络架构设计中不应忽略此成本。
    (2)、另一个是并行度。在相同的FLOPs下,具有高并行度的模型可能比具有低并行度的另一个模型快得多。
  • 2、其次,具有相同FLOPs的操作,可能具有不同的运行时间,具体取决于平台。例如,张量分解广泛用于早期工作以加速矩阵乘法。然而,最近的工作发现尽管分解将FLOPs降低了75%,在GPU上甚至更慢。当然不能认为3×3转换,比1×1转换慢9倍。作者发现这是因为最新的CUDNN 库专门为3×3卷积转换而优化。

思考——解决方法:通过这些观察,作者提出应该考虑两个原则来进行有效的网络架构设计。

  • 首先,应该使用直接度量(例如,速度)而不是间接度量(例如,FLOPs)。
  • 其次,应在具体的目标平台上,进行评估此类指标。

3、该论文实验采用的硬件

作者的研究是在两个广泛采用的硬件上进行的,具有CNN库的行业级优化。

  • GPU:使用单个NVIDIA GeForce GTX 1080Ti。卷积库是CUDNN 7.0 。还激活了CUDNN的基准测试功能,分别为不同的卷积选择最快的算法。
  • ARM:Qualcomm Snapdragon 810。使用高度优化的基于Neon的实现。评估时使用单个线程。其他设置包括:接通完全优化选项(例如,用于减少小操作的开销的tensor fusion)。输入图像大小为224×224。

7、实验结果

1、ImageNet分类性能

比如ShuffleNetv2的0.5的复杂度,MFLOPS=41M、GPU平台上单位秒处理数=417张图片、ARM平台上单位秒处理数=57张图片。

2、COCO目标检测的性能 Performance on COCO object detection

ShuffleNetV2算法的架构详解

更新……

DL之ShuffleNetV2:ShuffleNetV2算法的架构详解

ShuffleNetV2算法的案例应用

更新……

DL之ShuffleNetV2:ShuffleNetV2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略相关推荐

  1. DL之ShuffleNet:ShuffleNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之ShuffleNet:ShuffleNet算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 相关文章 DL之ShuffleNet:ShuffleNet算法的简介(论文介绍).架构详 ...

  2. DL之DilatedConvolutions:Dilated Convolutions(膨胀卷积/扩张卷积)算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之DilatedConvolutions:Dilated Convolutions(膨胀卷积/扩张卷积)算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 Dilated Con ...

  3. DL之MobileNetV2:MobileNetV2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之MobileNet V2:MobileNet V2算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 MobileNetV2算法的简介(论文介绍) MobileNet V2算法 ...

  4. DL之MobileNet:MobileNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之MobileNet:MobileNet算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 MobileNet算法的简介(论文介绍) 1.研究背景 2.传统的模型轻量化常用的方法 ...

  5. DL之SqueezeNet:SqueezeNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之SqueezeNet:SqueezeNet算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 SqueezeNet算法的简介(论文介绍) 1.轻量级的CNN架构优势 2.主要特 ...

  6. DL之DenseNet:DenseNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之DenseNet:DenseNet算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 DenseNet算法的简介(论文介绍) DenseNet算法的架构详解 3.DenseNe ...

  7. DL之ResNeXt:ResNeXt算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之ResNeXt:ResNeXt算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 ResNeXt算法的简介(论文介绍) ResNeXt算法的架构详解 ResNeXt算法的案例应 ...

  8. DL之FCN:FCN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之FCN:FCN算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 FCN算法的简介(论文介绍) 0.FCN性能-实验结果 1.全卷积神经网络的特点.局限性.缺点 FCN算法的架 ...

  9. DL之Xception:Xception算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之Xception:Xception算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 Xception算法的简介(论文介绍) 1.论文使用的数据集 Xception算法的架构详 ...

最新文章

  1. css如何自动换行对于div,p等块级元素(转)
  2. 比特币多重签名机制使用篇
  3. 10 过滤器和监听器
  4. 深度学习:又一次推动AI梦想(Marr理论、语义鸿沟、视觉神经网络、神经形态学)
  5. 配置节处理程序时出错,未能加载文件或程序集
  6. python sys.path.append()添加路径_Python调用CST进行天线建模仿真:环境搭建指南
  7. ES6-symbol-使用symbol
  8. [转]busybox登陆后没要求输入密码的解决办法
  9. 【渝粤教育】国家开放大学2018年秋季 0077-22T古代汉语专题 参考试题
  10. bay——RAC 表空间时数据文件误放置到本地文件系统-介质恢复.txt
  11. 计算机四级网络工程师题库及详细知识点大全
  12. 价量分析.成交量判断多空头.用跌减涨增量法买股票.成交量识庄家
  13. 关于概要设计文档的写作
  14. Overture五线谱打曲谱用得上的排版技巧
  15. SEM竞价员一天的工作流程了解一下?
  16. 中年男人失业,滴滴,外卖,保安三选一,怎么选?
  17. 图像保边滤波算法集锦--非局部均值NLM滤波器
  18. 尼尔森十大易用性原则驱动的测试
  19. 英读廊——吃醋的女朋友(A Jealous Girlfriend)
  20. Html网页设计-军事网站设计

热门文章

  1. python变长参数传递
  2. 同时删除两张表的数据_把数据表中对应工作表的数据首先删除,然后导入数据...
  3. 一个函数让你看懂 'Why 0.1+0.2!=0.3'
  4. 122. Best Time to Buy and Sell Stock II
  5. IntelliJ IDEA 常用设置 1
  6. Quake3中的绝对值函数
  7. 基于Leaflet实现路径轨迹回放功能
  8. centOS7 Minima无法上网解决方案(Linux设置开机自动获取ip地址)
  9. 厉害了,如何通过双 key 来解决缓存并发问题?
  10. 从0到70%:Chrome上位揭秘!