经典CNN模型计算量与内存需求分析

表1 CNN经典模型的内存,计算量和参数数量对比

AlexNet

VGG16

Inception-v3

模型内存(MB)

>200

>500

90-100

参数(百万)

60

138

23.2

计算量(百万)

720

15300

5000

1. CNN模型具体分析(以AlexNet网络模型为例)

1.1 网络结构

图1 AlexNet网络结构

AlexNet有5个卷积层和3个全连接层

C1:96×11×11×3 (卷积核个数/宽/高/深度)               34848个

C2:256×5×5×48(卷积核个数/宽/高/深度)           307200个

C3:384×3×3×256(卷积核个数/宽/高/深度)         884736个

C4:384×3×3×192(卷积核个数/宽/高/深度)         663552个

C5:256×3×3×192(卷积核个数/宽/高/深度)         442368个

R1:4096×6×6×256(卷积核个数/宽/高/深度)       37748736个

R2:4096×4096                                                        16777216个

R3:4096×1000                                                        4096000个

共6000万个参数

1.2 AlexNet模型内存大小计算

6000万(个参数)×32位(float32)=19.2亿位≈228.88MB

1.3 AlexNet模型计算力消耗

图2 AlexNet模型每层每秒浮点运算次数及参数数量

1.4 AlexNet网络模型配置

AlexNet网络模型获得了2012年ImageNet比赛的冠军。AlexNet使用两块GTX580显卡进行训练,两块GPU各训练网络的一部分,在第二个卷积层和全连接层两块GPU之间才进行互相通信。

2020-12-09 深度学习 经典CNN模型计算量与内存需求分析相关推荐

  1. 【深度学习】CNN模型的可视化-1

    CNN模型学到的东西很适合可视化,这里介绍三种方法: 可视化CNN模型的中间输出(中间激活):帮助我们理解CNN是如何对输入进行变换,以及CNN每个卷积核的含义 可视化CNN的卷积核:帮助我们理解卷积 ...

  2. 【深度学习】CNN模型处理简单时间序列

    本文使用CNN模型,Conv1d卷积进行时间序列的分析处理.将数据导入模型后,可以运行.但模型预测精度不高,且输出十分不稳定.此模型仅用于熟悉CNN模型的基本结构,如有错误,还望海涵. 目录 一.数据 ...

  3. Python工程能力进阶、数学基础、经典机器学习模型实战、深度学习理论基础和模型调优技巧……胜任机器学习工程师岗位需要学习什么?...

    咱不敢谈人工智能时代咋样咋样之类的空话,就我自己来看,只要是个营收超过 5 亿的互联网公司,基本都需要具备机器学习的能力.因为大部分公司盈利模式基本都会围绕搜索.推荐和广告而去. 就比如极客时间,他的 ...

  4. [转载]机器学习深度学习经典资料汇总,全到让人震惊

    自学成才秘籍!机器学习&深度学习经典资料汇总 转自:中国大数据: http://www.thebigdata.cn/JiShuBoKe/13299.html [日期:2015-01-27] 来 ...

  5. 深度学习 vs. 概率图模型 vs. 逻辑学

    深度学习 vs. 概率图模型 vs. 逻辑学 发表于2015-04-30 21:55|6304次阅读| 来源quantombone|1 条评论| 作者Tomasz Malisiewicz 深度学习de ...

  6. 从FM推演各深度学习CTR预估模型

    本文的PDF版本.代码实现和数据可以在我的github取到. 1.引言 点击率(click-through rate, CTR)是互联网公司进行流量分配的核心依据之一.比如互联网广告平台,为了精细化权 ...

  7. 深度学习经典论文汇总

    CV-CNN AlexNet(2012):深度学习热潮的奠基作 VGG(2014):使用 3x3 卷积构造更深的网络 GoogleNet(2014):使用并行架构构造更深的网络 ResNet(2015 ...

  8. 基于深度学习的图像识别模型研究综述

    基于深度学习的图像识别模型研究综述 摘要:深度学习是机器学习研究中的一个新的领域,其目的在于训练计算机完成自主学习.判断.决策等人类行为并建立.模拟人脑进行分析学习的神经网络,它模仿人类大脑的机制来解 ...

  9. 深度学习的seq2seq模型——本质是LSTM,训练过程是使得所有样本的p(y1,...,yT‘|x1,...,xT)概率之和最大...

    from:https://baijiahao.baidu.com/s?id=1584177164196579663&wfr=spider&for=pc seq2seq模型是以编码(En ...

最新文章

  1. AI开发人员使用频率最高的10个机器学习平台!
  2. C#中各种数据类型转换的方法的类
  3. python自动化安装软件_python自动化安装源码软件包
  4. php成品网站安装,PHPweb成品网站安装环境要求和安装方法
  5. 搭建开发环境tomcat起不来
  6. 《SQL高级应用和数据仓库基础(MySQL版)》学习笔记 ·003【表的约束、表的CRUD操作(DDL语句)】
  7. CentOS7.5安装Tigervnc-server
  8. 如何给网页添加icon图标?
  9. 中科大入学考试(数学)
  10. 学习arduino esp32相关例程(1)深度睡眠与唤醒
  11. MATLAB将数据存在TXT文件中
  12. 怎样在 Kindle 中使用微信读书?
  13. 软件四种维护详解(更正性维护、适应性维护、完善性维护、预防性维护)
  14. 最完整的Windows系统安装教程(Win7、Win10、Win11)
  15. 反相器 CMOS制造(Fabrication)与布局(Layout)
  16. 洛谷P2437 蜜蜂路线
  17. 新征程、新起点、新未来 热烈祝贺惠多多启航庆典大会圆满举行
  18. 【CGAL】表面细化
  19. c语言中终止线程的方法,终止线程优雅不使用TerminateThread()
  20. 添加附件按钮,并上传文件

热门文章

  1. 巴塞尔新资本协议_《巴塞尔公约》修订!进口再生颗粒或对中国产生巨大冲击...
  2. python 重复输出字符串
  3. 从 Spring Cloud 看一个微服务框架的「五脏六腑]
  4. pyCrypto python 3.5--转
  5. 基于 Java 2 运行时安全模型的线程协作--转
  6. Linux下Makefile的automake生成全攻略--转
  7. 转载--How to Install VMware Tools on CentOS 6.3
  8. hibernate 延迟加载(转载)
  9. LESSON 9.1 随机森林回归器的实现
  10. 在程序中进行make以后出现的一些错误以及解决方法