2020-12-09 深度学习 经典CNN模型计算量与内存需求分析
经典CNN模型计算量与内存需求分析
表1 CNN经典模型的内存,计算量和参数数量对比
AlexNet |
VGG16 |
Inception-v3 |
|
模型内存(MB) |
>200 |
>500 |
90-100 |
参数(百万) |
60 |
138 |
23.2 |
计算量(百万) |
720 |
15300 |
5000 |
1. CNN模型具体分析(以AlexNet网络模型为例)
1.1 网络结构
图1 AlexNet网络结构
AlexNet有5个卷积层和3个全连接层
C1:96×11×11×3 (卷积核个数/宽/高/深度) 34848个
C2:256×5×5×48(卷积核个数/宽/高/深度) 307200个
C3:384×3×3×256(卷积核个数/宽/高/深度) 884736个
C4:384×3×3×192(卷积核个数/宽/高/深度) 663552个
C5:256×3×3×192(卷积核个数/宽/高/深度) 442368个
R1:4096×6×6×256(卷积核个数/宽/高/深度) 37748736个
R2:4096×4096 16777216个
R3:4096×1000 4096000个
共6000万个参数
1.2 AlexNet模型内存大小计算
6000万(个参数)×32位(float32)=19.2亿位≈228.88MB
1.3 AlexNet模型计算力消耗
图2 AlexNet模型每层每秒浮点运算次数及参数数量
1.4 AlexNet网络模型配置
AlexNet网络模型获得了2012年ImageNet比赛的冠军。AlexNet使用两块GTX580显卡进行训练,两块GPU各训练网络的一部分,在第二个卷积层和全连接层两块GPU之间才进行互相通信。
2020-12-09 深度学习 经典CNN模型计算量与内存需求分析相关推荐
- 【深度学习】CNN模型的可视化-1
CNN模型学到的东西很适合可视化,这里介绍三种方法: 可视化CNN模型的中间输出(中间激活):帮助我们理解CNN是如何对输入进行变换,以及CNN每个卷积核的含义 可视化CNN的卷积核:帮助我们理解卷积 ...
- 【深度学习】CNN模型处理简单时间序列
本文使用CNN模型,Conv1d卷积进行时间序列的分析处理.将数据导入模型后,可以运行.但模型预测精度不高,且输出十分不稳定.此模型仅用于熟悉CNN模型的基本结构,如有错误,还望海涵. 目录 一.数据 ...
- Python工程能力进阶、数学基础、经典机器学习模型实战、深度学习理论基础和模型调优技巧……胜任机器学习工程师岗位需要学习什么?...
咱不敢谈人工智能时代咋样咋样之类的空话,就我自己来看,只要是个营收超过 5 亿的互联网公司,基本都需要具备机器学习的能力.因为大部分公司盈利模式基本都会围绕搜索.推荐和广告而去. 就比如极客时间,他的 ...
- [转载]机器学习深度学习经典资料汇总,全到让人震惊
自学成才秘籍!机器学习&深度学习经典资料汇总 转自:中国大数据: http://www.thebigdata.cn/JiShuBoKe/13299.html [日期:2015-01-27] 来 ...
- 深度学习 vs. 概率图模型 vs. 逻辑学
深度学习 vs. 概率图模型 vs. 逻辑学 发表于2015-04-30 21:55|6304次阅读| 来源quantombone|1 条评论| 作者Tomasz Malisiewicz 深度学习de ...
- 从FM推演各深度学习CTR预估模型
本文的PDF版本.代码实现和数据可以在我的github取到. 1.引言 点击率(click-through rate, CTR)是互联网公司进行流量分配的核心依据之一.比如互联网广告平台,为了精细化权 ...
- 深度学习经典论文汇总
CV-CNN AlexNet(2012):深度学习热潮的奠基作 VGG(2014):使用 3x3 卷积构造更深的网络 GoogleNet(2014):使用并行架构构造更深的网络 ResNet(2015 ...
- 基于深度学习的图像识别模型研究综述
基于深度学习的图像识别模型研究综述 摘要:深度学习是机器学习研究中的一个新的领域,其目的在于训练计算机完成自主学习.判断.决策等人类行为并建立.模拟人脑进行分析学习的神经网络,它模仿人类大脑的机制来解 ...
- 深度学习的seq2seq模型——本质是LSTM,训练过程是使得所有样本的p(y1,...,yT‘|x1,...,xT)概率之和最大...
from:https://baijiahao.baidu.com/s?id=1584177164196579663&wfr=spider&for=pc seq2seq模型是以编码(En ...
最新文章
- AI开发人员使用频率最高的10个机器学习平台!
- C#中各种数据类型转换的方法的类
- python自动化安装软件_python自动化安装源码软件包
- php成品网站安装,PHPweb成品网站安装环境要求和安装方法
- 搭建开发环境tomcat起不来
- 《SQL高级应用和数据仓库基础(MySQL版)》学习笔记 ·003【表的约束、表的CRUD操作(DDL语句)】
- CentOS7.5安装Tigervnc-server
- 如何给网页添加icon图标?
- 中科大入学考试(数学)
- 学习arduino esp32相关例程(1)深度睡眠与唤醒
- MATLAB将数据存在TXT文件中
- 怎样在 Kindle 中使用微信读书?
- 软件四种维护详解(更正性维护、适应性维护、完善性维护、预防性维护)
- 最完整的Windows系统安装教程(Win7、Win10、Win11)
- 反相器 CMOS制造(Fabrication)与布局(Layout)
- 洛谷P2437 蜜蜂路线
- 新征程、新起点、新未来 热烈祝贺惠多多启航庆典大会圆满举行
- 【CGAL】表面细化
- c语言中终止线程的方法,终止线程优雅不使用TerminateThread()
- 添加附件按钮,并上传文件
热门文章
- 巴塞尔新资本协议_《巴塞尔公约》修订!进口再生颗粒或对中国产生巨大冲击...
- python 重复输出字符串
- 从 Spring Cloud 看一个微服务框架的「五脏六腑]
- pyCrypto python 3.5--转
- 基于 Java 2 运行时安全模型的线程协作--转
- Linux下Makefile的automake生成全攻略--转
- 转载--How to Install VMware Tools on CentOS 6.3
- hibernate 延迟加载(转载)
- LESSON 9.1 随机森林回归器的实现
- 在程序中进行make以后出现的一些错误以及解决方法