一、GOPS与FLOPS

1.1 FLOPS

FLOPS定义

FLOPS换算

前标的十进制与二进制

显卡FLOPS值

1.2 GOPS

1.3 FLOP与GOPS之间的换算

二、常规神经网络算力

2.1 AlexNet

2.2 ResNet-152

2.3 EIE算力

2.4 一些层的算力

三、FPGA平台上算力评估

3.1 zynqNet算力评估

3.2 MTCNN算量

一、GOPS与FLOPS

1.1 FLOPS

FLOPS定义

是“每秒所执行的浮点运算次数”（floating-point operations per second）的缩写。它常被用来估算电脑的执行效能，尤其是在使用到大量浮点运算的科学计算领域中。正因为FLOPS字尾的那个S，代表秒，而不是复数，所以不能省略掉。

在这里所谓的“浮点运算”，实际上包括了所有涉及小数的运算。这类运算在某类应用软件中常常出现，而它们也比整数运算更花时间。现今大部分的处理器中，都有一个专门用来处理浮点运算的“浮点运算器”（FPU）。也因此FLOPS所量测的，实际上就是FPU的执行速度。而最常用来测量FLOPS的基准程式（benchmark）之一，就是Linpack。

FLOPS换算

一个MFLOPS（megaFLOPS）等于每秒一百万（=10^6）次的浮点运算，

一个GFLOPS（gigaFLOPS）等于每秒十亿（=10^9）次的浮点运算，

一个TFLOPS（teraFLOPS）等于每秒一万亿（=10^12）次的浮点运算，(1太拉)

一个PFLOPS（petaFLOPS）等于每秒一千万亿（=10^15）次的浮点运算，

前标的十进制与二进制

此处存在疑问，从M到G再到T，到底是1024近似为1000，还是采用二进制的乘以1024，还是确实为十进制的1000

倾向于FLOP的前标与内存一样，是以二进制算，每进一级是1024为单位的。

但是1024^3是1073741824，可以近似为10^9。所以采用10^3来近似1024问题不大。

显卡FLOPS值

显卡根据价格算力从0.7TFLOPS/s到10TFLOPS/s不等。

1.2 GOPS

OPS与FLOPS类似，只不过OPS一个是操作次数，FLOPS一个是浮点操作次数。

1.3 FLOP与GOPS之间的换算

（FLOP与GOPS之间的换算需要查相关资料，后续查找资料给出）

不确定的看法是OPS是操作数量，FLOPS为浮点操作数量，两者可近似于相等，FLOPS比OPS稍大。

二、常规神经网络算力

据韩松毕业论文EFFICIENT METHODS AND HARDWARE FOR DEEP LEARNING P15

2.1 AlexNet

对于AlexNet处理224*224的图像，需要1.4GOPS

2.2 ResNet-152

对于224*224的图像，ResNet-152需要22.6GOPS

例如对于 1080p图像(像素点个数1920*1280) 的8路帧率为30FPS的图像。

22.6GOPS*30FPS*8路*（1920*1280/224^2）=265Teraop/sec

这个数量级为30张高端显卡。

2.3 EIE算力

EIE在稀疏网络上可达102GOPS/s，相当于同等级非稀疏网络的1TGOPS/s

2.4 一些层的算力

注意这里是剪枝后的FLOP，之前的FLOP可能要乘以12

这里不懂为什么韩松不把原来的FLOP值贴出来而是只贴剪枝后的FLOP

Table 3.6: Pruning GoogleNet reduces the number of weights by 3.5x and computation by 5x.

三、FPGA平台上算力评估

3.1 zynqNet算力评估

拆分为卷积的MACC操作的次数152,731,648 ,为10^8数量级（0.1G），7z035平台上时间约为2s

假定MACC操作9乘法8加法，算作17FLOP，zynqNet总算量2,596,438,016 FLOP，即2.59GFLOPS

算力1.3GFLOPS/s（韩松EIE为102GOPS/s）

3.2 MTCNN算量

MACC次数为85,176,568次到43,543,288次不等，10^7数量级（10M），每帧运算量0.74GOPS或1.448GOPS

按照zynqNet的算力约 0.9-1.75FPS

FLOPS与GOPS：各平台及神经网络算力算量调研相关推荐

卷积神经网络的参数量和计算量
<卷积神经网络的参数量和计算量> 对于在端部署的模型来说,模型的参数量以及计算量是锱铢必较的,使用什么样的激活函数,会有多大的计算成本.对于模型的压缩量化等都是模型的参数量和计算量的准 ...
百度站长平台使用教程：索引量
作者:悦然网络工作室原文:https://www.zsxxfx.com/2777.html 今天悦然网络工作室继续给大家分享百度站长平台使用教程.网站收录是大家最关心的网站数据指标之一,而与收录量对 ...
如何计算神经网络的参数量以及创建多隐藏层网络（总参数量接近）
文章目录计算神经网络的参数量创建多隐藏层的网络构建总参数量接近的神经网络计算神经网络的参数量对于全连接层来说,其单层的参数量为 (输入维度 + 1) * 该层神经元个数.这是因为全连接层的每 ...
Matlab实现自适应动态规划多层神经网络的算例汇总
使用MATLAB实现自适应动态规划(ADP)多层神经网络的算例,包括扭摆系统.仿射非线性算例以及"质量-弹簧-阻尼"系统.代码有偿,如有需求请私信联系. 扭摆系统 (torsion ...
【AI Studio平台基本操作】算力卡的使用获取及有关内容
算力卡算力卡说明算力卡获取邀请码验证以下有关文字内容部分源于官方文档,所有内容以官方为准算力卡说明 AI Studio 单机项目配备工业级NVIDIA Tesla V100 GPU资源. N ...
神经网络训练平台,在线神经网络训练
1.什么是神经网络学习神经网络学习由称为神经元的基本处理单元互连而成的平行工作的复杂网络系统,简称神经网络.当已知训练样本的数据加到网络输入端时,网络的学习机制一遍又一遍地调整各神经元的权值,使其输 ...
px4与simulink搭建ppo在环训练平台，神经网络飞控
PPO网络结构 ppo训练的方式为在线训练,在线训练的好处在于其存在2个网络,以降低对环境的拟合程度,也正因如此,可以使用ppo old网络作为试探网络,将其上传至px4飞控控制环作为数据收集的试探网 ...
神经网络的计算量(FLOPs)、参数量(Params)、推理时间（FPS）的定义及实现方法
目录 1. 定义 2. 实现方法 2.1. 计算参数量 2.2. 计算参数量和FLOPs 2.3. 计算推理时间(FPS) 3. 数据大小对参数量和FLOPs的影响 4. 参数量和FLOPs对于硬件要 ...
移动平台深度神经网络实战
这是一本刚刚上市的深度学习移动端部署加速实战书, 介绍了移动端深度学习的原理 + 实战工具, 非常适合工业界的朋友参考. 52CV联合出版商「华章图书」包邮送书 8 本. 参与方式: 在本文末评论区 ...

FLOPS与GOPS：各平台及神经网络算力算量调研

一、GOPS与FLOPS

1.1 FLOPS

FLOPS定义

FLOPS换算

前标的十进制与二进制

显卡FLOPS值

1.2 GOPS

1.3 FLOP与GOPS之间的换算

二、常规神经网络算力

2.1 AlexNet

2.2 ResNet-152

2.3 EIE算力

2.4 一些层的算力

三、FPGA平台上算力评估

3.1 zynqNet算力评估

3.2 MTCNN算量

FLOPS与GOPS：各平台及神经网络算力算量调研相关推荐

最新文章

热门文章