1.TOPS(Tera Operations Per Second)每秒万亿次操作 处理器运算能力单位

TOPS是Tera Operations Per Second的缩写,1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作。没有指定数据类型,具体评价算力需要结合数据精度。例如某块芯片算力在INT8的数据格式下1TOPS算力,另外芯片在实际跑模型时也无法达到百分之百 ,百分之五十左右较为正常。

与此对应的还有GOPS(Giga Operations Per Second),MOPS(Million Operation Per Second)算力单位。1GOPS代表处理器每秒钟可进行十亿次(10^9)操作,1MOPS代表处理器每秒钟可进行一百万次(10^6)操作。TOPS同GOPS与MOPS可以换算。

在某些情况下,还使用 TOPS/W 来作为评价处理器运算能力的一个性能指标,TOPS/W 用于度量在1W功耗的情况下,处理器能进行多少万亿次操作。

1.1 TOPS理论值取决于运算精度,MACC的数量和运行频率。

可大致简化为INT8位精度下的MACC(乘加运算 下面有解释)数量在FP16(半浮点数,也就是16位浮点数)精度下等于减少了一半。FP32(浮点数,也就是32位浮点数)再减少一半,依次类推。

假设有512MACC运算单元,运行频率为1GHz,INT8的数据结构和精度,算力为512 x 2(2理解为一个MACC为一次乘法和一次加法 为两次运算操作) x 1 GHz = 1000 Billion Operations/Second = 1 TOPS(Tera-Operations/second)。FP16精度那么就是0.5TOPS,FP32精度就是0.25TOPS。英伟达的Tesla V100有640个Tensor核,每核有64个MAC运算单元,运行频率大约1.480GHz,那么INT8下算力为640 * 64 * 2 * 1.480 GHz=121TOPS。

TOPS仅仅指处理器每秒万亿次操作,需要结合具体数据类型精度才可以于FLOPS转换。

2.FLOPS(floating-point operations per second)每秒所执行的浮点运算次数,表示运算速度。

区别于FLOPs
是“每秒所执行的浮点运算次数”(floating-point operations per second)的缩写。它常被用来估算电脑的执行效能,尤其是在使用到大量浮点运算的科学计算领域中。正因为FLOPS字尾的那个S,代表秒,而不是复数,所以不能省略掉。

在这里所谓的“浮点运算”,实际上包括了所有涉及小数的运算。这类运算在某类应用软件中常常出现,而它们也比整数运算更花时间。现今大部分的处理器中,都有一个专门用来处理浮点运算的“浮点运算器”(FPU)。也因此FLOPS所量测的,实际上就是FPU的执行速度。而最常用来测量FLOPS的基准程式(benchmark)之一,就是Linpack。

FLOPS换算
一个MFLOPS(megaFLOPS)等于每秒一百万(=10^6)次的浮点运算,

一个GFLOPS(gigaFLOPS)等于每秒十亿(=10^9)次的浮点运算,

一个TFLOPS(teraFLOPS)等于每秒一万亿(=10^12)次的浮点运算,

一个PFLOPS(petaFLOPS)等于每秒一千万亿(=10^15)次的浮点运算。

3.FLOPs(FLoating point OPerations(s表复数))浮点运算次数,表示运算量,区别于FLOPS。

这个参数常用来评价深度学习的模型的运算量,如果已知模型FLOPs可通过换算求的某个已知参数的芯片运行一遍模型的时间。

例如INT8 1TOPS算力的芯片  1TFLPs的模型  假设芯片效率百分之百  运行一遍 需要4秒  因为1TFLPs单位是FP32

意指浮点运算数,理解为计算量。可以用来衡量模型的复杂度。针对神经网络模型的复杂度评价,应指的是FLOPs,而非FLOPS。FLOPS意指每秒浮点运算次数,理解为计算速度。

FLOPs描述了数据过一遍这么复杂的网络需要多大的计算量,即使用该模型时所需的计算力总量。

MAC(Memory Access Cost)内存访问成本

MAC描述了这个复杂的网络到底需要多少参数才能定义它,即存储该模型所需的存储空间。

例如某个模型需要256000个浮点参数定义,转化为bit 乘以32得8192000bit,再除8转化为Byte,1024KB,也就是1M,那么这个模型大小约为1M。

MADDs、MACCs(multiply-accumulate operations(s表复数))

MADDs、MACCs同一个意思。

表示乘加运算:b乘c 加上a重新赋值于a 为一次MACC指令  两次OP 1MACC ≈ 2OP

乘加运算是模型运算里的基本单元,矩阵的运算基本都是乘加。

芯片模型算力指标TOPS FLOPS MAC MACC MADD关系相关推荐

  1. CNN模型复杂度(FLOPs、MAC)、参数量与运行速度

    CNN模型复杂度(FLOPs.MAC).参数量与运行速度 先转载一下,有空再来整理 文章目录 0. 模型复杂度简介 1. 模型复杂度之一:模型参数量的计算方法 卷积层参数量计算 全连接层参数量计算 2 ...

  2. 芯片算力(TOPS, GOPS, MOPS)与精度(int8,int16)

    芯片算力是描述处理器进行运算,对数据进行操作的能力的指标.字面上理解,芯片算力越大,每秒能够进行的运算次数就越多,执行计算任务就越快. 算力的基本单位有: TOPS:Tera Operations P ...

  3. DMIPS, TOPS, FLOPS, FLOPs, GMACs, FMA

    FLOPS MFLOPS GFLOPS TFLOPS PFLOPS GFLOPS是Paper里比较流行的单位. MFLOPS Mega(106)/Giga(109)/Tera(1012)/Peta(1 ...

  4. kmeans及模型评估指标_模型评估常用指标

    一. ROC曲线和AUC值 在逻辑回归.随机森林.GBDT.XGBoost这些模型中,模型训练完成之后,每个样本都会获得对应的两个概率值,一个是样本为正样本的概率,一个是样本为负样本的概率.把每个样本 ...

  5. 机器学习模型评估指标总结!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:太子长琴,Datawhale优秀学习者 本文对机器学习模型评估指标 ...

  6. R语言分类模型:逻辑回归模型LR、决策树DT、推理决策树CDT、随机森林RF、支持向量机SVM、Rattle可视化界面数据挖掘、分类模型评估指标(准确度、敏感度、特异度、PPV、NPV)

    R语言分类模型:逻辑回归模型LR.决策树DT.推理决策树CDT.随机森林RF.支持向量机SVM.Rattle可视化界面数据挖掘.分类模型评估指标(准确度.敏感度.特异度.PPV.NPV) 目录

  7. 模型评估指标micro avg、macro avg和weighted avg的计算方式及区别

    模型评估指标micro avg.macro avg和weighted avg的计算方式及区别-技术圈

  8. Lesson 5.分类模型决策边界与模型评估指标

    Lesson 5.分类模型决策边界与模型评估指标(上) 在逻辑回归的算法基础内容结束之后,我们还需要补充一些关于分类模型的基础知识,包括观察分类模型判别性能的决策边界基本的概念与实现方法,同时也包括对 ...

  9. 【采用】信贷业务风控逾期指标及风控模型评估指标

    一.互联网金融中需要关注的风控逾期指标 1.逾期天数 DPD (Days Past Due) 自应还日次日起到实还日期间的日期数 举例:DPDN+表示逾期天数 >=N天,如DPD30+表逾期天数 ...

最新文章

  1. python动态类型是如何实现的_Python 的动态类型系统
  2. Facebook开源高效图像Transformer,速度、准确率与泛化性能媲美SOTA CNN
  3. 单片机c语言编程300例_趣味c语言编程100例(四)
  4. 1.4 Padding-深度学习第四课《卷积神经网络》-Stanford吴恩达教授
  5. Mosaic获5.5亿美元住宅太阳能融资贷款
  6. oracle链接失去联系,[Oracle报错]ORA-03135: connection lost contact.
  7. Linux基础(1)---top命令
  8. An impassioned circulation of affection(尺取+预处理)
  9. 用商业模式改变世界(上)
  10. mac虚拟机桌面图标隐藏_教你隐藏 Mac 的桌面文件
  11. MySQL 源码下载教程
  12. 医院信息化整体解决方案
  13. 神经派考古学 - 推荐一个blog
  14. SpiderMonkey 入门
  15. 网络共享计算机怎么连接,网络共享,详细教您电脑怎么设置共享无线网络
  16. 欢迎大家访问我的网站
  17. CSS Font-awesome字体图标库文件
  18. 核电站问题(简单DP)
  19. 无线路由传输速率的秘密
  20. 互联网日报 | 2月28日 星期日 | 百世快递回应部分网点倒闭;上汽奥迪明年一季度开始销售;魅族18系列取消附送充电器...

热门文章

  1. 众安保险 x StarRocks | 全新实时分析能力开启数字化经营新局面
  2. 韦东山第1期-学习笔记-4
  3. iphone比android好在,比Android手机强在哪里?iPhone 6遇挑战
  4. 添加飞船图像:创建ship类与在屏幕上绘制飞船
  5. Linux 系统进程、线程之间的爱恨纠葛
  6. 计算机如何访问苹果6s的相册,苹果手机怎么连接到电脑传照片 两种方法帮你实现!...
  7. scikit-image库-- 圆形和椭圆形霍夫变换(十七)
  8. 新手玩转Linux Kernel漏洞之Null Pointer Dereference
  9. Oracle进阶(八)自定义函数(Function)
  10. 99%苹果手机用户被“大数据杀熟”,你中招没?