【算力理解】MIPS/DMIPS/MFLOPS 理解
ARM 处理器 MIPS/DMIPS/MFLOPS 理解
- 前言
- MIPS(Million Instructions Per Second)
- DMIPS(Dhrystone Million Instructions executed Per Second)
- FLOPS:Floating-point Operations Per Second
- TOPS: Tera Operations Per Second
- NVIDIA T4显卡性能
- 其他显卡性能
- ARM处理器比较 Cortex-A 系列
- ARM处理器比较 Cortex-M 系列
前言
现在随着计算机使用了多级流水线结构,取指、译码、执行等并行方式,单纯使用频率确定性能不太合理,所以采用计算性能来测定cpu性能比较合理,主要有MIPS,DMIPS和FLOPS三个主要概念。
MIPS(Million Instructions Per Second)
MIPS(Million Instructions Per Second):字面理解为百万条指令/秒,即每秒执行百万级指令数。这是衡量CPU速度的一个指标。像是一个Intel 80386 电脑可以每秒处理3百万到5百万机器语言指令,既我们可以说80386是3到5MIPS的CPU。MIPS只是衡量CPU性能的指标。
DMIPS(Dhrystone Million Instructions executed Per Second)
Dhrystone是测量处理器运算能力的最常见基准程序之一,常用于处理器的整型运算性能的测量。Dhrystone是一种整数运算测试程序。
FLOPS:Floating-point Operations Per Second
表示CPU的每秒执行的浮点运算次数,主要用于衡量计算机的浮点运算能力。
- 1 MFLOPS = 10^6 FLOPS
- 1 GFLOPS = 10^9 FLOPS
- 1 TFLOPS = 10^12 FLOPS
- 1 PFLOPS = 10^15 FLOPS
TOPS: Tera Operations Per Second
处理器每秒钟可进行10^12操作,包括整数的运算和浮点数运算,和FLOPS有一定差别。
NVIDIA T4显卡性能
NVIDIA T4显卡性能 :https://www.nvidia.com/en-us/data-center/tesla-t4/
说明了FP32的浮点运算为 8.1TFLOPS,但是用INT4的整数运算时,可达到 260 TOPS
参数 | 数值 |
---|---|
TURING TENSOR CORES | 320 |
NVIDIA CUDA® CORES | 2,560 |
SINGLE PRECISION PERFORMANCE | 8.1 FP32 TFLOPS |
MIXED PRECISION (FP16/FP32) | 65 FP16 TFLOPS |
INT8 PRECISION | 130 INT8 TOPS |
INT4 PRECISION | 260 INT4 TOPS |
其他显卡性能
产品 | 性能 |
---|---|
谷歌 Cloud TPU v3 | 420 TFLOPS |
华为昇腾910 | 256 TFLOPS |
Groq TSP | 250 TFLOPS |
NVIDIA Tesla V100 GPU | 125 TFLOPS |
Intel Movidius | 100 GFLOPS |
Intel 10代酷睿 | 1.12 (FP32)TFLOPS 2.25(FP16)TFLOPS |
地平线 Sunrise | 4 TOPS |
高通骁龙865 | 15 TOPS |
高通骁龙855 | 7 TOPS |
ARM处理器比较 Cortex-A 系列
Core | Architecture | bits | I-Cache | D-Cache | DMIPS/MHz |
---|---|---|---|---|---|
ARM11 | v7-A | 32 | 4-64K | 4-64K | 1.25 |
Cortex-A5 | ARMv7-A | 32 | 4-64K | 4-64K | 1.57 |
Cortex-A7 | ARMv7-A | 32 | 8-64K | 8-64K | 1.9 |
Cortex-A8 | ARMv7-A | 32 | 16-32K | 16-32K | 2.0 |
Cortex-A9 | ARMv7-A | 32 | 16-64K | 16-64K | 2.5 |
Cortex-A12 | ARMv7-A | 32 | - | - | 3.5 |
Cortex-A15 | ARMv7-A | 32 | 32K | 32K | 3.4 |
Cortex-A17 | ARMv7-A | 32 | 32-64K | 32K | 3.2 |
Cortex-A32 | ARMv8-A | 32 | 8-64K | 8-64K | 2.3 |
Cortex-A35 | ARMv8-A | 32/64 | 8-64K | 8-64K | 2.5 |
Cortex-A53 | ARMv8-A | 32/64 | 8-64K | 8-64K | 2.3 |
Cortex-A55 | ARMv8.2-A | 32/64 | 64K | 64K | 2.7 |
Cortex-A57 | ARMv8-A | 32/64 | 48K | 32K | 4.1 |
Cortex-A72 | ARMv8-A | 32/64 | 48K | 32K | 4.7 |
Cortex-A73 | ARMv8-A | 32/64 | 64K | 32-64k | 4.8 |
Cortex-A75 | ARMv8.2-A | 32/64 | 64K | 64k | 5.2 |
Cortex-A76 | ARMv8.2-A | 32/64 | 64K | 64k | - |
ARM处理器比较 Cortex-M 系列
Core | Architecture bits | DMIPS/MHz | DSP |
---|---|---|---|
Cortex-M0 | ARMv6M | 32 | 0.9~0.99 |
Cortex-M3 | ARMv6M | 32 | 1.25~1.5 |
Cortex-M4 | ARMv6M | 32 | 1.25~1.52 |
Cortex-M7 | ARMv7-M | 32 | 2.14/2.55/3.23 |
【算力理解】MIPS/DMIPS/MFLOPS 理解相关推荐
- 算力理解MIPS/DMIPS/MFLOPS/TOPS
参考:各种芯片简述以及算力解释 不要太较真自动驾驶算力(TOPS) 文章目录 一.CPU计算性能指标 1. MIPS 2. DMIPS(干石MIPS) 3. FLOPS/MFLOPS/GFLOPS/T ...
- ARM 处理器 MIPS/DMIPS/MFLOPS
转自:ARM 处理器 MIPS/DMIPS/MFLOPS 理解 - 走看看 现在随着计算机使用了多级流水线结构,取指.译码.执行等并行方式,单纯使用频率确定性能不太合理,所以采用计算性能来测定cpu性 ...
- MIPS DMIPS MFLOPS名词解释
MIPS: Million Instructions executed Per Second,每秒百万条指令,用来计算同一秒内系统的处理能力 DMIPS:Dhrystone Million Instr ...
- 调整模型 与 提纯样本的关系过程有点类似EM算法过程,不知道这样理解是否是正确理解,固定A调B,B调到最优后,固定B再调A,循环往复,直至最优。
调整模型 与 提纯样本的关系过程有点类似EM算法过程,不知道这样理解是否是正确理解,固定A调B,B调到最优后,固定B再调A,循环往复,直至最优. 个人理解
- 理解SSL必须要理解的密码技术
要理解SSL就必须理解密码系统.消息摘要函数(单向或散列函数)和数字签名,这些技术是许多文献所讨论的主题(比如[AC96),提供了保密性.完整性和认证的基础. 密码系统 假设Alice想给她的银行发一 ...
- 【Day 3】机器阅读理解——常见机器阅读理解模型(下)
引言 本文介绍常见机器阅读理解模型中的R-NET.FusionNet和QA-Net. 上一篇: 机器阅读理解--常见机器阅读理解模型(上) 下一篇: R-NET R-Net1在Attention计算中 ...
- 为什么MIPS和MFLOPS不能代表性能?
MIPS: 每秒执行的百万级机器语言的指令数量(Millon Instructions Per Second,MIPS) MFLOPS: 每秒执行的百万级机器语言的浮点指令数量(Million Flo ...
- 自然语言理解,什么是“理解”?
以前看过一本讲西方哲学史的书,书上有一个笑话,就是一个哲学家提出了一个问题:什么是人?然后其他人回答说身上没毛且长两条腿的动物,第二天哲学家就抓了一只拔了毛的鸡,说:看这就是你说的 "人&q ...
- 【算力理解】DMIPS、FLOPS区别和联系
DMIPS.FLOPS区别和联系 1. 什么是DMIPS? 2. 什么是FLOPS? 3. 怎么评测DMIPS? 3.1 用Dhrystone可以实测DMIP 3.2 通过公式计算DMIPS 4 怎么 ...
最新文章
- Servlet生命周期与工作原理
- Magento中如何在模块中使用多张数据表并配置多个model?
- android组件通讯 Intent- 系统标准的Activity Action应用
- Struts2 - 处理一个form多个submit
- HDU-2079 选课时间(题目已修改,注意读题) -母函数
- CVE-2019-2725复现(从环境搭建到getshell)
- 强制禁用gitlab的双因子认证:Two-Factor Authentication
- 2017 ICPC沈阳区域赛
- es删除数据_面试官是怎么来考察你对ES搜索引擎的理解?
- 怎么查看电脑有没有python_python人工智能爬虫系列:怎么查看python版本_电脑计算机编程入门教程自学...
- 解读《美国国家BIM标准》– BIM能力成熟度模型(九)
- 【和小冉一起学习c++】踏入c++的大门~第一个c++程序
- 中医大2020年7月网考计算机应用基础,2020年7月网络教育统考计算机应用基础模拟题试卷9...
- sqlserver 导入导出数据向导
- python 曲线平滑_曲线平滑(smoothing)
- 辉芒微单片机的c语言仿真器,辉芒微单片机
- win10如何更改计算机用户名,手把手教你win10下怎么修改账户用户名
- Supervisor 命令
- 孩子到底是食物过敏?还是食物不耐受?
- 苏宁API接口,Onebound数据