ARM 处理器 MIPS/DMIPS/MFLOPS 理解

  • 前言
  • MIPS(Million Instructions Per Second)
  • DMIPS(Dhrystone Million Instructions executed Per Second)
  • FLOPS:Floating-point Operations Per Second
  • TOPS: Tera Operations Per Second
  • NVIDIA T4显卡性能
  • 其他显卡性能
  • ARM处理器比较 Cortex-A 系列
  • ARM处理器比较 Cortex-M 系列

前言

现在随着计算机使用了多级流水线结构,取指、译码、执行等并行方式,单纯使用频率确定性能不太合理,所以采用计算性能来测定cpu性能比较合理,主要有MIPS,DMIPS和FLOPS三个主要概念。

MIPS(Million Instructions Per Second)

MIPS(Million Instructions Per Second):字面理解为百万条指令/秒,即每秒执行百万级指令数。这是衡量CPU速度的一个指标。像是一个Intel 80386 电脑可以每秒处理3百万到5百万机器语言指令,既我们可以说80386是3到5MIPS的CPU。MIPS只是衡量CPU性能的指标。

DMIPS(Dhrystone Million Instructions executed Per Second)

Dhrystone是测量处理器运算能力的最常见基准程序之一,常用于处理器的整型运算性能的测量。Dhrystone是一种整数运算测试程序。

FLOPS:Floating-point Operations Per Second

表示CPU的每秒执行的浮点运算次数,主要用于衡量计算机的浮点运算能力。

  • 1 MFLOPS = 10^6 FLOPS
  • 1 GFLOPS = 10^9 FLOPS
  • 1 TFLOPS = 10^12 FLOPS
  • 1 PFLOPS = 10^15 FLOPS

TOPS: Tera Operations Per Second

处理器每秒钟可进行10^12操作,包括整数的运算和浮点数运算,和FLOPS有一定差别。

NVIDIA T4显卡性能

NVIDIA T4显卡性能 :https://www.nvidia.com/en-us/data-center/tesla-t4/
说明了FP32的浮点运算为 8.1TFLOPS,但是用INT4的整数运算时,可达到 260 TOPS

参数 数值
TURING TENSOR CORES 320
NVIDIA CUDA® CORES 2,560
SINGLE PRECISION PERFORMANCE 8.1 FP32 TFLOPS
MIXED PRECISION (FP16/FP32) 65 FP16 TFLOPS
INT8 PRECISION 130 INT8 TOPS
INT4 PRECISION 260 INT4 TOPS

其他显卡性能

产品 性能
谷歌 Cloud TPU v3 420 TFLOPS
华为昇腾910 256 TFLOPS
Groq TSP 250 TFLOPS
NVIDIA Tesla V100 GPU 125 TFLOPS
Intel Movidius 100 GFLOPS
Intel 10代酷睿 1.12 (FP32)TFLOPS 2.25(FP16)TFLOPS
地平线 Sunrise 4 TOPS
高通骁龙865 15 TOPS
高通骁龙855 7 TOPS

ARM处理器比较 Cortex-A 系列

Core Architecture bits I-Cache D-Cache DMIPS/MHz
ARM11 v7-A 32 4-64K 4-64K 1.25
Cortex-A5 ARMv7-A 32 4-64K 4-64K 1.57
Cortex-A7 ARMv7-A 32 8-64K 8-64K 1.9
Cortex-A8 ARMv7-A 32 16-32K 16-32K 2.0
Cortex-A9 ARMv7-A 32 16-64K 16-64K 2.5
Cortex-A12 ARMv7-A 32 - - 3.5
Cortex-A15 ARMv7-A 32 32K 32K 3.4
Cortex-A17 ARMv7-A 32 32-64K 32K 3.2
Cortex-A32 ARMv8-A 32 8-64K 8-64K 2.3
Cortex-A35 ARMv8-A 32/64 8-64K 8-64K 2.5
Cortex-A53 ARMv8-A 32/64 8-64K 8-64K 2.3
Cortex-A55 ARMv8.2-A 32/64 64K 64K 2.7
Cortex-A57 ARMv8-A 32/64 48K 32K 4.1
Cortex-A72 ARMv8-A 32/64 48K 32K 4.7
Cortex-A73 ARMv8-A 32/64 64K 32-64k 4.8
Cortex-A75 ARMv8.2-A 32/64 64K 64k 5.2
Cortex-A76 ARMv8.2-A 32/64 64K 64k -

ARM处理器比较 Cortex-M 系列

Core Architecture bits DMIPS/MHz DSP
Cortex-M0 ARMv6M 32 0.9~0.99
Cortex-M3 ARMv6M 32 1.25~1.5
Cortex-M4 ARMv6M 32 1.25~1.52
Cortex-M7 ARMv7-M 32 2.14/2.55/3.23

【算力理解】MIPS/DMIPS/MFLOPS 理解相关推荐

  1. 算力理解MIPS/DMIPS/MFLOPS/TOPS

    参考:各种芯片简述以及算力解释 不要太较真自动驾驶算力(TOPS) 文章目录 一.CPU计算性能指标 1. MIPS 2. DMIPS(干石MIPS) 3. FLOPS/MFLOPS/GFLOPS/T ...

  2. ARM 处理器 MIPS/DMIPS/MFLOPS

    转自:ARM 处理器 MIPS/DMIPS/MFLOPS 理解 - 走看看 现在随着计算机使用了多级流水线结构,取指.译码.执行等并行方式,单纯使用频率确定性能不太合理,所以采用计算性能来测定cpu性 ...

  3. MIPS DMIPS MFLOPS名词解释

    MIPS: Million Instructions executed Per Second,每秒百万条指令,用来计算同一秒内系统的处理能力 DMIPS:Dhrystone Million Instr ...

  4. 调整模型 与 提纯样本的关系过程有点类似EM算法过程,不知道这样理解是否是正确理解,固定A调B,B调到最优后,固定B再调A,循环往复,直至最优。

    调整模型 与 提纯样本的关系过程有点类似EM算法过程,不知道这样理解是否是正确理解,固定A调B,B调到最优后,固定B再调A,循环往复,直至最优.  个人理解

  5. 理解SSL必须要理解的密码技术

    要理解SSL就必须理解密码系统.消息摘要函数(单向或散列函数)和数字签名,这些技术是许多文献所讨论的主题(比如[AC96),提供了保密性.完整性和认证的基础. 密码系统 假设Alice想给她的银行发一 ...

  6. 【Day 3】机器阅读理解——常见机器阅读理解模型(下)

    引言 本文介绍常见机器阅读理解模型中的R-NET.FusionNet和QA-Net. 上一篇: 机器阅读理解--常见机器阅读理解模型(上) 下一篇: R-NET R-Net1在Attention计算中 ...

  7. 为什么MIPS和MFLOPS不能代表性能?

    MIPS: 每秒执行的百万级机器语言的指令数量(Millon Instructions Per Second,MIPS) MFLOPS: 每秒执行的百万级机器语言的浮点指令数量(Million Flo ...

  8. 自然语言理解,什么是“理解”?

    以前看过一本讲西方哲学史的书,书上有一个笑话,就是一个哲学家提出了一个问题:什么是人?然后其他人回答说身上没毛且长两条腿的动物,第二天哲学家就抓了一只拔了毛的鸡,说:看这就是你说的 "人&q ...

  9. 【算力理解】DMIPS、FLOPS区别和联系

    DMIPS.FLOPS区别和联系 1. 什么是DMIPS? 2. 什么是FLOPS? 3. 怎么评测DMIPS? 3.1 用Dhrystone可以实测DMIP 3.2 通过公式计算DMIPS 4 怎么 ...

最新文章

  1. Servlet生命周期与工作原理
  2. Magento中如何在模块中使用多张数据表并配置多个model?
  3. android组件通讯 Intent- 系统标准的Activity Action应用
  4. Struts2 - 处理一个form多个submit
  5. HDU-2079 选课时间(题目已修改,注意读题) -母函数
  6. CVE-2019-2725复现(从环境搭建到getshell)
  7. 强制禁用gitlab的双因子认证:Two-Factor Authentication
  8. 2017 ICPC沈阳区域赛
  9. es删除数据_面试官是怎么来考察你对ES搜索引擎的理解?
  10. 怎么查看电脑有没有python_python人工智能爬虫系列:怎么查看python版本_电脑计算机编程入门教程自学...
  11. 解读《美国国家BIM标准》– BIM能力成熟度模型(九)
  12. 【和小冉一起学习c++】踏入c++的大门~第一个c++程序
  13. 中医大2020年7月网考计算机应用基础,2020年7月网络教育统考计算机应用基础模拟题试卷9...
  14. sqlserver 导入导出数据向导
  15. python 曲线平滑_曲线平滑(smoothing)
  16. 辉芒微单片机的c语言仿真器,辉芒微单片机
  17. win10如何更改计算机用户名,手把手教你win10下怎么修改账户用户名
  18. Supervisor 命令
  19. 孩子到底是食物过敏?还是食物不耐受?
  20. 苏宁API接口,Onebound数据

热门文章

  1. POJ 2386(DFS)
  2. 安卓手机备份_备份安卓手机中的APK安装文件?小编这儿有4种方法!
  3. win11和win10哪个好?
  4. HTC HD2上运行Meego
  5. 任意深度同步FIFO设计总结(非2次幂)
  6. PHP--地球坐标系转为火星坐标系再转为高德坐标系
  7. 独家精心总结Photoshop快捷键大全
  8. 中医53个很牛的秘方
  9. 《Accelerated C++》导读(Chapter 6)
  10. 树莓派 Raspberry Pi 3B+安装官方系统(一)