FLOPS(即“每秒浮点运算次数”,“每秒峰值速度”),是“每秒所执行的浮点运算次数”(floating-point operations per second)的缩写。它常被用来估算电脑的执行效能,尤其是在使用到大量浮点运算的科学计算领域中。正因为FLOPS字尾的那个S,代表秒,而不是复数,所以不能省略掉。

一个MFLOPS(megaFLOPS)等于每秒一佰万(=10^6)次的浮点运算,

一个GFLOPS(gigaFLOPS)等于每秒十亿(=10^9)次的浮点运算,

一个TFLOPS(teraFLOPS)等于每秒一万亿(=10^12)次的浮点运算,(1太拉)

一个PFLOPS(petaFLOPS)等于每秒一千万亿(=10^15)次的浮点运算,

一个EFLOPS(exaFLOPS)等于每秒一佰京(=10^18)次的浮点运算。

浮点计算峰值=处理器个数×处理器主频×每秒可进行的最高浮点运算次数(FMAD,乘加指令)

如下图所示:G80以及至今所有nvidia GPU的流处理器内部有两个ALU单元。
流处理器工作频率 x 流处理器数量 x 每流处理器的FLOPs数量(2个)=总数

每流处理器的FLOPs数量 == 指令吞吐率 = 2

sp可以做一个乘法一个加法

kepler:2880*0.745*2=4290Gflops 频率无需x2 sp频率和核心频率相同

fermi: 512*0.650*2*2=1330Gflops 频率需x2 sp频率是核心频率的2倍

CUDA 中FLOPS的计算方法如下:

(1)统计您每个线程的计算次数
(2)将此值乘以您的线程总数
(3)统计出总时间(利用profiler或者自己计时),将2中的值(所有线程的计算次数)除以计算时间,您将得到每秒的计算次数。
(4)因为3中的值往往较大,所以大家一般使用GFlops来衡量(Giga float operations per second),
1G次运算 = 10 ^ 9次方次运算。

有关FLOPS的定义与计算相关推荐

  1. 深度学习中FLOPS和FLOPs的区别与计算

    深度学习中FLOPS和FLOPs的区别与计算 FLOPS FLOPs 单位换算 Params和FLOPs的计算 CONV标准卷积层 FC全连接层 NVIDIA GPU的浮点计算能力 GPU的计算能力的 ...

  2. 【数字信号处理】线性时不变系统 LTI “ 输入 “ 与 “ 输出 “ 之间的关系 ( 线性卷积计算方法列举 | 线性卷积计算案例一 | 根据 线性卷积 定义直接计算 卷积 )

    文章目录 一.线性卷积计算方法 二.线性卷积计算示例一 ( 直接法 ) 一.线性卷积计算方法 线性卷积计算方法 : 直接法 : 根据 线性卷积 定义 直接计算 ; 图解法 : 不进位乘法 : 编程计算 ...

  3. DNA序列编码中Hairpin的定义和计算

    DNA序列编码中Hairpin的定义和计算 觉得有用的话,欢迎一起讨论相互学习~ 参考文献 [1] 张凯. DNA计算核酸编码优化及算法设计[D]. 2008. [2] Shin, Soo Yong ...

  4. NumPy transpose 的定义与计算过程

    NumPy transpose 的定义与计算过程 NumPy documentation https://numpy.org/doc/stable/index.html numpy.transpose ...

  5. #十二、编写三角形类Triangle,初始化三个属性,分别是三条边的长度,定义一个计算并打印周长的函数 #十三、编写等腰三角形类EWtriangle,继承于三角形类,初始化只用传一个腰长和一个底长,定

    #十二.编写三角形类Triangle,初始化三个属性,分别是三条边的长度,定义一个计算并打印周长的函数 #十三.编写等腰三角形类EWtriangle,继承于三角形类,初始化只用传一个腰长和一个底长,定 ...

  6. 键盘录入长方形的长和宽,定义方法计算该长方形的周长,并在main方法中打印周长

    键盘录入长方形的长和宽,定义方法计算该长方形的周长,并在main方法中打印周长 package com;import java.util.Scanner;public class Demo02 {pu ...

  7. YDOOK: STM32: 波特率的定义 波特率计算 波特率是什么?

    YDOOK: STM32: 波特率的定义 波特率计算 波特率是什么? 1. 波特率是什么? 1_1. 在电子通信领域,使用波特(Baud)代表调制速率; 1_2. 波特率指的是有效数据讯号被调制载波的 ...

  8. 国内主要地图瓦片坐标系定义及计算原理

    国内主要地图瓦片坐标系定义及计算原理 作者 CntChen 关注 2016.05.10 20:05* 字数 3144 阅读 1571评论 0喜欢 9 本文将介绍瓦片坐标相关知识,并提供高德地图.百度地 ...

  9. ap 目标检测算法map_目标检测算法的评估指标:mAP定义及计算方式

    前面依次介绍了: 本节介绍目标检测算法的评估指标:mAP定义及计算方式 mAP:mean Average Precision,平均精度均值,即AP(Average Precision)的平均值,它是目 ...

最新文章

  1. 编程控制Word文档中Table的赋值
  2. jmeter4.0 执行jmeter_server.bat报错
  3. php留言板实战,PHP留言本,非常适合新手实战操作!
  4. 基于IPv6数据包分析
  5. 微软私有云分享(R2)22 计算机配置文件与基础设置
  6. arduino i2c 如何写16位寄存器_基于STM32使用I2C读取传感器数据
  7. 千万不要被这些手机充电的谣言给误导了!现在了解还来得及
  8. 如何使用SQL Server数据工具中的“可见性”选项降低报告的复杂性
  9. 特斯拉扭亏,股价暴涨;马斯克下一步:进军打车业务
  10. (6)Spring框架----Bean生命周期分析(详细)
  11. 用算法去扫雷(go语言)
  12. 如何解决stata数据管理器中变量变红的问题
  13. python 英语翻译_python实现在线翻译功能
  14. win10下使用DuetDisplay有线/无线连接,推荐通过爱思助手(非iTunes)更新驱动
  15. IOS通过加速感应器实现手机实现手机屏幕上的足球可以来回的滚动反弹
  16. 电影赏析 002《毒战》
  17. 云上PDF怎么删除页眉页脚_word页眉处理技巧:用VBA快速删除批量页眉页脚
  18. 活动总曝光超1亿,单场引导GMV超1000万,华少快手生活服务专场首战告捷!
  19. 福建农林大学计算机与信息学院副书记,福建农林大学计算机与信息学院导师介绍:钟一文...
  20. 分析网络钓鱼的原理及防御措施

热门文章

  1. 12-Java 继承抽象类代码块(详解~)
  2. Dynamips和Vmware完成CCVP试验(7)
  3. html表格背景颜色
  4. TCL作价5000万美元收购美国Novatel Wireless公司MIFI业务
  5. 程序员长见识需要关注的牛人
  6. 《统计学》第八版贾俊平 思维导图
  7. 工控机的日常维护方法及步骤
  8. SVG实现圆形进度条
  9. ISIS如何选举DIS的,DIS的具体作用,和OSPF的DR有什么相同和不同点。举例说明
  10. W nDOwS多系统安装,IVB新平台Wndows XP系统安装教程.doc