处理器运算能力单位

TOPS是Tera Operations Per Second的缩写,1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作。

与此对应的还有GOPS(Giga Operations Per Second),MOPS(Million Operation Per Second)算力单位。1GOPS代表处理器每秒钟可进行一亿次(10^9)操作,1MOPS代表处理器每秒钟可进行一百万次(10^6)操作。TOPS同GOPS与MOPS可以换算,都代表每秒钟能处理的次数,单位不同而已。

在某些情况下,还使用 TOPS/W 来作为评价处理器运算能力的一个性能指标,TOPS/W 用于度量在1W功耗的情况下,处理器能进行多少万亿次操作。

一:CPU

一般来讲最弱的是cpu。虽然cpu主频最高,但是单颗也就8核,16核的样子,一个核3.5g,16核也就56g,再考虑指令周期,每秒最多也就30g次乘法。还是定点的。

二:DSP

dsp虽然主频不如cpu,但是胜在乘法器多,随随便便带16个乘法器,还是浮点的。再来个4核,8核,还有特定的算法硬件加速,所以虽然主频只有1,2g但是运算能力还是比cpu强。当然现在出现了带专用乘法器的cpu,dsp也集了arm核,这两个的界限开始模糊了。

三:GPU
gpu的主频一般在500mhz左右,但是核多啊,比如titan,有380多个流处理单元,500*400就是200g这个量级,远大与于前面2者了。

四:FPGA
fpga的运算能力的,拿高端的来说。3000多个固定乘法器,拿数字逻辑还能搭3000个,最快能到接近300mhz, 也就是1800g这个量级。

但是这几个应用场合不同,cpu虽然运算不行,但是擅长管理和调度,比如读取数据,管理文件,人机交互等,例程多,辅助工具也很多。

dsp相比而言管理弱了,运算加强了。这两者都是靠高主频来解决运算量的问题,适合有大量递归操作以及不便拆分的算法。

gpu管理更弱,运算更强,但由于是多进程并发,更适合整块数据进行流处理的算法

fpga能管理能运算,但是开发周期长,复杂算法开发难度大。适合流处理算法,不管是整块数据进还是一个一个进。还有实时性来说,fpga是最高的。前3种处理器为了避免将运算能力浪费在数据搬运上,一般要求累计一定量数据后才开始计算,产生群延时,而fpga所有操作都并行,因此群延时可以很小

深度学习CPU,GPU,NPU,TPU以及其计算能力单位相关推荐

  1. pytorch深度学习框架--gpu和cpu的选择

    pytorch深度学习框架–gpu和cpu的选择 基于pytorch框架,最近实现了一个简单的手写数字识别的程序,我安装的pytorch是gpu版(你也可以安装cpu版本的,根据个人需要),这里我介绍 ...

  2. 【深度学习】如何选择适合深度学习的GPU?

    如何选择适合深度学习的GPU? 为什么GPU比CPU更适合机器学习或者深度学习? 什么是张量处理单元(TPU)? 目前主流的GPU厂商:Nvidia和AMD 选择GPU时需要关注的主要属性 1. GP ...

  3. GPU显存 - 深度学习中 GPU 和显存分析

    深度学习中 GPU 和显存分析 原文作者陈云. 本文原载于知乎专栏--人工智障的深度瞎学之路 深度学习最吃机器,耗资源,在本文,我将来科普一下在深度学习中: 何为"资源" 不同操作 ...

  4. 深度学习对GPU要求高吗?为什么深度学习要用GPU?

    深度学习对GPU要求高吗?为什么深度学习要用GPU?实际上深度学习并不一定需要用GPU,只是如果不使用GPU,训练模型所耗的时间会变得巨长.GPU优势在于并行运算,而深度学习中的运算大部分都是矩阵运算 ...

  5. 深度学习使用GPU问题

    深度学习如何使用GPU 什么是GPU 为什么GPU更适合深度学习 CPU与GPU区别 什么是CUDA 什么是TensorRT 为什么TensorRT可以让底层模型加速呢 如何在linux查看GPU利用 ...

  6. 【降维打击,带你深度学习CPU(上)】

    系列文章目录 1.<带你深挖计算机底层逻辑,打通你计算机基础知识的任督二脉> 2.<深度学习计算机底层原理,深度剖析存储器> 3.<基于内存全面理解高速缓冲存储器> ...

  7. CPU,GPU,NPU的架构差异对比

    CPU/GPU/NPU架构特点 一图胜千言,关于CPU,GPU,NPU的结构上的区别,,如下图所示: 从优化的角度讲,CPU的目标函数是 "minimize laency", GP ...

  8. NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021

    本方案中,推荐配置报价更新日期:2021/03/06 变更原因: 1)近期唯利是图的厂家将RTX显卡大部分卖给挖矿的,造成断货.暴涨 2)RTX A6000上市.增加新GPU配置方案 3)GX630M ...

  9. 清华大学朱军详解珠算:贝叶斯深度学习的GPU库(附视频)

    5 月 27-28 日,机器之心在北京 898 创新空间顺利主办了第一届全球机器智能峰会(GMIS 2017).中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃为大会做了开幕式致辞.大 ...

  10. Facebook更新PyTorch 1.1,深度学习CPU抢GPU饭碗?

    在一年一度的开发者大会F8上,Facebook放出PyTorch的1.1版本,直指TensorFlow"腹地". 不仅宣布支持TensorFlow的可视化工具TensorBoard ...

最新文章

  1. Go语言中的Struct
  2. 应用程序-特定 权限设置并未向在应用程序容器 不可用 SID
  3. delegate,event, lambda,Func,Action以及Predicate
  4. 交互神器 Facebook Origami
  5. 利用系统提供的崩溃日志解Native层Bug
  6. WEBMIN在命令行下的安装
  7. boost::hana::unfold_right用法的测试程序
  8. mysql innodb_undo_directory默认_MySQL innodb_undo_tablespaces相关参数
  9. XML 文档对象模型 (DOM)细说
  10. 浅谈MySQL索引背后的数据结构及算法【转】
  11. 解析UML箭头、线条代表的意义
  12. java sigar 远程_Java运用第三方开源jar包sigar.jar获取服务器信息
  13. 汽车电子之NFC技术
  14. OpenWRT(四)AP、STA、中继模式
  15. 毕业设计必备案例:Python开发桌面程序——各种版本学生信息管理系统
  16. 如何测试充电宝输出电压-20210127
  17. CRMEB单商户标准版上线了!
  18. sql 内连接,左连接,右连接,全连接
  19. openwrt支持wpa3加密
  20. 【python】深浅拷贝

热门文章

  1. 魔兽世界首页静态界面
  2. 胆酸(Cholate)乳清白蛋白纳米粒Cholate-whey protein|保存条件
  3. 为什么有些人赚钱那么轻松?
  4. Elsevier 期刊 Editorial Manager (EM)投稿系统踩坑
  5. 问题解决:windows未能启动,原因可能是最近更改了硬件或软件
  6. AC自动机及KMP练习
  7. 【ES】windows启动
  8. Nginx设置之自定义请求头
  9. 光电隔离电路设计方案(六款基于光耦、AD210AN的光电隔离电路图)
  10. 底层程序员4年的逆袭之旅:穷屌丝-->小老板