GPU从大的方面来讲,就是由显存和计算单元组成:

  1. 显存(Global Memory):显存是在GPU板卡上的DRAM,类似于CPU的内存,就是那堆DDR啊,GDDR5啊之类的。特点是容量大(可达16GB),速度慢,CPU和GPU都可以访问。
  2. 计算单元(Streaming Multiprocessor):执行计算的。每一个SM都有自己的控制单元(Control Unit),寄存器(Register),缓存(Cache),指令流水线(execution pipelines)。

GFLOPS:十亿次
TFLOPS:一万亿次


Shader主要编辑顶点着色器和片元着色器来影响渲染效果。

GPU设计思路:

算术逻辑单元(arithmetic and logic unit) 是能实现多组算术运算和逻辑运算的组合逻辑电路,简称ALU。


停滞(stalls)


NVidia Kepler架构:

SMX是SM的升级版。





评价GPU的标准一般而言有两条:

1,单精度浮点数计算能力,双精度浮点数计算能力;
2,数据传输带宽
3,对于嵌入式系统的GPU来说,还会增加一条是功耗。

五.GPU体系架构概述相关推荐

  1. Nvidia CUDA初级教程4 GPU体系架构概述

    Nvidia CUDA初级教程4 GPU体系架构概述 视频:https://www.bilibili.com/video/BV1kx411m7Fk?p=5 讲师:周斌 本节内容: 为什么需要GPU 三 ...

  2. NVIDIA CUDA初级教程(P2-P3)CPU体系架构概述、并行程序设计概述

    文章目录 1.CPU体系架构概述 2.并行程序设计概述 1.CPU体系架构概述 现代CPU架构 CPU的定义 (1)执行指令.处理数据的器件:完成基本的逻辑和算术指令 (2)内存接口.外部设备接口 ( ...

  3. 【TA-霜狼_may-《百人计划》】图形2.7.2 GPU硬件架构概述

    [TA-霜狼_may-<百人计划>]图形2.7.2 GPU硬件架构概述 @[TOC]([TA-霜狼_may-<百人计划>]图形2.7.2 GPU硬件架构概述 GPU是什么 GP ...

  4. CUDA基础(一):CPU体系架构概述

    1 冯·诺依曼体系架构   今天我们谈及CPU的架构,往往会说起X86架构,ARM架构,MIPS架构等等,其实这些CPU架构都属于冯·诺依曼体系架构(也称普林斯顿体系架构).   **从功能上看,一般 ...

  5. 工业物联网体系架构概述及基于工业物联网的智能制造

    -- 参考自:国家出版基金项目 <物联网与智能制造> 张晶 化学工业出版社 0总览 Author:HYH Date:2020/7/21 0智能制造 智能制造(Intelligent Man ...

  6. 物联网的体系架构概述

    -- 参考自:国家出版基金项目 <物联网与智能制造> 张晶 化学工业出版社 0总览 Author:HYH Date:2020/7/20 1物联网 物联网有别于互联网,互联网的主要目的是构建 ...

  7. 网络体系架构—运输层协议概述

    一.进程之间的通信 从通信和信息处理的角度看,运输层向它上面的应用层提供通信服务,它属于面向通信部分的最高层,同时也处于用户功能中的最底层.下面通过一个示意图来说明运输层的作用,图中的 5,4,3,2 ...

  8. 开启报名 | AI芯片体系架构和软件专题报告会2020

    近年来,专用的人工智能芯片为人工智能应用提供了强大的算力.面对日新月异的人工智能应用,人工智能芯片的体系架构,系统软件,安全成为计算机体系结构和系统软件的热点研究问题.为了推进国内在该领域的发展,由北 ...

  9. [转]OpenContrail 体系架构文档

    OpenContrail 体系架构文档 英文原文:http://opencontrail.org/opencontrail-architecture-documentation/ 翻译者:@KkBLu ...

最新文章

  1. 使用Spring框架实现远程服务暴露与调用
  2. JavaEE基础(八)
  3. 阿里数据中台系列之Apsara Stack控制台用户角色权限及操作界面(一)
  4. C语言在不引入第三变量下交换俩数
  5. open pwrite
  6. python3.5安装pip_pip和pip3 – 都指向python3.5?
  7. spring常见面试问题_Spring面试问题
  8. 视频光端机园区出入口监控项目应用方案详解
  9. [css] 为什么说不提倡用1px的小尺寸图片做背景平铺?
  10. 入门指南_激光切管快速入门指南
  11. 17 | 跳表:为什么Redis一定要用跳表来实现有序集合?
  12. 【ASP.NET】HTTP中的 get 和 post 请求
  13. mysql 存储过程的应用
  14. 每日算法系列【LeetCode 943】最短超级串
  15. U盘插入电脑有明显的响声但是不显示盘符
  16. 手把手搭建VuePress文档
  17. 2019北邮网安考研经验
  18. Visualising Residuals
  19. 绝地求生服务器维护需要多久,绝地求生8月4日更新到几点?绝地求生维护一次需要多长时间?...
  20. 什么是tuscany

热门文章

  1. 阿里生鲜布局调整,易果将为盒马鲜生提供供应链保障
  2. SQL Server 存储过程 迪杰斯特拉算法 大规模 表格存储 不是矩阵
  3. IDA Pro7学习笔记
  4. IDS简介与性能指标
  5. python解析xml文件elementtree_python XML文件解析:用ElementTree解析XML
  6. 腾讯移动端性能测试利器PerfDog使用
  7. 计算机4级java考试_全国计算机等级考试四级试题(四)
  8. 利用定时/计数器TO从P1输入周期为1s的方波,让发光二极管以1HZ闪烁,设晶振频率为12MHZ
  9. java安装教程win10_Java安装教程win10
  10. Linux命令执行过程中的配置文件信息