CUDA Study ---- Hardware Architecture
CUDA Study ---- Hardware Architecture
版权声明:本文为博主原创文章,未经博主允许不得转载。
CUDA硬件架构:
NVIDIA显卡构成:显存颗粒,供应电路,PCI-E接口,NVIO芯片,MIO接口,GPU芯片;
显卡上实现极强的计算能力和极高的存储器以及IO带宽,需要有可靠的电源和有效的散热手段;
显卡的骨架式PCB(Printed Circuit Board,印刷电路板),NVIDIA在发布显卡的同时会发布PCB设计,以及GPU和显存的建议工作频率,称为公版;
部分厂商会各自开发显卡设计,称为非公版;
PCB层数越多,电路的兼容性和稳定性容易做到一个比较理想的水平,造价也会急剧上升;
PCI-E总线:主机与显卡间的通信通过PCI-E总线进行;
发展路线:PCI和ISA总线:与网卡、声卡等其他扩展卡相同;
AGP规范:(Accelerated Graphics Port)一种接口方式,Intel公司提出;显卡专用扩展接口;规格最高的达到2.1GB/s;
PCI-E总线:采用点对点串行连接,每个设备都有自己的专用连接,不需要像整个总线请求带宽;在一个周期中可以同时进行上下行数据传输;可以达到10.0GB/s常见通道数量为*1,*4,*8,*16;
购置显卡的时候应该注意使得主板的PCI-E插槽与设备匹配,否则较低通道数量的PCI-E卡安装在高通道数量的插槽上只能获得较少的通道速度;
显存:显卡需要实现较高的像素填充率,因此显存必须能够远大于内存的带宽;
发展路线:SGRAM;GDDR SDRAM(目前独显采用的主要采用);GDDR2,GDDR3;GDDR4,GDDR5;
DDR与传统SDRAM区别:DDR每个外部时钟周期的上升沿和下降沿都能够传输数据,SDEAM只能在外部时钟周期的上升沿传输数据;即,DDR可以达到SDRAM带宽的两倍;
DDR2:外部IO时钟的频率是内核时钟的两倍,则在每个时钟周期可以进行四次数据传输;GDDR2,GDDR3采用该技术;
GDDR5的IO频率在GDDR3的基础上再次翻番;
GPU芯片:GPU的中心处理器;
NVIDIA GT200核心:集成14亿个晶体管;
GTX295:单卡爽GPU产品;
AMD/ATI: RV770,侧重于减小功耗和芯片面积;
GPU多核与CPU多核通信:
CPU多个核心通信可以通过CPU缓存进行数据一致性;
GPU多核之间缓存只读,不存在数据一致性问题,多个GPU之间很难实现高带宽低延迟的通信,通过PCI-E总线和系统内存交换数据,开销非常高昂;
NVIO系列芯片负责输出视频信号;
MIO接口:可以用于与视频采集设备等通信,也可以用来安装SL1(速力)连接桥,使多块显卡并行工作;
CUDA Study ---- Hardware Architecture相关推荐
- CUDA Study Notes
1. 归约(Reduction) 归约是使用解决其它问题的"黑盒"来解决另一个问题. 2. Tesla是什么 CUDA架构用作GPU通用计算. 3. SSE指令集 SSE(Stre ...
- android hardware architecture
- Volume Compute In SIMT Hardware Architecture
在进行基于体数据的PDE计算时,总是会涉及到邻接单元(neighbir cell)的访问,想要提高计算效率就必须尽量共享邻域数据,减少访问全局内存的次数.不同于二维的情况,尤其是需要多次迭代计算时,三 ...
- Cuda: Handle Conflicting Installation Methods
彻底卸载 cuda:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#handle-uninstallatio ...
- CUDA和cuDNN到底是啥关系?(cuDNN是基于CUDA的深度学习GPU加速库)
1.什么是CUDA CUDA(ComputeUnified Device Architecture),是显卡厂商NVIDIA推出的运算平台. CUDA是一种由NVIDIA推出的通用并行计算架构,该架构 ...
- [转]Blue Prism Architecture
本文转自:https://mindmajix.com/blue-prism-architecture Introduction Automation technology is widely bloo ...
- Nvidia30系显卡+Windows系统的CUDA 11安装100%成功教程
一.环境 显卡:Nvidia RTX 3090.3060.3080.3050.3070 系统:Windows11 Windows10 CUDA:CUDA(ComputeUnified Device A ...
- Nvidia30系显卡+Ubuntu系统的CUDA 11安装100%成功教程
一.环境 显卡:Nvidia RTX 3090.3060.3080.3050.3070 系统:Ubuntu 16.04 18.04 CUDA:CUDA(ComputeUnified Device Ar ...
- 关于cuda、cudnn环境配置
cuda.cudnn环境配置 一.cuda.cudnn概念及关系 1.什么是cuda? CUDA(ComputeUnified Device Architecture),是显卡厂商NVIDIA推出的运 ...
最新文章
- 在Java中连接字符串时是使用+号还是使用StringBuilder
- abb变频器电机过热保护怎么复位_变频器驱动的电机过热该怎么办
- python 回测模块_回测调用研究模块总结(慎用Python3 PacVer 2.0)
- 谁是赢家_赢家的真正作品是股东
- 《Python程序设计》——1.2 程序开发周期
- c++ string 回文串_第33期:上海自来水来自海上,回文字符串验证!
- 基于route-map的策略路由
- svn —— 版本回退
- 微信商户平台关闭自动提现
- 创建一个新用户身份为计算机管理员,以Guest账户身份创建一个管理员
- CA、公钥、私钥的基本概念
- android 7.1内存泄漏,android - Android 7.1和7本机崩溃:libc.so tgkill + 12 - 堆栈内存溢出...
- 图片和图片转base64大小的关系
- 城市亮化工程项目方案
- Kubernetes--k8s--进阶--全面了解HPA--部署HPA实现高可用和成本控制
- PhotoShop 基本操作介绍, 附带图文解说
- VB、VBS 、ASP、VBA 的 UTF-8 MD5 实现
- HRDA: Context-Aware High-Resolution Domain-Adaptive Semantic Segmentation
- 夸奖对方代码写的好_不仅会写代码,「得到」程序员还研发了一套“钢铁直男夸人公式”...
- 详述重入锁-ReentrantLock