CUDA Study ---- Hardware Architecture

标签: cuda扩展工作存储产品io
2010-01-04 10:53 692人阅读 评论(0) 收藏 举报

版权声明:本文为博主原创文章,未经博主允许不得转载。

CUDA硬件架构:

NVIDIA显卡构成:显存颗粒,供应电路,PCI-E接口,NVIO芯片,MIO接口,GPU芯片;

显卡上实现极强的计算能力和极高的存储器以及IO带宽,需要有可靠的电源和有效的散热手段;

显卡的骨架式PCB(Printed Circuit Board,印刷电路板),NVIDIA在发布显卡的同时会发布PCB设计,以及GPU和显存的建议工作频率,称为公版;

部分厂商会各自开发显卡设计,称为非公版;

PCB层数越多,电路的兼容性和稳定性容易做到一个比较理想的水平,造价也会急剧上升;

PCI-E总线:主机与显卡间的通信通过PCI-E总线进行;

发展路线:PCI和ISA总线:与网卡、声卡等其他扩展卡相同;

AGP规范:(Accelerated Graphics Port)一种接口方式,Intel公司提出;显卡专用扩展接口;规格最高的达到2.1GB/s;

PCI-E总线:采用点对点串行连接,每个设备都有自己的专用连接,不需要像整个总线请求带宽;在一个周期中可以同时进行上下行数据传输;可以达到10.0GB/s常见通道数量为*1,*4,*8,*16;

购置显卡的时候应该注意使得主板的PCI-E插槽与设备匹配,否则较低通道数量的PCI-E卡安装在高通道数量的插槽上只能获得较少的通道速度;

显存:显卡需要实现较高的像素填充率,因此显存必须能够远大于内存的带宽;

发展路线:SGRAM;GDDR SDRAM(目前独显采用的主要采用);GDDR2,GDDR3;GDDR4,GDDR5;

DDR与传统SDRAM区别:DDR每个外部时钟周期的上升沿和下降沿都能够传输数据,SDEAM只能在外部时钟周期的上升沿传输数据;即,DDR可以达到SDRAM带宽的两倍;

DDR2:外部IO时钟的频率是内核时钟的两倍,则在每个时钟周期可以进行四次数据传输;GDDR2,GDDR3采用该技术;

GDDR5的IO频率在GDDR3的基础上再次翻番;
GPU芯片:GPU的中心处理器;

NVIDIA GT200核心:集成14亿个晶体管;

GTX295:单卡爽GPU产品;

AMD/ATI: RV770,侧重于减小功耗和芯片面积;

GPU多核与CPU多核通信:

CPU多个核心通信可以通过CPU缓存进行数据一致性;

GPU多核之间缓存只读,不存在数据一致性问题,多个GPU之间很难实现高带宽低延迟的通信,通过PCI-E总线和系统内存交换数据,开销非常高昂;

NVIO系列芯片负责输出视频信号;

MIO接口:可以用于与视频采集设备等通信,也可以用来安装SL1(速力)连接桥,使多块显卡并行工作;

CUDA Study ---- Hardware Architecture相关推荐

  1. CUDA Study Notes

    1. 归约(Reduction) 归约是使用解决其它问题的"黑盒"来解决另一个问题. 2. Tesla是什么 CUDA架构用作GPU通用计算. 3. SSE指令集 SSE(Stre ...

  2. android hardware architecture

  3. Volume Compute In SIMT Hardware Architecture

    在进行基于体数据的PDE计算时,总是会涉及到邻接单元(neighbir cell)的访问,想要提高计算效率就必须尽量共享邻域数据,减少访问全局内存的次数.不同于二维的情况,尤其是需要多次迭代计算时,三 ...

  4. Cuda: Handle Conflicting Installation Methods

    彻底卸载 cuda:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#handle-uninstallatio ...

  5. CUDA和cuDNN到底是啥关系?(cuDNN是基于CUDA的深度学习GPU加速库)

    1.什么是CUDA CUDA(ComputeUnified Device Architecture),是显卡厂商NVIDIA推出的运算平台. CUDA是一种由NVIDIA推出的通用并行计算架构,该架构 ...

  6. [转]Blue Prism Architecture

    本文转自:https://mindmajix.com/blue-prism-architecture Introduction Automation technology is widely bloo ...

  7. Nvidia30系显卡+Windows系统的CUDA 11安装100%成功教程

    一.环境 显卡:Nvidia RTX 3090.3060.3080.3050.3070 系统:Windows11 Windows10 CUDA:CUDA(ComputeUnified Device A ...

  8. Nvidia30系显卡+Ubuntu系统的CUDA 11安装100%成功教程

    一.环境 显卡:Nvidia RTX 3090.3060.3080.3050.3070 系统:Ubuntu 16.04 18.04 CUDA:CUDA(ComputeUnified Device Ar ...

  9. 关于cuda、cudnn环境配置

    cuda.cudnn环境配置 一.cuda.cudnn概念及关系 1.什么是cuda? CUDA(ComputeUnified Device Architecture),是显卡厂商NVIDIA推出的运 ...

最新文章

  1. 在Java中连接字符串时是使用+号还是使用StringBuilder
  2. abb变频器电机过热保护怎么复位_变频器驱动的电机过热该怎么办
  3. python 回测模块_回测调用研究模块总结(慎用Python3 PacVer 2.0)
  4. 谁是赢家_赢家的真正作品是股东
  5. 《Python程序设计》——1.2 程序开发周期
  6. c++ string 回文串_第33期:上海自来水来自海上,回文字符串验证!
  7. 基于route-map的策略路由
  8. svn —— 版本回退
  9. 微信商户平台关闭自动提现
  10. 创建一个新用户身份为计算机管理员,以Guest账户身份创建一个管理员
  11. CA、公钥、私钥的基本概念
  12. android 7.1内存泄漏,android - Android 7.1和7本机崩溃:libc.so tgkill + 12 - 堆栈内存溢出...
  13. 图片和图片转base64大小的关系
  14. 城市亮化工程项目方案
  15. Kubernetes--k8s--进阶--全面了解HPA--部署HPA实现高可用和成本控制
  16. PhotoShop 基本操作介绍, 附带图文解说
  17. VB、VBS 、ASP、VBA 的 UTF-8 MD5 实现
  18. HRDA: Context-Aware High-Resolution Domain-Adaptive Semantic Segmentation
  19. 夸奖对方代码写的好_不仅会写代码,「得到」程序员还研发了一套“钢铁直男夸人公式”...
  20. 详述重入锁-ReentrantLock

热门文章

  1. my current understanding of learning and graduate studies
  2. 《大红包》电影观后感
  3. 【转】Unity3D将来时:IL2CPP(上)
  4. 多个线程直接按对数据进行操作容易引发线程安全问题
  5. Zookeeper内部的简单细节(一)
  6. MVC Razor 语法(转)
  7. NYOJ 179 LK's problem
  8. NYOJ 14 会场安排问题 贪心算法 之 选择不相交区间
  9. 函数公开问题、简短模式、多一个返回值
  10. 简单记录js中的this关键字