卖场中,一位装机技术员侃侃而谈:“ NVIDIA最新的GTX275显卡核心只有240个流处理器, ATI的HD4890显卡核心却有800个流处理器,你要最高性能的显卡,当然要选HD4890显卡。”Tommy一脸迷惑,心下怀疑:“真的是这样吗? 为什么有人说GTX275比HD4890性能好呢?”

  AMD-ATI显卡(以下简称A卡)和NVIDIA(以下简称N卡)在流处理器 数量上的巨大差异给Tommy造成的困惑相信许多读者也有。其实,这个情况和不同厂商、相近行能的GPU的二级缓存数量存在差异情况类似,简单来说就是 “不同架构的GPU,流处理器的作用不尽相同,不能直接比较数量。”深入的解释请看下文说明。

  什么是流处理器

  早在微软推出的DirectX 7当中就曾经提出过一个概念——T&L(中文名称是坐标转换和光源),它可以看做是流处理器的鼻祖,随着显卡核心芯片技术的发展,在 DirectX 8中。由微软首次提出了Shader的概念。并且将Shader分为Vertex Shader(顶点着色器,又称VS单元)和Pixel Shader(像素着色器,又称PS单元)。

  一副游戏画面是怎么显示的呢? 其中,3D物体的几何形状、光亮和阴影的控制是由Vetex Shader来实现的,而Pixel Shader是对象素资料进行操作运算的指令程序。其中包括了像素的色彩、深度坐标等资料,在GeForce 8之前,Pixel Shader和 Vetex Shader这两个参数非常重要,这两个部分的多少完全决定了显卡的性能表现,N卡和A卡双方都为了提升Pixel Shader和Vetex Shader的数量而想尽一切办法。

 但是,在DirectX 10这一代显卡中,业界提出了一个新的概念——统一渲染架构,就是把原有的VS单元和PS单元统一起来,统称为Shader运算单元。这也就是我们所说的 流处理器(Stream Processor)。因此,上述任务就由流处理器统一执行了,既然流处理器是来自于VS单元和PS单元的统一渲染架构。那么,流处理器的作用于VS单 元+PS单元的合作用就是基本相同的。只是添加了全新的处理单元——Geometry Shader(几何渲染器,又称GS单元)。

同一架构的显卡,流处理器的个数自然是越多越好。相信读者也在各大网站了解到这样的信息——“同价位的产品中,N卡的流处理器数量要少于A卡”。比如本文 开头的装机技术员提到ATI Radeon HD4890显卡比NVIDIA GeForce GTX275显卡的流处理器数量多,这是正确的。但是性能却是前者稍逊于后者.这是为什么呢,其实在“流处理器”的名称上A卡和N卡存在细微的差别,N卡 的流处理器全称为Stream Processing,而A卡的流处理器全称为Stream Processing Units,一词之差却让两者的的性能差距有着天壤之别。而且因为A卡和N卡的GPU架构存在根本性的差异,所以流处理器的工作方式和用途也有所差异,故不能直接比较流处理器的数量。这就可以解决本文开头的顾客Tommy的疑问了 。A卡的GPU流处理器数量多很多但性能不一定就好。下面我们来分析A卡和N卡的GPU架构及流处理器的工作方式,看看有什么不同.

在DirectX 9时代末期,ATI意识到像素渣染的重要性,就通过1:3的架构提高了像素着色器的数量.到了DirectX 10时代,ATI还是通过这种方式来提高重要的像素渲染性能。从RV770的核心架构图中可以看出,现在在ATI的GPU中,流处理器(Scteam Processing)和流处理单元(Stream Processing Units)的比例就是1:5,也就是说ATI的每个“Stream Processing”都包含有5个“Stream Processing Units”。RV770的流处理器组群扩充至10组,因此数量也有了25倍的增长。达到160个(160x5=800个流处理单元).所以A卡所称的 “流处理器”实际上一般是指流处理单元。

  NVIDIA方面,GeForce GTX200核心架构分为四个层。最上面一层包括几何着色器(Geometry Shader)、顶点着色器(Vetex Shader)和像素着色器(Pixel Shader).中间一层包括了10组TPCs(计算处理器群集)。每组TPC里面又包含了3组SMs(流处理器组) ,每组SM里面就包含了8个流处理器单元或计算单元,这样一来,GeForce GTX 200显卡就一共包含了240个流处理器单元或计算单元.

 两种架构 优劣各异

  在进入统一渲染架构时 代后,提高Shade运行频率与效率是NVIDIA主导的设计思路,而AMD则维持庞大的流处理器数量。两种思路各有优劣。

   1、N的优势和A的劣势

  N卡的GPU中每个流处理器都具有完整酌ALU功能,在发出一条操作指令时每个流处理器 都能充分工作.而A卡的GPU中每个流处理器的5个流处理单元都是固定的,不能拆开重组,如果在处理纯4D指令的时候,每个流处理器只能处理一条4D指 令,有一个流处理器单元闲置,但却无法加人其他组合来共同工作.

  简单地说,一个指令任务派发下来的时侯,N卡的GPU是需要1个‘人 独立工作即可完成。而A卡的GPU则需要5个“人”。结组工作才能完成ATI的人数虽然多,但这5个“人”中有可能会有4个“人”闲置,因为这4个“人” 不具有独立完整的ALU功能,不能执行函数运算,浮点运算和Multipy运算。

  2、N的劣势和A的优势

  ATI的设计也有其显著的特点——浮点运算能力强大.也就是说如果单纯比拼显示核心在浮点运算上的能力的话,可能ATI则要强一些,在目前 GPGPU项月应用比较多的科学计算方面,理论上能适应GPU和CPU融台的趋势。

认清GPU的流处理器作用相关推荐

  1. snb处理器hd3000显卡专用extra_一文看懂显卡的GPU,流处理器,显存,位宽,核心频率是啥?...

    大家好,我是行者,今天的电脑配件中,显卡越来越贵,也越来越重要.有时比一块CPU能贵出2倍甚至更多.所以我们迫切的需要更深的认识这块卡,使我们能更好的去选择与运用它.下面我给大家介绍一下这几个常见名词 ...

  2. CUDA笔记--GPU的结构与SM(流处理器)结构

    GPU的结构简单的可以分为: 一个连接GPU和PCIe总线的主机接口: 0~2个复制引擎: 一个连接GPU与GPU内存设备的DRAM接口: 一定数目的TPC或者GPC(纹理处理集群或图形处理集群),每 ...

  3. 核心频率个加速频率_流处理器、核心频率、 位宽……这些显卡参数你知道吗?—— 电脑硬件科普篇(八)...

    判断一张显卡的好坏,依然要使用参数 然而我认为显卡是不需要知道参数的 因为在知道性能差距的情况下,用相同分辨率下的游戏帧数进行对比就能选购自己的显卡 但是既然是科普,也就讲一讲吧 来自http://w ...

  4. 状态模式 处理订单状态_将状态机模式实现为流处理器

    状态模式 处理订单状态 在我的上一个博客中,我说过我真的以为某些"四人行"(GOF)模式已经过时了,如果不是过时的话肯定不受欢迎. 特别是我说过StateMachine没什么用,因 ...

  5. 将状态机模式实现为流处理器

    在我的上一个博客中,我说我真的以为某些"四人行"(GOF)模式已经过时了,如果不是过时的话肯定不受欢迎. 特别是我说过StateMachine不是那么有用,因为您通常会想到另一种更 ...

  6. 2000个流处理器?RV870消息首次透露

    新闻来源:硬派网 飞鸽传书 就在不少玩家还在惊叹RV770产品集成了惊人的800个流处理器时,我们今天看到国外再次爆出了ATI下一代高端显示芯片RV870的一些消息. 据悉,AMD将会希望他们能够在2 ...

  7. ndr4108贴片晶振是多少频率_流处理器、核心频率、 位宽……这些显卡参数你知道吗?—— 电脑硬件科普篇(八)...

    判断一张显卡的好坏,依然要使用参数 然而我认为显卡是不需要知道参数的 因为在知道性能差距的情况下,用相同分辨率下的游戏帧数进行对比就能选购自己的显卡 但是既然是科普,也就讲一讲吧 来自http://w ...

  8. CUDA流多处理器(stream multiprocessor,sm)和硬件流处理器(stream processor,sp)

    SM是一种单指令多线程((single Instruction MultipleThread,SIMT)架构的处理器,类似单指令流多数据流(SIMD)的特点,含有指令发射单元,及若干个流处理器(str ...

  9. 流式多处理器(streamingMultiproeessor,SM)与流处理器(strcamingProcessor, sp)

    SM是一种单指令多线程((single Instruction MultipleThread,SIMT)架构的处理器,类似单指令流多数据流(SIMD)的特点,含有指令发射单元,及若干个流处理器(str ...

最新文章

  1. POJ - 3041 Asteroids 二分图最小点覆盖
  2. 顺序表-有序顺序表表示集合-并集(两者比较,小者放入C,未遍历继续放入)
  3. 如何脱颖而出?成为优秀的人
  4. 信息化监理是请来的第三者?
  5. android CMake开发
  6. 【指标统计】删除错误遥信
  7. 这个世界并不缺少创意,而是缺少发现
  8. 【MM配置】Pricing 采购定价 1
  9. Kafka参数broker.id详解
  10. 前端httpd+keepalived加后端heartbeat+nfs+drbd实现httpd服务的高效应用及资源统一管理...
  11. .Net Core控制台amp;EFCore连接Mysql
  12. 5 高可靠,构建RabbitMQ集群架构
  13. Git 远程操作 —— clone、push、pull、fetch
  14. 21.卷1(套接字联网API)---多播
  15. 【整理】unity3d优化总结篇
  16. QT组合框QComboBox右边加入图标
  17. 感冒喝抹茶牛奶的效果
  18. 今天给大家推荐一个Cleaner One for mac(系统清理优化工具)
  19. 初级会计资料-常用会计公式(三)
  20. web前端知识——iframe标签、CSS

热门文章

  1. 小米手机显示服务器已满,小米云空间不足怎么办 小米云服务空间已满官方解决方案...
  2. 软件设计模式——适配器模式
  3. 红石外汇|每日汇评:黄金多头在美国CPI指数之前仍保持希望
  4. Eclipse中Android SDK Manager无法打开
  5. 应用基准化分析—Benchmark
  6. 学习编程,这些好习惯带我们平步青云——直通大牛
  7. Atomikos 中文说明文档(周枫翻译)
  8. LeetCode 771. 宝石与石头(java)
  9. 命令行教程,第一部分 — 导航目录
  10. 指定“Vary: Accept-Encoding”标头 --压缩