转载请注明出处为KlayGE游戏引擎,本文地址为http://www.klayge.org/2012/03/31/nv-gtx680%e5%af%b9gtx580%ef%bc%9a%e5%8f%a6%e4%b8%80%e4%b8%aa%e8%a7%86%e8%a7%92/

2年前,D3D11显卡刚出来没多久的时候,我曾经做过一个《NV GTX480对ATI HD5870:另一个视角》,用DX SDK的D3D11例子来对当时巅峰的显卡进行各个单项的性能评测。时过境迁,现在NV GTX680已经上市,硬指标对比如下表所示。

GTX 680 GTX 580
制程(nm) 28 40
晶体管数量(Million) 3540 3000
Die大小(mm^2) 294 520
显存(MB) 2048 1536
SM数量 8 16
核心配比 1536:128:32 512:64:48
核心频率(MHz) 1006-1058 772
shader频率(MHz) N/A 1544
显存频率(MHz) 6008 4008
像素填充率(GP/s) 32.2 37.06
纹理填充率(GT/s) 128.8 49.41
显存带宽(GB/s) 192 192.4
总线宽度(bit) 256 384
API D3D11.1
OpenGL 4.2
OpenCL 1.2
D3D11.1
OpenGL 4.2
OpenCL 1.1
Gflop/s 3090.4 1581.1
TDP(watts) 195 244
Gflop/s-watt 15.85 6.48

从指标上可以看出,GTX680的 SP数量急剧提高(512->1536),但SM数量见到原来的一半(16->8),所以每个SM内的SP个数从32猛增到192。这对scheduler是极大的考验。

由于配置上的较大不同,性能能有多高看理论值不行,还是得实际跑程序才能知道。这次的评测仍然分三轮进行,分别评测传统图形流水 线,DirectCompute和Tessellation的性能。测试的机器仍是两年前的Dell T5400 Workstation(Xeon E5440 4-core,4GB内存),依次装上GTX580和GTX680。两块显卡都是Zotac的公版。操作系统是Win7 64bit,使用传统界面以消除Areo界面的PS开销。显卡驱动分别是Forceware 295.73和Forceware 301.10。DX SDK的版本是June 2010。

第一轮 传统图形流水线

第一论测试的是两块显卡在游戏常见的场景中的图形性能表现,选用的sample是Cascaded shadow depth map,contact hardening shadows, variance shadows 11和Dynamic shadow linkage 11。测试结果如下:

GTX 680 GTX 580
CascadedShadowDepthMap 332.04 337.63
Contact Hardening Shadows 1225.67 851.30
VarianceShadows11 305.40 309.83
DynamicShaderLinkage11 2716.49 2620.81

很失望吧,除了Contact hardening shadows,GTX 680并没有比GTX 580提高多少,甚至还有所下降。但领先的那个例子恰恰是计算量和带宽要求最大的。

第二轮 DirectCompute

盛传GTX 680的GPGPU能力不如从前,第二轮就来测试DirectCompute这个GPGPU能力。

GTX 680 GTX 580
NBodyGravityCS11 675.10 374.28
AdaptiveTessellationCS40 1031.88 938.46
HDRToneMappingCS11 3308.63 2815.89

GTX 680在三个例子中都得到了领先的地位,最明显的是NBodyGravityCS11,达到了1.8x的提升。我认为和这个例子的计算量大、但分支较少有关。一个SM包含那么多的SP,对于分支diverse的代价是很大的。

第三轮 Tessellation

Tessellation一直是NV的强项,这次GTX 680的tessellator再次有了提升。

GTX 680 GTX 580
DetailTessellation11 1077.48 983.20
PN-Triangles 2481.89 2376.34
SimpleBezier11 4373.63 3884.52
SubD11 923.32 578.62

也达到了全部领先的程度。最复杂的SubD11提升1.6x。

以上三个测试可以看到,GTX 680并没有传说中的GTX 580×3的性能,至少,在DX SDK sample的分辨率和复杂程度下没达到。但是可以看到的一个趋势是,对计算量和带宽要求越大的例子,GTX 680的提升就越大,所以其实在大部分时候它的能力是没有完全发挥出来的。分支的程度也比较影响GTX 680,所以应该在shader/kernel级别明智使用分支。另一个重要的事情在于驱动,对比2年前的测试,虽然GTX 580比GTX 480只是多了32个SP,但由于驱动的改进,性能却有非常明显的提升,部分例子甚至达到了3倍。目前GTX 680的驱动刚处于非常初级的状态,相信过一段时间成熟了才会达到GTX 680的最佳状态。

额外测试

在测完DX SDK的例子之后,我与顺便测试了KlayGE的例子。这里选了两个比较有代表性的例子,分别是Deferred和Forward流水线。分辨率是1280×800,高于DX SDK sample的800×600。

GTX 680 GTX 580
Deferred rendering 150.55 139.84
Shadow cubemap 267.38/330.78 259.08/239.07

Deferred rendering的例子情况类似于前面的评测。比较有趣的是Shadow cubemap的例子。和《不争气的geometry shader》 一样,这里分别测试了6 pass cubemap和1 pass cubemap。斜杠之前的FPS是6 pass的。在以前的显卡上,不管是NV还是AMD,通过geometry shader完成render to cubemap都比6 pass还慢。但在GTX 680上,GS终于翻身了,彻底打败6 pass的做法。从这个角度也可以看出GTX 680的硬件性能提升。

总的来说,GTX 680并没有官方宣传的“恐怖”性能。但凭借工艺的进步,在那个Die大小的情况下能达到这样的速度是很不容易的。期待下半年的旗舰GK110。

转载于:https://www.cnblogs.com/gongminmin/archive/2012/04/22/2464977.html

NV GTX680对GTX580:另一个视角相关推荐

  1. 科普文章-另一个视角解读计算机编码(修订版)

    我不知道本文该作为原创发布还是作为转载发布,因为本文是<另一个视角解读计算机编码-补码编码>的"排版后的版本",内容几乎没有变,除了增加了一系列的图解. 后来想了下,还 ...

  2. 科普文章-另一个视角解读计算机编码 修订版

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 我不知道 ...

  3. 科普文章-另一个视角解读计算机编码(修订版)【一个吊丝的个人理解】

    本文引用文章地址 科普文章-另一个视角解读计算机编码(修订版)_dog250的博客-CSDN博客https://blog.csdn.net/dog250/article/details/7338187 ...

  4. NV GTX480对ATI HD5870:另一个视角

    自从NVIDIA的GTX480推出以来,网上能见到不少对比评测.但大家一般都是用3DMark之类大型的评测方法,得到的结果比较笼统.我在 这里打算评测的方法是用DX SDK Feb2010的sampl ...

  5. 从另一个视角看待逻辑回归

    摘要 逻辑回归是用在分类问题中,而分类为题有存在两个比较大的方向:分类的结果用数值表是,比如1和0(逻辑回归采用的是这种),或者-1和1(svm采用的),还有一种是以概率的形式来反应,通过概率来说明此 ...

  6. CVPR 2022 | 华南理工提出VISTA:双跨视角空间注意力机制实现3D目标检测SOTA,即插即用...

    来源:机器之心 本文提出了 VISTA,一种新颖的即插即用多视角融合策略,用于准确的 3D 对象检测.为了使 VISTA 能够关注特定目标而不是一般点,研究者提出限制学习的注意力权重的方差.将分类和回 ...

  7. 换个视角,从产品线管理看过去

    本文由作者 我是仔仔侠 于社区发布 你看着他,他也看着你 这是前段时间拍的小区里的流浪猫,一个窝在车底乘凉,一个在骄阳下嬉戏,偶尔间的一个对视,被不经意间记录下来. 其实,这个和今天想讲的并没有直接关 ...

  8. 思维、视角、设计丨产品经理的三板斧

    本文为PMCAFF专栏作者唐韧出品 产品思维到底是什么?产品经理应该具备怎样的思维模式和视角? 带着这两个问题,我在公司内部做了一场关于产品思维的主题分享.线下和线上直播同步,总共有三百多位同学参与了 ...

  9. CVPR 2022 | 华南理工提出VISTA:双跨视角空间注意力机制实现3D目标检测SOTA

    ©作者 | 邓圣衡.梁智灏.孙林.贾奎 来源 | 机器之心 本文提出了 VISTA,一种新颖的即插即用多视角融合策略,用于准确的 3D 对象检测.为了使 VISTA 能够关注特定目标而不是一般点,研究 ...

最新文章

  1. 突然想起99年的那次离别
  2. Jenkins: 执行 PowerShell 命令
  3. 如何判断LSTM模型中的过拟合和欠拟合 By 机器之心2017年10月02日 11:09 判断长短期记忆模型在序列预测问题上是否表现良好可能是一件困难的事。也许你会得到一个不错的模型技术得分,但了解
  4. python 获取内存使用率_Python获取CPU使用率、内存使用率、网络使用状态 | 学步园...
  5. spring boot示例_Spring Boot完成示例
  6. 英语学习笔记2019-11-01
  7. 【报告分享】女性自我保护手册,教你应对10种常见危险处境.pdf(附189页pdf下载链接)...
  8. list自定义排序工具类
  9. Atitit 软件开发基本法 目录 1. 第一章 总纲(包含各大原则 定律 法则) 1 2. 爱提拉的原则 3 2.1. 简单原则 KISS 3 2.2. 提升可读性 面向人类编程 而不是面向机
  10. win10 计算机描述,怎么设置win10以安全描述符定义语言(SDDL)语法表示的计算机访问权限...
  11. 安装完固态硬盘后计算机里没显示,安装了双硬盘电脑却不显示新硬盘怎么办
  12. 一个西瓜 4刀最多多少块
  13. 四超多强 一文看懂中国CV独角兽格局
  14. 20189220余超 2019年密码与安全新技术讲座-课程总结报告
  15. 【进制转换】负进制转换 多进制转换
  16. JAVA日记之mybatis-2代理开发/动态sql/sql抽取/核心配置标签 ----喝最烈的酒.
  17. vue 权限管理 动态路由(6)
  18. 微信小程序怎么样取代传统收款设备的流程
  19. DBA呢?我的数据库又双叒叕连不上了!
  20. 皮尔逊相关系数php,科学网—[严肃内容] 鲁索(Rousseau)教授对皮尔逊相关系数实质认识的图示 - 杨正瓴的博文...

热门文章

  1. colorkey唇釉是否安全_colorkey唇釉真假辨别_colourkey唇釉真伪
  2. PostgreSQL单列多行变一行一行变多行
  3. 小米十周年雷军演讲全文:和这个伟大时代同行,是最大的荣幸
  4. 使用pcb-tools解码Gerber文件报错IndexError: list index out of range
  5. 《华尔街》观后笔记9——拯救危机
  6. 独家 | 当热钱不再涌动——2019人工智能行业冷暖观察
  7. app逆向篇之常用命令及刷机
  8. java唯一的id_Java:唯一的10位数ID
  9. 关于阿里云OSS资源STS访问控制
  10. flex 底部固定_div 底部固定方法(不用position定位)