作者:喵西和熊
链接:https://www.zhihu.com/question/22630075/answer/29041618
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

现在Nvidia的节奏基本上是一个结构用两年。类似于intel的钟摆计划。
我们先先谈谈开普勒架构之前的费米架构好了。
费米的本质是什么,英伟达只要用他来搞通用计算的还有DX11(这个涉及当年的环境问题)。
费米架构提出了GPC和SM的结构概念。每一个GPC则有4个SM,sm里面有32个CUDA,每个CUDA Core是一个统一的处理器核心,执行顶点,像素,几何和kernel函数,然后有16个储存单元和8个特殊单元。
上面一段话的意思是,GPC是一个很完整的GPU,而且细分的十分完整。
所以你会看到高中低端是这么分配的低端一个,中端两个,高端四个。
大家会不会想到CPU呢。。单核,双核,四核。。大概就是思路。。
然后又引入了一二级缓存这种东西。。大家详细了解自己去搜相关东西吧。。

而AMD当时的思路跟Nvidia不一样的是,坚持用simd。至于为什么?可能是AMD和ATI整合,也可能是ATI做过游戏机的芯片制造,这个不好推断)
大的核心里面有Shader单元,每个Shader内部有5个ALU单元。
五个ALU处理完了之后一起上传,而CUDA Core是直接上传了,这就是mimd。
看到ZOL论坛有一个很好的比方。。我就粗略说说意思(传送门【NV 开普勒 架构解析篇】)
AMD就是一辆战车,然后一个马拉着战车(发射端和控制逻辑端),上面有五个家伙。弓箭手啊,战士,扔斧子的。
费米就是骑兵。。
战车虽然相比较骑兵发挥不出一个人的优势。但是养马在古代很贵的好吧,就算现在也很贵好吧。。
战车上有五个汉子,相当于马加五个人,而骑兵是一个马加一个人。
性价比肯定是战车好。
但是数量到了一定程度。史实是大兵团对战时,骑兵可以用经典的魔兽战术hit and run对付战车,先遭遇,一轮齐射,射完马上后撤,迂回一圈再过来齐射,射完再后撤········(中世纪时曾经很虎的东欧战车军就是这样被蒙古骑兵团灭的,西征波兰战役的虐杀)。中世纪开始大家都发现了,一旦战争规模玩大了,只能用骑兵,再贵也得用。
Nvidia依旧保持卡皇身份,但是中低端的AMD高功耗比和性价比虐杀。
显卡跟骑兵不一样的是。。你弄了那么多马(发射器和控制逻辑),那玩意是要发热的。。而且也是要占晶体管的。
所以你就看到核弹这个词的产生了。。。热得要死,晶体管多的要命。
详细请看传送门
写的挺好的(对了 要不要找别人授权啥的。。我没这意识啊。。)
总结一下就是AMD追求数量,而Nvidia追求效率。。
后来AMD发觉在这么玩下去不行,毕竟规模越来越大了。。也开始制造骑兵了,再贵也得用。。。就是tahtil架构。

然后我们回到开普勒架构。。
开普勒开始追求所谓的能耗,如何追求能耗的呢?降低控制逻辑单元和指令发射器的比例,,用较少的逻辑单元去控制更多的CUDA核心,增加吞吐量啊等等方面。
<img src="https://pic2.zhimg.com/c2ded9290c1ee7a6d32e21f1935a76b5_b.jpg" data-rawheight="492" data-rawwidth="500" class="origin_image zh-lightbox-thumb" width="500" data-original="https://pic2.zhimg.com/c2ded9290c1ee7a6d32e21f1935a76b5_r.jpg">

但是关键还是在调度的机制。
减少了调度的模块,才能拥有非常多的cuda(也就是工作单位)
<img src="https://pic3.zhimg.com/db1a634716f43218ad92f51df98f26e6_b.jpg" data-rawheight="282" data-rawwidth="500" class="origin_image zh-lightbox-thumb" width="500" data-original="https://pic3.zhimg.com/db1a634716f43218ad92f51df98f26e6_r.jpg">通过软件把GPU用来分配工作的任务,来交给了CPU。通过软件把GPU用来分配工作的任务,来交给了CPU。
<img src="https://pic4.zhimg.com/b7f42f772e6ed7cd9481615e18834a13_b.jpg" data-rawheight="866" data-rawwidth="500" class="origin_image zh-lightbox-thumb" width="500" data-original="https://pic4.zhimg.com/b7f42f772e6ed7cd9481615e18834a13_r.jpg">

还有关键的几点是制程的改进,用了台积电的28mm,ddr5的显卡内存,动态提速(类似睿频的概念)等。
nvidia 在全面优化各方面,梳理各方面的思绪。方方面面的优化,只为了追求效率和功耗比。
最后说说 Maxwell 架构

<img src="https://pic2.zhimg.com/ec523c8963e5e7a74552bab83dcb6aa1_b.jpg" data-rawheight="324" data-rawwidth="190" class="content_image" width="190">
相比较开普勒架构的
<img src="https://pic2.zhimg.com/6484a9a33ece2754d95c00a837e16dad_b.jpg" data-rawwidth="741" data-rawheight="800" class="origin_image zh-lightbox-thumb" width="741" data-original="https://pic2.zhimg.com/6484a9a33ece2754d95c00a837e16dad_r.jpg">

。。。能够更好的检测到每一个cuda的状态(因为每一个sm单元控制的cuda单元减少),并且通过时钟调节来控制每一个效率。
,增加了二级缓存。。集成了NVENC,能在视频解码的仅仅靠NVENC模块,让GPU休眠。。当然还有很多

第一次写这个,然后好多资料是日语,英语的。我这方面好渣,就先默默搜集,以后在啃。,借鉴了一些国内有质量新闻的东西。。比如说中关村的顾杰。。写的还是货比较多的。、。

其实我感觉Nvidia每一代继承了上一代并且在各方面进行改进。。
~
~~~~~~~~~~~~~~~~~~~~实际情况~~~~~~~~~~~
gtx750TI是maxwell架构 gtx660 650ti是开普勒架构 hd7850是Tahiti架构
<img src="https://pic1.zhimg.com/1c0d593a46b106296e146a011956ca94_b.jpg" data-rawwidth="482" data-rawheight="247" class="origin_image zh-lightbox-thumb" width="482" data-original="https://pic1.zhimg.com/1c0d593a46b106296e146a011956ca94_r.jpg">跑分跑分
<img src="https://pic2.zhimg.com/47009df7ea0521bb68a3a2f4ae082211_b.jpg" data-rawwidth="465" data-rawheight="241" class="origin_image zh-lightbox-thumb" width="465" data-original="https://pic2.zhimg.com/47009df7ea0521bb68a3a2f4ae082211_r.jpg">功耗功耗

转载于:https://www.cnblogs.com/lmaster/p/6500634.html

Nvidia 的新显卡架构 Maxwell 性能相比开普勒提升了多少?相关推荐

  1. 开普勒架构和麦克斯韦架构是什么?有什么区别?

    Maxwell可以算Kepler的改进版架构.两个架构最明显的变化是在SMX单元和GPC单元上.Maxwell的SMM(之前叫SMX)单元从之前Kepler的包含192个CUDA Core下降到128 ...

  2. volta架构 微型计算机,性能大爆炸 NVIDIA新GPU架构曝光

    一年一度的GTC大会目前正在大洋彼岸的美国加利福尼亚州圣何塞市召开,这是由NVIDIA主办的GPU通用计算技术大会,号称是"图形技术巫师"们的聚会. 几乎每次GTC大会上NVIDI ...

  3. 新显卡出世,谈谈与深度学习有关的显卡架构和相关技术

    欢迎访问Oldpan博客,分享人工智能有趣消息,持续酝酿深度学习质量文. 老婆,我想要煤气炉 显卡的香气 新显卡出世了,就在前几天. 可以说是万众期待下,老黄发布了消费级(民用级)显卡RTX2070. ...

  4. 新显卡出世,我们来谈谈与深度学习有关的显卡架构和相关技术

    老婆,我想要煤气炉 显卡的香气 新显卡出世了,就在前几天. 可以说是万众期待下,老黄发布了消费级(民用级)显卡RTX2070.RTX2080.RTX2080TI,作为"大多数人", ...

  5. NVIDIA显卡架构

    架构排序(时间顺序): Tesla:市面已经没有相关显卡 Fermi:GeForce 400, 500, 600, GT-630 Kepler:Tesla K40/K80, GeForce 700, ...

  6. rtx2060什么水平_RTX2060性能如何?NVIDIA新一代RTX2060显卡评测

    原标题:RTX2060性能如何?NVIDIA新一代RTX2060显卡评测 在RTX 2080/Ti发布5个月之后,RTX 2060也终于发布了.在2019年1月7号的CES展会上,NVIDIA CEO ...

  7. amd插帧技术如何开启_AMD新显卡性能大公开:4K不逊色于对手,1440P完全碾压

    点击上方"蓝字"关注我们 前两天AMD已经发布了自己新一代RX 6000系列显卡,在发布会上AMD只是大概说明了一下新一代显卡的性能.按照AMD的说法,RX 6900XT可以和RT ...

  8. NVIDIA各个领域芯片现阶段的性能和适应范围

    NVIDIA作为老牌显卡厂商,在AI领域深耕多年.功夫不负有心人,一朝AI火,NVIDIA大爆发,NVIDIA每年送给科研院所和高校的大量显卡,大力推广Physix和CUDA,终于钓了产业的大鱼. 由 ...

  9. 显卡组超级计算机,NVIDIA发布全新显卡 在家就能拥有超级计算机

    原标题:NVIDIA发布全新显卡 在家就能拥有超级计算机 在本周于美国洛杉矶举行的SolidWorks World大会上,NVIDIA为旗下的Quadro系列显卡带来了多名新成员.这些新产品中不仅包含 ...

  10. adreno性能天梯图_显卡如何看性能好坏?2020年1月2月显卡天梯图性能排行榜

    转眼间来到了2020年,祝愿大家鼠年大吉,发发发!工作顺利,事事顺心!万事如意!而今天装机之家晓龙依然带来了显卡天梯图更新,这次更新,加入了AMD家的RX5500XT,不过RX 5500不知是什么原因 ...

最新文章

  1. 贪心:expedition 最优加油方法
  2. DeepFaceDrawing: 使用草图生成人脸图像
  3. InitializeComponent()有什么作用?
  4. 知识图谱在互联网金融中的应用
  5. Linux的crontab任务调度
  6. 窗外传来嬉闹声,我默默关上窗
  7. 关于jquerymobile的预加载
  8. C++模板元编程 入门简介
  9. ODS(Operational Data Store)定义
  10. 学成在线--20.新增课程(最后完善)
  11. 2018年工业机器人销量排位_报告显示中国工业机器人销量排名世界前三
  12. linux shell学习三
  13. python是什么专业学的-python编程学习需要哪些基础和准备工作?
  14. Ubuntu更改hosts档
  15. 计算机取证之你必须要会用的24款工具
  16. ffmpeg支持的扩展库有哪些
  17. python词库介绍_解析搜狗词库(python)
  18. (4.2.48)MVPArms源码分析
  19. TMS320DM8168浮点DSP C674x + ARM Cortex-A8开发板VGA输出接口
  20. qpython3手机版教程,qpython3手机版下载

热门文章

  1. sql 去掉重复的数据
  2. Linux下Vivado安装流程
  3. 大数据学习菜鸟的Hadoop快速入门基础教程汇总详细解答
  4. 计算机无法发现网络共享打印机,win10发现不了共享打印机怎么办 共享打印机找不到的解决方法步骤...
  5. 数据库的基础知识总结
  6. 一篇文章学懂ADB命令和Monkey命令
  7. 51单片机呼吸灯c语言程序,用51单片机的呼吸灯程序
  8. oracle jde优势介绍,JDE 的扫盲知识介绍。。。
  9. 搭建MySQL可视化Web界面服务器
  10. STM32中大小端转换