Kaveri APU带来了推土机架构的第三个版本“压路机”,而眼瞅着FX、Opteron系列更新无望,APU更是极有可能成为这一架构的唯一用武之地。那么,它的理论性能如何?所搭配的GCN GPU又是怎样呢?

AnandTech近日对AMD、Intel最近几代处理器的CPU、GPU峰值浮点性能进行了考察对比,包括不同指令集、浮点级别下每时钟周期性能、峰值浮点运算能力(每秒十亿次/GFlops),看看谁更适合通用计算。测试对象包括Kaveri、Trinity、Llano、Haswell、Ivy Bridge。

一个问题是,现在的CPU、GPU都支持动态加速,很难确定峰值计算时的确切频率。本文中CPU使用基准频率,GPU则是加速频率,因为在多线程、异构计算中,CPU不太可能加速。如果有需要,你也可以根据本文的结论推算出自己所需要频率下的相应性能。

GPU方面最新得到官方确认的是,Kaveri APU fp64双精度的性能是fp32单精度的16/1,与主流的GCN架构显卡相同(HD7900及其上是1/4)。

CPU峰值性能取决于代码编写、编译的SIMD指令集架构,这里考虑三种:SSE、AVX、AVX FMA(FMA3/FMA4)。

Intel在架构设计上的领先凸显无疑,各项指标都完秒,Haswell更是优化AVX、FMA指令集代码的首选。

Trinity/Kaveri里的推土机架构是两个整数单元共享一个浮点单元,自然很吃亏,SSE性能甚至还不如K10老架构的Llano,但是后者不支持AVX。

GPU峰值性能考虑了Haswell GT2、GT3e两种核显,后者集成了128MB嵌入式缓存,兼具四级缓存的作用。

GPU fp64的支持其实有点混乱,因为部分GPU尽在部分API下才支持它。Intel GPU fp64的比例没有官方公布,估计是fp16 1/4,但是Intel只在DirectCompute API下才能实现fp64,OpenCL下完全不行。

AMD Trinity/Richland APU更乱,OpenCL fp64的支持不符合标准规范,而是使用了私有的扩展cl_amd_fp64,DirectCompute/MS C++ AMP下似乎也不支持fp64。

Kaveri就好多了,所有API下都标准支持fp64,是所有集显方案中最齐全的,美中不足的就是Direct3D fp64还不如Haswell,跟独立显卡的差距自然也很大,但是它拥有独特的HSA异构系统架构,非常适合CPU+GPU联合加速的应用。

Kaveri fp64性能其实并不太好,CPU、GPU加起来也才大约110GFlops,因此做一般的加速计算还可以,特别是fp32异构应用超越Haswell GT2、Ivy Bridge,但是高性能应用上不够。

GT3e Iris Pro也有不少亮点,特别是有强大的CPU辅助,比较适合Windows 8 C++ AMP的开发,但缺点是Linux系统下现在不支持OpenCL,驱动还在开发。

简单地说,Kaveri规格全面,性能均衡,Haswell部分突出,但有缺失。

amd linux 性能,AMD与Intel大战 看谁峰值浮点性能更强相关推荐

  1. php 生成动态键值 数组_你的PHP项目遇到性能问题了吗?看完这篇性能分析恍然大悟...

    你的项目中遇到性能问题了吗?遇到性能问题你是如何解决的呢?你的解决方式是否正确呢?下面就跟大家一起分享php项目的性能问题. PHP语言级性能分析 php在什么情况下会遇到性能问题呢? 在讨论性能问题 ...

  2. amd linux raid,AMD平台组建RAID 0全攻略

    AMD芯片组组建RAID0磁盘阵列同样较为简单,只不过在选项上与Intel不太一样.同样经过开机画面后按Delete按键进入BIOS设定,按←→↑↓键找到Storage Configuration选项 ...

  3. cache性能分析实验 北邮_AMD RX 6000游戏性能实测:全面领先RTX 3090

    AMD 官网现已公布 RX 6000 显卡的多款游戏测试数据,测试平台采用了 AMD 的 "Zen3"Ryzen 9 5900X CPU. 在<战地 5>.<无主 ...

  4. linux pti性能影响,Linux修正内核:Intel打补丁性能狂降、AMD不受影响

    Linux修正内核:Intel打补丁性能狂降.AMD不受影响 由于Meltdown和Spectre两个严重内核级漏洞造成的安全事件愈演愈烈,其中不可否认的是,搭载Intel处理器的Linux服务器.数 ...

  5. 英特尔和amd学计算机,笔记本处理器intel和amd哪个好_有什么区别|性能对比-太平洋电脑网...

    [PConline杂谈]在移动办公时代,笔记本电脑无疑是我们外出办公和游戏不可或缺的产品.尤其是对于职场达人来说,笔记本更是代表着生产力.可随着如今锐龙芯片杀入笔记本市场之后,在这个生存力工具上的选择 ...

  6. r7 3700x锐龙三代不支持linux,AMD三代锐龙攒机必看 DIY老玩家回归指南

    一句"AMD,Yes!"喊出了多少玩家对基于全新7nm制程的AMD第三代锐龙处理器的期待.DIY玩家们对于AMD的喜爱,不仅仅是因为性价比,更是期盼精进的AMD让市场重新回归良性竞 ...

  7. amdintel服务器性能差异,高频比多核重要?浅析为何AMD游戏性能干不过Intel

    2006年石破天惊的一声巨响,Intel给我们送来了酷睿系列桌面级处理器,转瞬之际游戏应用市场江山易主,游戏玩家们都是十分现实的,说谁是谁的粉丝那只是场面话,最终还是谁强就用谁的. 时间如白驹过隙,转 ...

  8. AMD Ryzen Threadripper 2990WX和intel 9980XE 用于第一性原理计算对比

    目前除去工作站服务器多路CPU,个人桌面CPU性能也不断提高,特别是年初AMD发布了第二代线程撕裂者CPU,同时intel也是在原来7980XE的基础上发布了升级后主频更高的i9 9980XE,目前从 ...

  9. 3900x做服务器性能怎么样,【茶茶】AMD YES?AMD R9 3900X测试报告

    本帖最后由 chacha121 于 2019-9-10 12:34 编辑 如果说一代锐龙代表了AMD在CPU上的翻身之作,那么第三代锐龙则开启了AI两家性能平起平坐的竞争格局,同等核心数的情况下AMD ...

最新文章

  1. gulp压缩js转义es6的常见错误及解决方案
  2. Android MIPI转LVDS显示屏调试之--- SD65DSI84概述(2)
  3. 流畅的验证组件:FluentValidation
  4. 关于Windows Unicode 编码的问题
  5. Qt 信号量 QSemaphore Class 的翻译
  6. 1.11 多于空间维度的向量组
  7. AM2320 温湿度计 单总线读取数据
  8. leetcode43. 字符串相乘 经典大数+和*
  9. sqlite3修改表内容python_Python sqlite3数据库模块使用攻略
  10. pytorch使用早停策略
  11. A-Webkit第四章:添加学生
  12. pdf.js跨域加载文件
  13. python实现 Polar码极化过程
  14. 字节跳动的第一场败仗:烧光20亿,悟空问答终落幕
  15. Lp_LIBRARY 相关问题解决
  16. P9065 [yLOI2023] 云梦谣 题解
  17. Fone Keeper Mac版,帮你轻松恢复iOS数据
  18. Yolov5 最简推理代码
  19. 中国金刚石工具产量和出口量均居于全球前列,市场广阔
  20. php gpc绕过,phpyun最新版两处注入(无视gpc)

热门文章

  1. 【05】Oracle创建用户、修改密码
  2. 以计算机谈人文科学,人文科学系第二届师范生素质技能大赛(第二阶段)之“课堂片段教学信息技术组”总决赛...
  3. kubernetes===》二进制安装
  4. Ubuntu安装Docker及Docker-compose
  5. IBM推出三大云计算产品
  6. JavaScript-BOM对象
  7. 华为交换机修改radius服务器地址,华为CE交换机radius认证登陆
  8. 热度下的冷思考——智能眼镜到底有没有前途?
  9. 替天行资源网同款人脉社群小程序V6.1.0源码
  10. 机器嗅觉探源之五——气味电子化(1)