低功耗处理器设计已经应用于超过1800亿颗芯片的Arm,两年前就开始探索边缘、云端及5G市场,并发布了Neoverse E系列处理器,Arm当时称到2021年这一系列处理器每年要实现30%的性能提升。2019年,第一代Neoverse N1推出,性能提升60%,是2018年提出的目标的两倍。

本周,Arm再次更新Neoverse产品线,发布第二代N系列Neoverse N2以及全新的Neoverse V1平台。相比Neoverse N1,Neoverse N2在保持相同水平的功率和面积效率之余,单线程性能提升了40%。同样与Neoverse N1相比,Neoverse V1的单线程性能可提升超过50%。

Arm在高性能计算市场是要靠单核与x86的多核竞争吗?

Neoverse CPU为何强调单核性能?

Neoverse系列发布两年之后,已经拥有了E系列、N系列、V系列三大系列。Neoverse N系列同时考虑了性能、功率、面积(PPA),擅长可扩展;V系列旨在提供最佳性能,相对而言会消耗更多面积和功耗;E系列主要关注效率,在功耗和面积的缩减上进行优化。

作为最新发布的产品系列,V系列更加追求性能,因此Neoverse V1是面向7nm和5nm设计,并且率先支持可伸缩矢量扩展(SVE ,Scalable Vector Extensions)。SVE可基于未知宽度向量单元的软件编程模型,执行单指令流多数据流(SIMD)整数、bfloat16、浮点指令。

同时,V1还支持PCIe 5.0连接、DDR5、HBM2e和CCIX 1.0,可实现插槽之间的芯片与封装内小芯片之间的双向一致性通信。

Arm基础设施事业部高级副总裁兼总经理 Chris Bergey接受雷锋网采访时表示:“SVE在加速HPC高性能计算领域或者是机器学习工作方面表现高效,同时它对软件开发者非常友好,不需要管矢量的位宽是多少。未来我们会把SVE技术运用到除N2和V1之外的一系列核上面。”

以Arm架构为基础的日本富岳(Fugaku)超级计算机就使用了512位的SVE的技术,它不仅是全球最快的超算,也是最新Green500榜单排名第四的超算。

Arm本周发布的另一款新产品Neoverse N2面向5nm工艺设计,支持PCIe 5.0和DDR5,通过支持用于高带宽存储器的HBM3以及用于结构的CCIX 2.0和CXL 2.0来进一步扩展。可支持从8核心,20W到192核心350W的设计,横跨云、智能网卡(SmartNICs)、企业网络到功耗受限的边缘设备的高可扩展性平台。

Chris Bergey表示,关于新发布的V1和N2的更多细节会在之后公布。现在我们只知道V1和N2相比上一代N1的单核性能提升了超50%和40%。

为什么Neoverse CPU如此强调单核性能?Chris Bergey解释:“我们认为云服务厂商会更倾向选择单线程处理器核,因为接近度、安全性、多租户等特性可以为他们带来更好的经济性,这也是我们的产品聚焦单线程技术的原因。当然,Neoverse E1也支持同步多线程(SMT)技术。”

他还给出了一张图表,X轴代表芯片级性能,Y轴代表每线程性能,从图表中可以看到,相比传统的英特尔和AMD服务器CPU,Neoverse的单核及芯片级性能都超过了市场上的产品。

Neoverse每年30%的性能提升持续到2021年之后

Arm承诺,Neoverse系列CPU的性能每年会提升30%,这种提升会持续到2021年。Chris Bergey说:“这当然与Arm工程团队的努力和投入是分不开的,我认为与软件生态的逐渐成熟有更大的关系,例如很多云原生的软件现在可以比较无缝地运行在Arm架构上面。”

Arm在手机CPU市场持续更新的架构与Neoverse性能的持续提升显然有着密不可分的关系。Chris Bergey表示,“我们在Cortex的基础上,针对基础设施领域所要求的功能做了进一步的增添或提升,并且打造最合适超多核设备的功耗与性能,包括核之间的互联等优化工作。”

也就是说,同一时期的Cortex和Neoverse产品之间存在相似之处。比如,Neoverse N1是和Cortex-A76是同期开发,这两个微体系结构有很多相似之处。

Neoverse V1可以看作是Cortex-X1的同级设计,两款旗舰CPU可能共享许多超大型内核结构。Cortex-X1是今年5月份发布的新品,同样追求最大性能。

Neoverse N2有些特殊,因为它代表下一代Cortex-A的设计,也就是与Cortex-X1同期发布的A78的后续产品,这或许也是Neoverse N2的技术细节现在还不能公布的关键原因。为了更直观的说明Cortex与Neoverse产品线之间的关系,外媒AnandTech制作的一张图能够帮助大家更好地理解。

图片来源:AnandTech

软件生态方面,Arm关键的任务在于Arm的芯片级接口,这提供了设计系统层级解决方案的机会。Arm在CCIX与CXL投资,提供更好的互联技术,可以提供可扩展性的交换网,支持大量的处理器核。

另外,Arm Project Cassini是希望通过标准、平台安全性与参考实施,对软件开发者友好,让行业合作伙伴能够在基于Arm的平台上部署装机即用。

在对基础设施的基础软件包括操作系统、虚拟机管理程序支持方面,Xen、KVM、Docker容器以及越来越多的Kubernetes已经陆续宣布支持Arm架构。许多初期由Arm推动的开源项目正在变得自主运转,商用ISV应用程序也齐步演进。

Arm服务器CPU“抢食”x86蛋糕最缺的是时间

但想要真正撼动x86在云端CPU市场的地位,Arm还有很长的路要走。Chris Bergey对雷锋网表示:“Arm在云端市场最大的挑战还是时间。我们看到很多数据中心的客户对转向Arm有巨大的兴趣。但从Arm的IP到芯片设计,到最后能够在数据中心部署,再到软件生态系统的支持,仍需要一定的时间以及很多产业链合作伙伴一起努力。”

当然,Neoverse是面向从个云端到边缘的市场。Chris Bergey也指出,Arm的机遇其实包括了云原生软件的支持,以及协助客户通过定制化的形式克服摩尔定律减速带来的挑战等。

雷锋网此前报道,亚马逊、Marvell都已经将Arm架构应用于云端,亚马逊推出了Arm架构的服务器处理器Graviton2,Marvell也推出了基于Arm架构定制的ThunderX3处理器,华为海思也推出了基于Neoverse N1设计的鲲鹏系列服务器。

业内有观点认为,Arm在云端市场要成功的一个关键就是满足大型互联网公司和云服务提供商的定制化需求。

“在异构计算里,Arm有一个很大的机遇,就是我们如何提供紧耦合或是定制化的能力,甚至是通过多核封装或多芯片组装技术,将来自生态系统、IP技术与云厂商的需求与技术整合在一起。” Chris Bergey说,对于没有很强设计经验的客户而言,他们更倾向于选择Neoverse核。

Arm架构芯片能未来能否覆盖从终端到边缘再到云端?现在看来,这种成功除了Arm的努力外,最终是否会被英伟达收购也成为了关键因素。

注:文中未单独注明图片来源的图片来自Arm

cpu空载50度_单线程性能提升超50%!Arm新款服务器CPU要靠单核打天下?相关推荐

  1. 80核处理器_华为首款Arm架构服务器CPU鲲鹏920发布:64核主频2.6GHz ,性能创纪录!...

    2019年1月7日,华为正式推出业界最高性能Arm架构服务器芯片--鲲鹏920(Kunpeng 920),以及基于鲲鹏920的三款TaiShan服务器.华为云服务.同华为还宣布携手产业伙伴推动Arm的 ...

  2. cpu空载50度_高性价比6热管全镀镍CPU散热器来了 超频三东海风云GI-R66U体验

    拆过主机箱的人都可能见过,台式机在用久了以后机箱底部和主板上都往往会有灰尘,特别是CPU处理器周边和散热器上,这些部位一旦灰尘过多,电脑在使用时普遍会CPU温度过高,长时间使用就会运行缓慢甚至卡顿.而 ...

  3. cpu空载50度_三代锐龙用户必看:CPU待机50度降不下来?AMD的解决方案来了

    原标题:三代锐龙用户必看:CPU待机50度降不下来?AMD的解决方案来了 美国当地时间7月30日,AMD发布了芯片组驱动程序与Ryzen Master超频工具更新,重点改善了第三代锐龙中近期玩家呼声较 ...

  4. mysql数据库容量和性能_新品速递丨容量盘性能提升超 300%,数据库支持 MySQL 8.0...

    2 关系型数据库 MySQL Plus 支持 MySQL 8.0 内核 及 XtraBackup 物理在线迁移方式 关系型数据库服务 MySQL Plus 发布新版本 1.0.6 , 新增多项功能,提 ...

  5. Puppet 4 性能提升超2倍,升级前应该你知悉的变化

    1.激动人心的改进 \ Puppet4的第一个正式版本于2015年4月15日发布截止到2016年12月28日Puppet已正式发布了4.8.1版本.Puppet4与3.x版本相比有两点不同:很多的变化 ...

  6. 实现分区表性能提升超 10 倍,解密 TDSQL PG 版开源升级特性

    1 月 11 日,腾讯云 TDSQL PG 开源版(开源代号 TBase)再升级:分布区表关联查询性能(join)提升超 10 倍,同时提升了产品在分布式场景下的易用性,增加灵活可用的功能组件. 该升 ...

  7. 英特尔核显驱动hd630_跳票数年,英特尔10nm终现身:重新定义晶体管架构,性能提升超15%...

    SuperFin是英特尔10nm最大的亮点,它是FinFET结构的升级版.英特尔将增强型FinFET晶体.Super MIM(金属-绝缘体-金属)电容器相结合,打造了全新的SuperFin,能够提供增 ...

  8. 华为鸿蒙os设置界面,华为鸿蒙OS系统界面疑似曝光 运行性能提升超60%

    01华为鸿蒙OS系统界面疑曝光 近日,网上曝光了疑似华为鸿蒙OS操作系统的截图照片.据截图信息显示,此次"鸿蒙"OS操作系统的界面,不论在功能排列.状态栏,还是字体布局.按键配色等 ...

  9. 人工智能行业有哪些岗位_建筑行业年薪超50万,哪些岗位有希望达到?你是什么岗位呢?昆山建造师培训学校...

    建筑行业年薪超50万,哪些岗位有希望达到?你是什么岗位呢? 在我国的众多行业中,建筑行业的收入可以排在前三名了,收入是比较高的,不管是施工建筑工地的工人,还是技术岗位的建筑注册人才,收入都是十分不错的 ...

  10. 基准风险因子暴露度_具有性能基准SQL Server索引填充因子

    基准风险因子暴露度 In this article, we will study in detail about the how SQL Server Index Fill factor works. ...

最新文章

  1. python文件io是啥意思_Python文件IO(普通文件读写)
  2. 如何用python画出中国地图-用Python画一个中国地图
  3. sentry 命令_sentry(二)集成sourcemap
  4. 从零实现一个3D目标检测算法(2):点云数据预处理
  5. 钢筋符号怎样加入wps_钢筋知识「收藏备用」
  6. 苹果地图副总裁_苹果地图表现糟糕 iOS副总裁福斯特难辞其咎
  7. [在windows上使用Unix工具]cygwin
  8. ubuntu安装nvidia显卡驱动+cuda+cudnn
  9. linux 桌面版 黑屏,安装ubuntu时黑屏的解决办法(3种)
  10. Linux重启tomcat服务
  11. 字典表该如何写查询语句?
  12. 网站应用和服务器管理(课程总结4)Week12 澳大利亚维多利亚大学VIT1204 Web Application and Server Management
  13. 编译原理五 LR(1)分析法【C语言实现】
  14. scrapy爬取51job职位信息(针对2020.851job新的反爬虫机制)
  15. 嵌入式 linux 屏 翻转,linux下如何把屏幕设置成竖屏
  16. 机器学习习题(17)
  17. RecyclerView状态异常Cannot call this method while RecyclerView is computing a layout or scrolling
  18. 查看、管理和修饰数码照片的利器:Windows照片库
  19. 将Word文档中指定内容锁定
  20. c语言用递归求奇数和,奇数正整数和的递归算法

热门文章

  1. 醉枕江山第五十二章 公主中的公主
  2. 【笔记】用Python写百度翻译网络爬虫
  3. 新版标准日本语中级_第五课
  4. 怎么把foxmail的邮件和服务器同步,foxmail设置ActiveSync同步功能怎么操作?设置ActiveSync同步功能方法介绍...
  5. 取消磁盘介质写入保护
  6. linux下使用opengL Glad + EGL问题记录
  7. win7无线连接服务器,win7/8无线网络连接受限制怎么办?
  8. 美团热修复 Robust 方案接入(一)
  9. Java作业-圆柱体积
  10. 龙哥库他发matlab程序,编程实现四阶龙哥库塔法解方程