来源:机器之心

目前业界性能最强的 ARM 服务器芯片,性能超过业界标杆 20%,能效比提升 50% 以上。

10 月 18 日是 2021 云栖大会的开放日,在 40000 平米的展区中,有一个展位格外引人注目。

这里展示着阿里的「芯片家族」:从平头哥首颗芯片玄铁 910 到首颗自研高性能 AI 芯片含光 800,再到其他专用芯片,阿里这两年的造芯之路「几乎」一览无余,只有红布之下是个例外。

「红布之下是什么呢?」「到明天云栖大会开幕就知道了。」现场工作人员卖起了关子。

十几个小时后,阿里云智能总裁、达摩院院长张建锋为我们揭开了谜底:原来这是阿里平头哥芯片家族的新成员——倚天 710。它采用了业界最先进的 5nm 工艺,单芯片可容纳高达 600 亿颗晶体管。

和专注于 AI 推理的含光 800 不同,倚天 710 是一颗通用服务器芯片(CPU),也是 第一颗采用 5nm 工艺的服务器芯片。它基于最新的 Armv9 架构,内含 128 核 CPU,主频最高达到 3.2GHz,能同时兼顾性能和功耗。

在内存和接口方面,它集成了业界领先的 DDR5、PCIE5.0 等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。

在 SPECInt2017 基础测试平台上,倚天 710 的跑分达到 440 分,是当前性能最强的服务器芯片,超出业界标杆 20%,能效比优于业界标杆 50%,能有效帮助数据中心节能减排。

阿里表示,倚天 710 是阿里云推进「一云多芯」策略的重要一步,也是阿里第一颗为云而生的 CPU 芯片,即将在阿里云数据中心部署。

「基于阿里云『一云多芯』和『做深基础』的商业策略,我们发布倚天 710,希望满足客户多样性的计算需求,这款芯片不出售,主要是阿里云自用。我们将继续与英特尔、英伟达、AMD、ARM 等合作伙伴保持密切合作,为客户提供更多选择。」张建锋介绍说。

作为一家电商、物流、云计算、大数据、全球化等场景的公司,阿里拥有世界上最挑战、最丰富的计算场景、网络场景、机器学习场景,需要使用大量芯片,自研芯片能够降低阿里巴巴集团内部整体计算的成本。随着倚天 710 的发布,平头哥已拥有处理器 IP、AI 芯片及通用芯片等产品家族。其中,玄铁系列为 AIoT 终端芯片提供 IP,出货量已达 25 亿颗;含光 800 为人工智能场景提供 AI 算力,服务于搜索推荐、视频直播等行业;倚天 710 则通过阿里云为云上用户提供算力。

从玄铁到含光再到倚天,平头哥三年完成「三级跳」

造芯难,一直是这两三年的热门话题,国内企业也在快马加鞭补齐芯片设计的短板。但在高性能 CPU 市场上,国内还没有太多成功的经验。正如中国科学院微电子研究所所长叶甜春所说,集成电路就是一座喜马拉雅山,而核心芯片就是珠穆朗玛峰,「需要全世界最高端的技术。」

为了攀登这座高峰,阿里早在几年前就开始了布局。

2016 年,阿里投资软件定义网络(SDN)芯片公司 Barefoot 以及翱捷科技、寒武纪、深鉴、耐能、中天微、恒玄科技等多家芯片公司;2017 年又成立了达摩院并组建了一支由半导体行业顶级专家组成的技术团队。

2018 年,阿里全资收购大陆唯一拥有自主嵌入式 CPU IP core 的中天微。在那年的云栖大会上,达摩院芯片研发团队与中天微团队合并,平头哥半导体公司就此成立。

在之后的三年里,平头哥完成了「三级跳」:先是发布了当时业界性能最强的 RISC-V 处理器玄铁 710,让基于 RISC-V 架构的高性能芯片成为可能,也让芯片设计的门槛进一步降低;紧接着,在 2019 年的云栖大会上,平头哥又发布了阿里第一颗芯片含光 800,这是一颗针对场景深度定制的芯片,创造了性能和能效比的两项第一;再接着就是今年云栖大会倚天 710 CPU 的问世

CPU 是半导体行业设计门槛最高的芯片之一。为了达到通用服务器 CPU 的性能、功耗要求,倚天 710 采用了很多领先的技术,包括 Armv9、DDR5、PCIE5.0 等,并对它们做了深度定制。

Armv9 是 ARM 公司在今年 3 月份正式推出的新架构。它的前辈——ARM 在 2011 年推出的第一款 64 位架构 Armv8——之前已经在服务器领域取得了一些成功,不少企业基于此架构开发了可用于服务器和超算领域的产品,个别产品也获得了不错的效果,让 Arm 芯片从小型或移动设备,进入了新的领域。Armv9 在此基础上进一步创新。根据 ARM 官方的介绍,新的 Armv9 架构将会至少使用 10 年,未来两代基于 Armv9 架构的处理器在性能上有望提升 30%。而且与 Armv8 架构不同的是,Armv9 架构的适用范围更广阔,其一系列改进不少都是为了 Arm 架构芯片可以实现高性能计算做铺垫。

长期以来,X86 服务器一直占据市场主导地位,而且构建起了成熟的商业生态并占据专利和标准制定等战略高地。相比之下,ARM 芯片在服务器领域存在性能劣势以及生态环境的阻力。Armv9 的一系列改进为芯片企业进一步探索基于 Arm 的服务器芯片设计提供了信心。

除了这些国际领先技术,倚天 710 还引入了许多自研技术,从前端架构设计到后端物理实现都是自研

在前端设计方面,为解决核数众多条件下的带宽瓶颈,平头哥对于片上互联作出特殊优化,采用新的流控算法,降低系统反压,有效提升了系统效率和扩展性,使单核高性能有效地转化为整个系统的高性能。此外,通过新的系统地址到 DRAM 地址的转换机制,倚天 710 支持安全、非安全隔离、多 NUMA、异常通道隔离多种特性,同时 DRAM 读写效率大幅度提升。

在后端物理实现方面,5nm 工艺对能量密度、芯片内部结构的布局提出了极高的要求。为此,平头哥在研发过程中灵活调度了 30 种不同的 EDA 软件、深度定制时钟网络和定制 IP 技术。此外,他们还采用了先进的多芯片堆叠技术,最后成功确保了芯片性能、功耗的优化。

倚天芯片的研制成功,标志着平头哥已经具备大型复杂芯片的研发设计能力,并进入与 Intel、AMD、AWS 等少数一流芯片公司竞争的行列。

从服务器芯片发布到玄铁处理器开源,阿里端云一体化战略逐渐清晰

除了在纵深向不断突破芯片技术外,平头哥也在积极推动芯片生态的发展。在本次云栖大会现场,平头哥宣布四款开源玄铁 RISC-V 系列处理器(玄铁 E902、E906、C906、C910),并开放相关工具及系统软件。开发者可通过平头哥 Github 和芯片开放社区(Open Chip Community)下载玄铁源代码,在此基础上,实现开源 EDA 协同,创新硬件架构,丰富软件应用生态。

这是继发布玄铁 710 等处理器后,平头哥在 RISC-V 生态上的重要举措,也是全球首个商业处理器的开源,进一步拉近了 RISC-V 技术与开发者的距离,成为全球硬件开源的新里程碑。

AIoT 时代,RISC-V 架构因其开放、灵活的特性,有望成为继 Intel X86、ARM 后的下一代广泛应用的 CPU 架构。但是,当前 RISC-V 架构面临应用碎片化、开发效率低、软硬件适配难等问题,软硬件生态尚未成熟。

玄铁 RISC-V 系列处理器采用自研技术,覆盖从低功耗到高性能的各类场景,支持 AliOS、FreeRTOS、RT-Thread、Linux、Android 等操作系统,并已成功应用于微控制器、工业控制、智能家电、智能电网、图像处理、人工智能、多媒体和汽车电子等领域。不久前,玄铁 910 全球首次实现兼容安卓,极大拓展了 RISC-V 架构面向开放生态的想象力。

阿里表示,对于正在上升期的 RISC-V 架构技术而言,只有更多的开发者和企业使用,才能共同推进生态进步,真正让这一技术在芯片和操作系统等软硬件层面实现繁荣,平头哥也会从中受益。

服务器芯片发布、玄铁系列处理器宣布开源,阿里的端云一体化战略逐渐清晰。作为构筑这一战略的核心,达摩院、平头哥及阿里云,正在成为阿里巴巴三位一体的核心技术栈。平头哥得到了达摩院和阿里云的软实力加持,例如基于达摩院的算法能力,打破了算法和硬件之间的鸿沟;基于阿里云飞天云平台的优势,快速形成了端云一体芯片生态。

阿里表示,他们希望通过自研的强大技术平台和生态系统能力,推动国产自主芯片的产业化落地。

推荐阅读

  • 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

  • 一文总结微软研究院Transformer霸榜模型三部曲!

  • Swin Transformer为主干,清华等提出MoBY自监督学习方法,代码已开源

  • 加性注意力机制!清华和MSRA提出Fastformer:又快又好的Transformer新变体!

  • MLP进军下游视觉任务!目标检测与分割领域最新MLP架构研究进展!

  • 周志华教授:如何做研究与写论文?(附完整的PPT全文)

  • 都2021 年了,AI大牛纷纷离职!各家大厂的 AI Lab 现状如何?

  • 常用 Normalization 方法的总结与思考:BN、LN、IN、GN

  • 注意力可以使MLP完全替代CNN吗? 未来有哪些研究方向?

欢迎大家加入DLer-计算机视觉&Transformer群!

大家好,这是计算机视觉&Transformer论文分享群里,群里会第一时间发布最新的Transformer前沿论文解读及交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、视频超分、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如Transformer+上交+小明)

「倚天」一出,谁与争锋!全球首款5nm服务器芯片,业界最强相关推荐

  1. 苹果发布全球首款5nm芯片A14!性能提升40%,新iPad Air率先搭载

    边策 贾浩楠 萧箫 杨净 发自 凹非寺  量子位 报道 | 公众号 QbitAI 也是罕见,苹果的新品发布会,新一代iPhone没亮相,倒是把最新最强的AI芯片发布了. 没错,今天苹果没有发布iPho ...

  2. 超越英伟达的,不会是另一款GPU?这家深圳公司发布全球首款数据流AI芯片

    2020年6月23日,鲲云科技在深圳举行产品发布会,发布全球首款数据流AI芯片CAISA,定位于高性能AI推理,已完成量产. 鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,较同类产品在芯 ...

  3. 谁与争锋-七款杀毒软件比较分析

    焦头烂额的末路英雄-江民KV 有些渐渐陷入泥潭的末路英雄KV,无论是监控还是查杀能力依旧是当今国产杀软中的翘楚,甚至可以勉力和KAV争锋.估计是年纪大了,老得糊涂了,只顾着在盗版的狂潮中穷追猛打,对于 ...

  4. 恩智浦发布全球首款基于单芯片的可扩展安全V2X平台

    全球最大的汽车半导体解决方案供应商恩智浦半导体(纳斯达克代码:NXPI)发布新一代RoadLINK?解决方案,扩大自身在安全车对多(V2X)通信领域的领先地位.新的恩智浦SAF5400是世界上首款符合 ...

  5. “纳米光学先驱”师生档详解光计算,全球首款商用光子芯片即将问世-1

    10 月 25 日,由中国工程院.中国光学工程学会主办的 "第二届未来技术与颠覆性创新国际大会暨第 310 场中国工程科技论坛" 在杭州市盛大召开.  这是一场业内顶级峰会,大会开 ...

  6. 全球首款5g全网通智能路由器华为5G CPE Pro发布 售价2499元

    昨日,华为5G CPE Pro在华为坂田基地正式发布.华为5G CPE Pro是将前沿5G技术与路由技术相结合的移动路由产品,实现以无线接入的方式彻底改变未来家庭宽带的接入方式,引领未来家庭宽带新风向 ...

  7. 【C++探索之旅】第一部分第十二课:指针一出,谁与争锋

    内容简介 1.第一部分第十二课:指针一出,谁与争锋 2.第一部分第十三课预告:第一部分小测验 指针一出,谁与争锋 上一课<[C++探索之旅]第一部分第十一课:小练习,猜单词>中,我们用一个 ...

  8. ChatGPT 不是终点:阿里不出,谁与争锋?

    ChatGPT正在变成一场竞赛,中国企业争先恐后抢发"自研"的ChatGPT,争当所谓的赢家.但实际上,ChatGPT并非竞赛的终点,而是起点,只是堪堪拉开了人工智能新时代的一角序 ...

  9. 香港金融中心谁与争锋

    2012年08月02日 06:42 AM 香港金融中心谁与争锋 英国<金融时报> 保罗•戴维斯 字号 背景 英文对照评论打印电邮收藏腾讯微博新浪微博 杨婕(Joy Yang)算不上一个真正 ...

最新文章

  1. 【DBA】DBA——数据库管理员
  2. [云炬python3玩转机器学习] 6-1什么是梯度下降法
  3. Java用JSONObject-lib来解析json串
  4. Spring Set注入简化写法1
  5. wordpress 密码重置 本地恢复后站点地址修改
  6. 重磅福利!程序员面试——算法工程师面试大全第六部分
  7. c中的结构体嵌套问题_C中的结构
  8. java基础9(IO流)-File类
  9. Selenium UI自动化怎么实现
  10. 你利用好网络这个工具了吗?
  11. 《缠中说禅》炒股经典理论
  12. Codeforces 474D. Flowers
  13. 【C语言】快速排序psort函数的用法及自主实现psort函数
  14. 在三角形中rt是什么意思_什么叫Rt三角形
  15. matlab学霸表白公式,学霸隐藏式表白数学公式
  16. 杰迷福利!1句python命令下载Jay Chou全部专辑MV
  17. 【笔记】win10上,IDEA完全删除,清理注册表
  18. 迅镭激光打标机3mm激光深度高精度打标工艺-激光雕刻
  19. SAP License:利润中心
  20. Unquotted string 错误

热门文章

  1. **极光推送PHP服务器端推送移动设备消息(Jpush V2 api)
  2. APUE 配置(Fedora)
  3. 安装ftp连接linux服务器配置,Linux下FTP安装及配置(VSFTPD服务器安装配置、FTP客户端安装配置)...
  4. pythonassertbug_还在 Bug 不断?不妨试试这 2 个装X技巧
  5. BaseModelOutputWithPoolingAndCrossAttentions的API
  6. 将二维数组保存为.csv格式
  7. to_excel() got an unexpected keyword argument ‘sheetname‘
  8. tensorflow1.14.0安装不上,报错
  9. 通俗理解kaggle比赛大杀器xgboost + XGBOOST手算内容 转
  10. 自然语言处理中句子相似度计算的几种方法