2022 云栖大会上,阿里巴巴宣布自研 CPU 倚天 710 已大规模应用。

编解码场景实现了 80% 的性价比提升,数据库场景、AI 推理场景、大数据场景也都分别有着 30%、70%、50% 的有效性价比提升。

天猫双 11 核心交易系统平滑迁移至倚天 710 云实例,算力性价比提升 30%;汇量科技广告推理业务使用倚天 710 云实例,性能和网络带宽双双提升,性价比提升 40% 以上。

今天就来说说,这些蹭蹭蹭的性价比提升,阿里云 ECS 倚天实例是怎么实现的呢?

第一个秘密武器是平头哥自研的倚天芯片本身。

倚天 710 芯片采用无超线程的设计,让计算性能更高。

无超线程设计,是不是有点懵?我们先来了解一下计算机的“大脑”CPU 芯片平时是怎么工作的。CPU 里面有两个比较重要的分工:

计算,主要 CPU 核里面的执行单元负责,数量越多往往算得越快,主频则是影响计算速度,越高算得越快;

缓存,则是暂时存数据的歇脚点,比如说你要算 A+B=?,就需要先把 A 和 B 暂时存着,等到算的时候才用上。

后来,技术人员发现,大部分情况,一个应用都用不完一整个物理核,导致 CPU 有很大一分部分是“闲置”的。

于是,就有厂商设计了超线程概念,也就是把一份物理核变成 2 个 vCPU(虚拟CPU),就可以“同时”运行两个应用进程。传统架构的 CPU 就是这样。

这两个 vCPU,因为是在共用一个物理核和缓存,就会导致来自不同 vCPU 的计算指令要排队被“计算”,同样的缓存里面等待的时候也是一样的。

这样导致的坏处是,因为相互争抢和影响,所以 vCPU 性能波动较为严重,单个进程也因为要排队,计算速度变慢。

无超线程的设计意味着 ECS 倚天实例采用的是独享物理核心方式,这可以让算力密集的计算指令不必排队、不必争抢,计算速度更快。

倚天芯片的 ARM 架构与生产工艺让功耗更小,运算速度更快、更稳定。

倚天处理器采用的是 ARM 架构,采用更精简的指令集,本来功耗就比传统架构低,加上先进制程工艺,倚天 710 的功耗是主流架构的 1/6,优势十分明显。

一般来说芯片制程越小,功耗越小,性能越高。

生产制程指的是芯片表面晶体管的尺寸,宽度越小电流通过时的损耗越小,功耗越小;更小尺寸也意味着在同等面积中可以塞入更多的晶体管,而作为运算芯片的基本组成部分,更多的晶体管数量显然能够提供更好的性能。

加更多的晶体管,要怎么加也是很有学问的。一般来说架构越新性能越高、能力也更丰富。倚天芯片采用的是最新的 ARM v9 架构,比之前提供了更多执行单元,也增加安全性、机器学习等新能力。

除了算得快,倚天还功耗低,意味着成本低。功耗大不仅意味着成本,可能还会影响计算性能的平稳。传统 CPU 架构功耗大,导致计算负载过重时温度上升,为了避免高温造成的功能失效,会主动降低主频,进而影响了性能。倚天就没有任何降频问题。

倚天云服务器性价比高的第二个秘密武器,就是阿里云的数据中心处理器——CIPU。

CIPU 开创了不同的硬件架构,让服务器以 CIPU 为中心。

CIPU 连接 2 颗或者更多倚天的芯片,让多个芯片共享一台服务器,这样降低了成本,使得倚天实例更有竞争力。

同时,各个倚天芯片在各自主板上,一旦某个零件出问题,不会影响同一个机器上的另一张芯片,会让产品更为稳定。这样的设计叫多单路的硬件机型设计。

双路设计,单个 CPU 损坏将波及同一主板的 CPU。

依靠 CIPU 实现双单路设计,低成本+高可用

最后,CIPU 将虚拟化与 IO 转发等数据面卸载到专用硬件上进行加速,消除了原来虚拟化损耗与性能争抢,并大幅加速了 IO,也会使得整体性能更高;VPC 环境下支持弹性 RDMA 加速能力,相比 TCP 时延降低 70% 以上。

一文看懂倚天云实例|科普漫画

一文看懂倚天云实例|科普漫画相关推荐

  1. 科普达人丨一文看懂阿里云的秘密武器“神龙架构”

    在一台电脑中,我们把CPU和硬盘比作一家公司的加工厂和仓库,那么两个部门的任务就是处理数据和存储数据. 但是因为土地价格和劳动力价格差异较大等因素,需要将两个部门分别建在不同的地方,这也就是在云上的情 ...

  2. 一文看懂百度云智峰会:发布两大中台、八大方案,落地细节精准到发丝

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 在今年举办的百度云智峰会上,百度智能云迎来全新升级,领导团队首次集体亮相. 进入2020年,新冠疫情给经济生活带来深刻影响,新基建政策又给 ...

  3. 一文看懂边缘云在广电行业的应用

    简介:随着中国广电的5G布局在不断加速,各地广电运营商均已开展面向边缘云建设和业务探索.边缘云作为5G网络架构中关键一环,具有广覆盖.低时延.大带宽的技术特点,是打通智慧广电建设的"经脉&q ...

  4. 一文看懂华为云AI新政,这波开发者福利有点硬

    李根 发自 ShanghAI  量子位 报道 | 公众号 QbitAI 华为这家公司,"很吓人". 他们在做的事.要做的事,一旦进入执行,总会态势惊人,无论旧业务还是新领域. 比如 ...

  5. 一文看懂开源许可证丨开源知识科普

    一文看懂开源许可证丨开源知识科普 1. 一文看懂开源许可证丨开源知识科普 1.1. 什么是开源许可证? ("Open Source License") 1.2. 常见开源许可证 1 ...

  6. 《SOC芯片研究框架》深度科普,发展趋势、技术特点、产业链一文看懂

    片上系统SoC(System on Chip),即在一块芯片上集成一整个信息处理系统,简单来说 SoC芯片是在中央处理器CPU的基础上扩展音视频功能和专用接口的超大规模集成电路,是智能设备的" ...

  7. 一文看懂深度学习——人工智能系列学习笔记

    深度学习有很好的表现,引领了第三次人工智能的浪潮.目前大部分表现优异的应用都用到了深度学习,大红大紫的 AlphaGo 就使用到了深度学习. 本文将详细的给大家介绍深度学习的基本概念.优缺点和主流的几 ...

  8. 一文看懂-ElasticSearch全文搜索引擎

    一文看懂-ElasticSearch全文搜索引擎 一.ElasticSearch简介 1.1 什么是ElasticSearch ElasticSearch简称ES,其中Elastic 从名字里我们可以 ...

  9. 一文看懂 AI 训练集、验证集、测试集(附:分割方法+交叉验证)

    2019-12-20 20:01:00 数据在人工智能技术里是非常重要的!本篇文章将详细给大家介绍3种数据集:训练集.验证集.测试集. 同时还会介绍如何更合理的讲数据划分为3种数据集.最后给大家介绍一 ...

最新文章

  1. SVN:更新、同步与提交 PS:被锁定之解决方法
  2. js中给数组中对象去重
  3. C语言 —— 运算符的优先级
  4. Visual Studio 扩展包(.vsix)制作
  5. 3.1 cat:合并文件或查看文件内容
  6. 31.javaweb简介
  7. 【elasticsearch】Elasticsearch : alias数据类型
  8. 数据测试风控中的几类应用场景
  9. 阶梯博弈(尼姆博奕进阶)
  10. 多分类决策树 r语言_R语言——决策树模型的相关可视化
  11. 【SQL合集-SQL必知必会】
  12. 五种常用手机Java编程软件
  13. java在线校验银行卡号_校验银行卡卡号
  14. 【zheng】学习搭建github的高星项目:zheng
  15. 【游戏测试】bug优先级的定义及如何描述
  16. Authing 实力上榜安全牛《中国网络安全行业全景图》
  17. 我就发布个夏泽网注册码
  18. 编译实验 lr c语言代码,编译原理-实验5-LR(1)分析法
  19. perl(Time::HiRes) is needed mysql5.7
  20. 英酷词典 使用方法 必知必会

热门文章

  1. 第二次罗塞塔学习总结
  2. python twisted是什么_Twisted基础介绍(一)
  3. python怎么导入sklearn_导入sklearn
  4. 怎样在word和ppt中使用好看的字体
  5. 关于对算法岗职位的认识
  6. java实现CAD图纸文件DWG格式转为PDF格式
  7. DOS 命令 attrib:修改文件属性
  8. batch 13.0 批处理 attrib
  9. 【coding加油站】人事管理系统---毕设
  10. 判别两棵树是否相等 设计算法_机器学习算法-朴素贝叶斯