作者 | 唐杉  责编 | 张文

来源 | StarryHeavensAbove

头图 | CSDN 下载自东方 IC

今年我们看到很多芯片领域出现的“新现象”,也有不少会让你“陷入沉思”的时刻。对我个人来说,苹果 M1 可能是冲击最大的一个。

我从 04 年开始做手机 SoC,08 年开始接触 ARM,断断续续做到 16 年。在苹果 M1 之前,我从来没想过基于 ARM 的架构可能在性能上超越 X86。

当然,M1 并不是传统意义上的 CPU,而是一颗 SoC,所以直接的比较也许并不完全公平。但如果从应用程序的角度来看,运行速度加快,功耗降低,都是实实在在的。对 M1 的分析很多,细看下来,大部分架构优化的思路和获得的结果也都是非常自然的(可能也有一些我们不知道的苹果黑科技)。

但为什么苹果之前没人这么做,或者说做不到呢?

问题的关键在于苹果掌握了完整生态和供应链,在有充分的技术积累和丰厚利润之后,可以做更多的“纵向优化”。这个事件本身还不只是技术上的胜利,未来会给整个产业带来深远的影响。

当然,从这句话的限定词来看,能成功复制者可能寥寥无几。后面的新闻说微软也打算给 Surface 自研芯片来看,不知是不是有戏。

之前的文章对芯片架构和技术趋势有不少讨论,“通用”到“专用”、“同构”到“异构”、“先进工艺”到“先进封装”、“分而治之”到“跨边界优化”。

为什么会有这些趋势,简单说就是被逼的,一方面摩尔定律放缓和 Dark Silicon 问题,另一方面特定算力需求激增。一句话,要求高了,只有精耕细作了。

但问题是,即使这些趋势大家都认可,具体该怎么做呢?真没那么简单。

先说说异构和专用的问题。

我们可以看看已经“精耕细作”了很多年的手机芯片。手机 SoC 是非常典型的异构系统,包括大量的专用处理器,发展到今天,已经极为复杂。下图是我随便找的一个高通手机芯片的框图,大家可以看一看,除了 CPU,GPU,各种 DSP 和硬件加速器,可以说把异构做到极致了。

source: anandtech

为什么手机的主处理器在智能手机刚出现的时候就是 SoC 的形式?

也是被手机尺寸,功耗,成本这些限制给逼的,它不可能照搬桌面 PC 独立 CPU 的架构。这种架构的优势是将整个系统都放在一颗芯片上,而不仅仅是通用的 CPU。其中很多硬件模块都是根据特定功能需求定制的,比如通信基带,ISP,Connectivity,多媒体,语音,定位,可能是基于 DSP,也可以是更专用的硬件加速器。这其实也就是我们今天常说的 Domain-Specific 的概念。

另一方面,模块间的通信是在片上解决,效率要高很多。这种 SoC/DSA 架构的优势是硬件 PPA 可以极致优化;缺点除了架构复杂度和不同类型硬件的优化之外,异构编程和软件优化也会比较困难。

先不看苹果,由于安卓系统的出现,独立的手机芯片厂商可以把精力集中在底层,反正这些 DSP 和硬件加速器一般也不开放,都是芯片厂商自己来优化相关软件(常说的 firmware)。这样的架构和生态已经发展了十几年,现存已经不多的独立手机芯片厂商已经很有经验。即便如此,芯片厂商提供的一些新算法的加速库往往还不能令人满意,也从侧面说明了异构专用架构软件优化的难度。

再看苹果,其技术上的优势,很大程度得益于在“封闭”的系统(操作系统也是自己的),有可能实现“纵向优化”。在技术上的优势转化为巨大的利润之后,苹果的芯片就进入良性循环。实际上,在苹果开始自研芯片之后,可以说整个半导体供应链,从 Foundry 到 EDA/IP 都是按照苹果新机发布的节奏在进步。积累到今天,苹果已经具备了挑战传统桌面系统架构的能力。

对于传统的桌面和数据中心处理器,简单的说“不思进取”也不是很公平,CPU 本身还是芯片技术的高峰。在它能做到的范围内(主要是硬件),工艺演进、封装演进、架构优化,硬件性能继续提升还是可以预期的。但它多年形成的生态特征(包括历史包袱)和苹果(还包括其他一些巨头)这样的“封闭”生态大不相同,苹果们能做到的事情它还真做不到。

讨论到这里,我们也不难看出,未来在技术上的优化,传统的分而治之的策略已经越来越困难(或者并不经济),打破边界有可能会实现“降维打击”的效果。

虽然好处显而易见,但成功与否的决定因素可能不在技术,而是背后掌控生态和供应链的能力。另一方面,抛开技术原因,越来越复杂的竞争关系,也是推动产业链重新整合的动力

今年,我们看到 Nvidia 收购 ARM,AMD 收购 Xilinx,Intel 推 oneAPI,其实都是这方面的尝试。对于芯片厂商来说,尽量在自己的核心领域实现生态的“垄断”是最高目标。但是,对于复杂芯片来说,构建软件生态可能要比设计或实现出芯片本身更为复杂。特别是在一些专用领域,单芯片硬件架构趋向简化,但软件栈的实现和产品化挑战很大。

因此,从目前整体状况来看,相对传统芯片公司,科技巨头在软件和系统生态上具有先天的优势的。我之前分析过 Google 情况,有很多芯片厂商很难做的事情,在 Google 自己的生态里面相对容易(其实是和苹果 M1 的情况类似)。还有一个例子是这篇文章里 JAX 这个研究性框架可以很好的发挥 TPU 的性能。未来我们应该能看到更多由科技巨头发起的发自系统需求的跨层次优化。

回顾历史,分而治之(分层优化)是计算机系统和通信系统这样的复杂系统几十年快速发展的关键,未来实现彻底扁平或端到端的优化是不太可能的(这个超越人类能力的问题可能得留给 AI),但找到更合理的分层或分块方式是完全有可能的。比如,我们看到深度学习框架和编译器领域就有很多尝试,一方面打破传统的图和算子的层次进行统一优化是一个广泛关注的路径;另一方面,通过多层 IR 和编译工具来更合理的实现“分而治之”也很有前景。

苹果 M1 的例子再次给我们证明了现在确实是“架构的黄金时代”,芯片,软件,系统都还有很多优化空间。重新思考非常必要,甚至“重新设计轮子”有可能是非常合理且有效的选择。

最后说两句“先进封装”的问题。“Chiplet”是今年的热词,历史更久且更准确的技术词汇应该是异构集成(Heterogeneous Integration),有兴趣的朋友可以看看HIR(Heterogeneous Integration Roadmap),有这个领域非常完整的分析和预测。

总的来说,这个技术趋势是比较清晰明确的,而且第一阶段的 Chiplet 形态(比如 HBM)在技术上已经比较成熟,除了成本比较高,在很多高端芯片上已经使用。而且这个技术涉及的供应链比较简单,可以说是花钱就可以解决的问题。当然,这个方向还是有很多技术挑战的,最终是要走向 Monolithic 3D(如下图)。

source: ERI summit 2020

另外一个和异构集成关系很大的是光互联,这两件事要是解决了,芯片和系统架构可能发生产生根本性的变化。

注:以上文字,完全是个人观点,题图来自网络,版权归原作者所有。

从苹果 M1 看芯片技术发展趋势相关推荐

  1. 极客日报:阿里再度调整组织架构:天猫淘宝大融合,新设三大中心;苹果M1首席芯片设计师跳槽至英特尔

    一分钟速览新闻点! 腾讯接入数字人民币,微信支持数字人民币支付 阿里再度调整组织架构:天猫淘宝大融合,新设三大中心 七成清华毕业生进入体制内就业 北京最受欢迎:华为腾讯等科技企业也受青睐 钉钉近期将推 ...

  2. 苹果M1 Max芯片发布:570亿晶体管,图形性能堪比RTX 3080

    视学算法报道 机器之心编辑部 Arm 芯片已经达到超越 Core i9,与 RTX 3080 打得有来有回的程度了. 有人说,M1 芯片的笔记本还只是个玩具,昨天的发布会上,苹果把 M1 芯片的面积再 ...

  3. 从Microsoft Teams技术栈看前端技术发展趋势

    在前不久的微软美国一年一度的Ignite大会上,微软宣布Microsoft Teams是微软历史上发展最快的应用.它将取代Skype for business,成为语音视频协作的主打产品. 我也有幸在 ...

  4. 使用了12个月的苹果 M1 芯片,我发现了它的「致命」弱点

    作者 | Attila Vágó 译者 | 弯月 出品 | CSDN(ID:CSDNnews) 首先,我仍然相信苹果 M1 的芯片在技术上取得了巨大的飞跃,再次站在了创新的最前沿,然而一旦新鲜感消失之 ...

  5. 飘了!英特尔 2 年内要发布高效芯片超过苹果 M1

    整理 | 于轩       责编 | 张红月 出品 | CSDN(ID:CSDNnews) 自从Mac电脑过渡到ARM架构以来,英特尔一直在努力击败Apple Silicon芯片,这已经不是什么秘密了 ...

  6. 飘了,英特尔2年内要发布高效芯片超过苹果M1

    自从Mac电脑过渡到ARM架构以来,英特尔一直在努力击败Apple Silicon芯片,这已经不是什么秘密了.虽然英特尔已在陆续推出强大的新芯片,但它的效率远不及苹果. 近日,一份泄露的英特尔路线图表 ...

  7. 安装arm虚拟机_虚拟机Parallels出手:苹果M1的Mac能运行Win 10 还挺顺畅

    对于搭载M1处理器的苹果新Mac来说,终于可以用上Windows 10了. Mac平台知名虚拟化软件Parallels宣布,新的Parallels Desktop 16 for M1 Mac技术预览版 ...

  8. 从苹果 M1 到英伟达 Grace,“缝合风”为何在芯片大厂中盛行?

    作者 | 马超 出品 | CSDN(ID:CSDNnews) 历史不会简单重复,但总是惊人的相似.之前在电影.游戏等人文领域流行的缝合风,似乎也对IT界芯片设计师们产生了影响.在英伟达最新的发布会上, ...

  9. 苹果M1芯片:如何开启一个时代

    来源 | 老石谈芯 头图 | CSDN下载自视觉中国 11月11日,苹果今年的发布会三部曲终于落下了帷幕.这场压轴大戏上,发布了苹果自研芯片Apple Silicon的第一代产品:M1芯片.首批搭载M ...

最新文章

  1. 使用深度学习检测DGA(域名生成算法)——LSTM的输入数据本质上还是词袋模型...
  2. docker 在容器外执行某个容器内的某个命令
  3. Bootstrap的form-group form-control input-group button-group
  4. Vue-route路由的嵌套使用
  5. 你真敢ZAO吗?解读换脸AI “细思极恐” 的用户协议
  6. Xamarin的坑 - 绑定(二) - 高德iOS SDK(.Framework)绑定的一些事
  7. sqlserver把小数点后面多余的0去掉
  8. php面试专题---MySQL常用SQL语句优化
  9. 删除 java代码中所有的注释
  10. 【BZOJ】1270 [BeijingWc2008]雷涛的小猫
  11. 计算机图形学 dda,计算机图形DDA算法
  12. oracle客户端sqlplus镜像(可通过ssh客户端远程连接操作sqlplus命令)
  13. HTML5游戏引擎(一)-egret引擎简介——一个开源免费的游戏框架
  14. 基于MFFMB的电商评论文本分类研究
  15. 11.21的自动锁屏 ios_iPhone11 的新手小技巧
  16. 【Grafana】【一】Grafana 简介
  17. BI解析,告诉你企业为什么选择商业智能BI?
  18. 南京信息工程大学python期末考试_考研想考南京信息工程大学怎么样?
  19. 程序设计、数据结构、编译相关图灵奖得主简介之二
  20. LeetCode 每日一题打卡:334.递增的三元子序列

热门文章

  1. 【感悟】本书书名无法描述本书内容(二)
  2. 当程序员,你应该懂的法则
  3. SSM 封装base(二) -封装分页
  4. DenyHosts安装及配置
  5. HTML标记之Form表单
  6. 让Android Studio 使用上vs的android模拟器
  7. cocos2dx 3.x 快速创建项目
  8. php session实现原理
  9. 一步一步写算法(之循环和递归)(转)
  10. 研究生计划 三