今天凌晨ARM在自家的技术大会中,发布了超低功耗的处理器构架Cortex-A35(代号水星)。厂商可以根据性能和功耗需求,对它的构架进行再设计,将其用在不同的领域。

Cortex-A系列分为高性能、低功耗和超低功耗3类:

  • 高性能系列的代表当然是ARM的大核构架Cortex A57和A72(还有在慢慢退市的A15和A17);

  • 低功耗系列的代表是高效能比的A53,根据需求,它可以以多核,或者 big.LITTLE大小核的形式工作;

  • 而超低功耗系列,在A5和A7之后,现在新增了A35。

虽然看起来有点反直觉,但A35和A53不是一个系列,A35是A7/A5的继任者(ARM的产品数字增长得真快……)。

在Exynos 5433测试中,我们发现作为升级版A7的A53,照样维持不了A7的功耗水平,它更像是把A7的效能曲线延长的产品,就是说A53的性能功耗比并没有多少提升。但因为A53普遍更高频,所以它在性能端可以走得更远。而A35这次主推能耗比,其实是在给当年吹过能耗比的A53打脸。

不过从战略意义上说,A35带来的最重要改变,是让Cortex-A系列上中下三路产品,都用上了64位的ARMv8构架。在A5/A7等老构架退休后,它就可以完成“全家64位”的宏愿了。此外,A35也可以和A72/A57/A53等核心组成big.LITTLE 大小核结构的SoC,可以让厂商根据需求,搞出各种大小核的组合产品,夸张一点,甚至可以搞出A35+A53+A72的三核心簇的SoC。

构架改进

A35和A7/A53一样,依旧是顺序执行的双发射构架。8级流水线长度,也和之前的构架设计没什么分别。ARM主要通过改进独立分区(individual blocks)来提升能效比。

  • 重点改善的是核心的前端效率,重新设计的指令预取单元,更强的分支预测性能。为了平衡性能和功耗,指令预取带宽也跟随队列长度的变短而做出了调整。

  • 对比A7,A35在缓存速度上有了明显的提升。A35套用了很多A53的缓存结构,一级缓存可以用作指令和数据缓存,加入了多线程的数据预测和写入侦查能力,根据需求可以定在8-64KB之间。二级缓存可以定在128KB-1BM之间。在提升写入效率,引入附着优化功能以降低占用的同时,也提升了资源共享的性能。

  • 另外一个大改进是 NEON/FP流水线,除了改善存储性能外,新的单元全流水线支持双精度乘法计算。流水线同样为了提升局部效率而进行了改进,这也是A35芯片面积可以比A53小的重要原因。

  • 在电源管理方面,A35也很像A53,它为CPU和NEON流水线(独立的电源供应区域)增加了状态保留功能(在休眠时,让核心保持原来的状态,类似iOS的墓碑模式),它多了个硬件来控制CPU进出保留状态。厂商很少使用这个功能,暂时确认有引入这个功能的是骁龙810,但或许因为发热问题,它也在随后的软件更新中禁用了这个功能,让在CPU闲置的时候直接关闭核心了。

低功耗/可定制化/超小芯片面积

A35盯准的功耗区间是125mW以下,这也是A7和A5通常的功耗范围。为了方便我们脑补,ARM表示,用28nm制程的1GHz主频A35处理器,其功耗只有90mW。当然,就像现在不同SoC里的A53,因为核心数、主频和工艺节点不同,A35核心的功耗也会很大的波动(例如用14/16nm制程,或者把主频推上2GHz)。

而A35也是ARM可定制化最高的构架,厂商能选择的不再只有核心数,他们可以选择是否加入NEON, Crypto(加密)和ACP(解析) 单元,甚至是否加入二级缓存都可以自行选择。这让A35可能成为下一代手机中应用最广的核心构架,我们也很可能会在可穿戴设备和嵌入式平台上,看到一大堆为IoT(物联网)定制的A35处理器。

对比32KB一级缓存,1MB 二级缓存,有NEON/Crypto加密模块的4核A53,剔除其他部分的乞丐版单核A35(8KB一级缓存,没有二级缓存),即使用28nm制程也能把芯片面积控制在0.4平方毫米一下(1*0.4mm,这可比米粒要小多了),这让它非常适合做成物联网芯片。

性能提升

在相同的核心数和频率下,A35构架宣称功耗比A7低10%,而且性能要高6-40%。在整数运算(SPECint2006测试)中,可以提升6% ;浮点运算(SPECfp2000测试)中提升更大,可达36%。

根据需求,A35可以做到A53 80-100%性能。在浏览器负载测试中,A35和A53的差距最大,A35最多只能提供A53 80%的性能;整数运算负载测试中,A35可以达到A53 84-85%的性能;而对于提升最大的缓存性能,反映在需要缓存性能的负载测试中,则可以有接近A53的性能表现。

A35的芯片面积只有A53的75%,而功耗则只有A53的68%。ARM宣称他们可以同时使用,甚至和A53做成大小核构架的SoC。

A35只要把频率提升,就能补上和A53的性能差距。即使再最差的方案中,高频A35会吃掉自己在功耗上的优势,但厂商依旧可以换来更小的芯片面积,照样可以省下一大笔费用。

如果正如PPT所说,无论是单独组成多核SoC,还是和A72等大核组成大小核结构的场合,都已经没什么必要使用A53构架了,A35很可能会代替A53。

ARM预计首批A35设备会在2016年末出货,因为用途和适应性奇广,它毫无疑问会成为之后数年里,ARM系列中最重要的的核心构架之一。

这么一想,A35在接下A5/A7的工作之后,顺便也让A53领便当了……

不过作为跑分党,笔者更关心高性能核心A72的表现,毕竟要同时抗衡苹果的A9、高通的Kryo和三星的猫鼬,一不小心就得领便当了。

ARM A35 A53相关推荐

  1. ARM、ARM架构、ARM架构芯片

    ARM是一种基于精简指令集(RISC)的处理器架构,它由英国的ARM公司设计和授权. ARM芯片具有低功耗.高性能.高集成度等特点,广泛应用于嵌入式系统.移动设备.物联网.服务器等领域.本文将介绍AR ...

  2. arm b bl 地址无关码_ARM_异常和中断

    ARM_异常和中断 问题1.中断向量表为于存储器的什么位置? ARM7系列,除ARM720T可以放高端地址,ARM9或更高都放高端地址上. 2.FIQ或IRQ异常返回指令是什么? 答案见下面.... ...

  3. 除了海思麒麟 华为在ARM芯片上还有哪些成就?

    在麒麟950的发布会上,华为宣布用于服务器的自主芯片正在紧锣密鼓的研发中.其实,正在开发ARM服务器芯片的远远不止华为,国防科大.高通.AMD等IC设计单位或公司都已经设计出或正在设计ARM服务器芯片 ...

  4. arm workbench ide 用户指南_ARM_异常和中断

    ARM_异常和中断 问题1.中断向量表为于存储器的什么位置? ARM7系列,除ARM720T可以放高端地址,ARM9或更高都放高端地址上. 2.FIQ或IRQ异常返回指令是什么? 答案见下面.... ...

  5. arm方案商,三星S5P6818开发板ARM Cortex-A53架构

    产品简介 G6818 开发板由邮票孔核心板,底板和液晶板三大块组成,核心板采用 8 层板工艺设计, 确保稳定可靠,可以批量用于平板电脑,车机,学习机,POS机,游戏机,行业监控等多种领域.主控为Cor ...

  6. ARM嵌入式开发板推荐

    arm嵌入式主板具有低成本.高性能.低功耗的特点,是一个嵌入在设备里面做控制.数据处理使用的CPU板,承担着"大脑"的角色,主要是作为工控主板使用.短短几年,ARM嵌入式的异军突起 ...

  7. 基于NXP_LS1012A 芯片ARM工控主板

    LS1012A处理器采用64位Arm®Cortex®-A53内核,可提供超过4,000的CoreMark®性能以及用于数据包处理和安全性的硬件加速,以及任何1 W典型电源通信处理器的最佳整体性能. F ...

  8. ARM工控主板LS1012A

    LS1012A处理器采用64位Arm®Cortex®-A53内核,可提供超过4,000的CoreMark®性能以及用于数据包处理和安全性的硬件加速,以及任何1 W典型电源通信处理器的最佳整体性能. F ...

  9. 从Intel和ARM双雄争霸读懂芯片的前世今生

    https://blog.csdn.net/BtB5e6Nsu1g511Eg5XEg/article/details/80729797     文章来源:新智元 这几天中兴事件持续发酵以来,各种议论纷 ...

最新文章

  1. vi php,linux编辑文件命令vi有什么作用
  2. linux sudo 实现原理
  3. 线程池模式比较-------ICE线程池模型------L/F领导者跟随者模式
  4. java常见不可变类_Java语言不可变类的诀窍
  5. java 文件读入 数组,将文本文件读入2d数组java
  6. fitbit手表中文说明书_如何获取和分析Fitbit睡眠分数
  7. RE validation in Java EE
  8. 895. 最长上升子序列
  9. ubuntu16.04更改python版本
  10. 在Oracle DG Standby库上启用flashback database功能
  11. python退出帮助系统_Python退出脚本并返回Main
  12. Gym 101246G Revolutionary Roads
  13. 《CUDA C编程权威指南》——2.4节设备管理
  14. 使用Flutter开发一个仿微信飞机大战游戏
  15. NRF24L01 2.4G无线模块浅析(学习笔记)
  16. python如何获取鼠标位置_python实时得到鼠标的位置
  17. word图片撑满_word图片满页 word图片铺满整个页面
  18. iOS开发:对于动态库共享缓存(dyld)的了解
  19. 红黑树 插入算法(一)
  20. 简单笔记本无线热点开启

热门文章

  1. 最难得的素养,是等人把话说完
  2. tc_net_secu 使用手册
  3. 论文翻译 | RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds
  4. PL/SQL Developer配置使用说明
  5. 两位数合并成一个四位数的C++代码
  6. 苹果开发者账号申请流程说明
  7. 视频编码零基础入门(1):视频编解码之理论概述
  8. [深度学习]Part1 Python学习进阶Ch24图像处理OpenCV(24.1~24.13)——【DeepBlue学习笔记】
  9. GRUB2命令和环境变量列表
  10. github-一个视频图片下载工具-lux(annie)