3月21日下午,ARM在北京对外公布了一项新技术——DynamIQ技术,并宣称这个技术将被大量的应用于汽车、家庭以及各种互联设备,设备产生的数据会在云端或者设备端被用于机器学习,以实现更先进的人工智能。

这个技术是ARM公司的一项重大突破。按照ARM自己的说法,“DynamIQ是针对下一个计算时代应运而生的新技术”。之所以这么评价,ARM副总裁暨计算产品事业部总经理Nandan Nayampally作出了解释:

ARM副总裁暨计算产品事业部总经理Nandan Nayampally

1、这项技术相当于“重新定义了多核处理器”。

说到这里我们先回顾一下12年前,ARM确实在业界推出了革新式的产品多核ARM11,ARM11实际上是第一次实现了在单一群集当中可以支持四个核用于嵌入式的系统。也就是说,即使是一个群集,内部的配置也能够做到多元化、灵活性。

六年前,ARM开始引入大小核群集这样的技术。两个不同的群集连在一起,能够实现异构计算的多核。这就更适用于越来越高需求的智能手机,同时延伸到了企业级计算,甚至汽车等嵌入式系统的领域。

现在,DynamIQ技术所基于的Cortex-A系列处理器,将重新定义多核。这也是ARM big.LITTLE技术(为适当的作业分配恰当的处理器)的重要演进,因为DynamIQ big.LITTLE能够允许对单一计算集群上的大小核进行配置,而这在过去是不可能的。例如,1+3或者1+7的SoC(系统级芯片)设计配置, 现在因为DynamIQ big.LITTLE使其得以实现,这个功能,尤其在异构计算和具有人工智能的设备上都是需要优先考虑的。

Nandan Nayampally说,“有了DynamIQ这个技术,我们在一个群集当中可以最多放8个核,而且这8个核可以是不同处理能力的核。这意味着,不管你有没有大小核,都能够实现同构或者异构计算的灵活性。”“另外,DynamIQ还可以与CoreLink和Cache Coherent Interconnect技术互补,实现与大型计算系统的连接。”“此外, DynamIQ对内存子系统做了重新设计,让核本身具有更强的处理能力和更高的性能。”所有这些性能,以及快速响应,都被延展到片上系统的其他部分。

2、DynamiQ还包含了一系列针对机器学习和人工智能进行优化的全新处理器指令集,可以加速人工智能在各个领域的普及程度。这个“加速”,主要通过对CPU和片上系统两方面性能的提升来实现。第一代采用DynamiQ技术的Cortex-A系列处理器在使用优化指令集后,可以实现比基于Cortex-A73设备高出50倍的人工智能性能,并最多可提升10倍CPU与SoC上指定硬件加速器之间的反应速度。

3、这项技术拥有高度可拓展性以及量身定制的解决方案。它指的是一个全新的单一群集,在这个单一群集当中最多可以放置八个处理能力,或者功耗不同的核。这也就把芯片级或者是群集的可配置性,推上了一个新的台阶——结合使用CoreLink的话,可以把DynamIQ用于一些大型计算系统。

4、DynamIQ能实现更安全的自动控制系统(safer autonomous system),支持ASIL-D安全标准。不管是因为系统本身,还是因为人为的错误导致了系统故障,DynamIQ的技术能够帮助系统实现自恢复的功能。在这背后,DynamIQ从需求的捕获,到设计、验证、跟踪、部署、交付,整个过程当中都有非常严苛的执行。

值得注意的是,这个技术发布会是ARM在2016年被软银收购后的第二次大动作。而在ARM官方,加入软银集团并不仅仅是一次商业事件,更多的被描述成“为了引领下一次信息革命的突破性转型”。

在这次的技术发布会,ARM还是走这个路数,尽管ARM整场一直强调将在人工智能领域有所突破,但Nandan Nayampally在回答现场媒体提问时表示,ARM依然坚持做通用的计算架构,“重点是发布一个技术的平台”。

“通用的计算架构”一直是ARM的定位。这时候我们就有必要来了解一下这家公司。26年前成立于英国剑桥的ARM,是一家半导体设计及软件公司,公司既不生产芯片也不销售芯片,它只出售芯片知识产权方案授权——“ARM架构”。这个架构被广泛使用在手机、PDA(掌上电脑)、平板、数字媒体、计算器、手游控制台等等当中。

也许你并不了解ARM这家企业,但你很可能是它的用户。简单说,目前你能买到的硬件设备里,不管是骁龙、MTK、苹果还是海思麒麟,这些芯片统统使用过ARM的指令集架构或处理器架构。它们向ARM购买授权之后,在ARM架构的基础上再设计或改进芯片。也正是因为这样,ARM架构的芯片出货量已经达到了1000亿。

而ARM笃定,把这个数字再翻一倍只需要5年——到2021年,ARM的总出货量将达到2000亿片。Nandan Nayampally表示,ARM现有的成绩和对未来的乐观预测,有几个因素:

一方面反映了整个行业目前对于更多计算的需求,一方面因为ARM“全面计算(Total Computing)”自身的高可拓展性,更关键的是基于他们的合作伙伴——目前ARM在全球有450多家半导体行业合作伙伴,有35亿人使用基于ARM架构的计算设备,用来联网、通信以及计算。

特别是现在人工智能和物联网发展的越快,ARM的生态系统越不再局限于移动计算领域。市面上有更多基于ARM的软件、软件堆栈和应用被开发出来,被应用在智能手机以外的智能家居、汽车以及企业级应用。

在这些越来越细分的领域,“基于ARM架构的芯片小到能够用在一个连电池都没有、必须要依赖外部供电的非常微小的传感器当中。甚至注入到人体,可以监测人体的状态——我们相信,ARM架构在物联网的世界当中确实能够作为一个非常有效的催化剂。”Nandan Nayampally说。

这个“催化剂”时间可能不会等太长,或许2020年是一个时间点。Nandan Nayampally设想:2020年,人工智能、机器学习、电脑视觉以及电脑的语言能力会无所不在;

一些智能化被深入的运用到无人驾驶车、机器人以及工业控制系统当中——除了高性能,安全性也格外重要;

而且到了2020年,人类能够真正地实现混合现实。“尽管5G为我们描述了一个极低延时,超高带宽通信的情景,但是数据会以爆炸式的状态去发展。也就意味着,我们需要更高、更强的处理能力,我们不能够完全依赖于云端进行数据处理。此外,我们需要设备本身能够实现更低的功耗,更低的散热,以及更高的性能。”

到那个时候,ARM计划就是,计算在哪,ARM就在哪。

原文出处:科技行者
转载请与作者联系,同时请务必标明文章原始出处和原文链接及本声明。

要把人工智能提速50倍的ARM,却依然坚持做“通用的计算架构”相关推荐

  1. 提速50倍 阿里云发布全新一代高性能企业级存储家族

    寒冬将至,存储市场却迎来了久违的暖流. 1月9日,阿里云宣布推出全新一代块存储.极速型OSS.NAS Plus等高性能企业级存储产品家族,并对分布式存储引擎进行全面升级,性能比过去提升了最多50倍,给 ...

  2. 让 API 端点的响应速度提高 50 倍!

    本文为大家讲解如何将API 端点请求的响应速度提高50倍的. 作者 | Bill Franklin 译者 | 明明如月,责编 | 郭芮 出品 | CSDN(ID:CSDNnews) 以下为译文: 此案 ...

  3. 再见 for 循环!pandas 提速 315 倍!

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 西陆蝉声唱,南冠客思深. 来源:P ...

  4. 用 Taichi 加速 Python:提速 100+ 倍!

    这是「进击的Coder」的第 706 篇技术分享 作者:太极图形 来源:太极图形 " 阅读本文大概需要 13 分钟. " Python 已经成为世界上最流行的编程语言,尤其在深度学 ...

  5. 用 Taichi 加速 Python:提速 100+ 倍

    Python 已经成为世界上最流行的编程语言,尤其在深度学习.数据科学等领域占据主导地位.但是由于其解释执行的属性,Python 较低的性能很影响它在计算密集(比如多重 for 循环)的场景下发挥作用 ...

  6. 开启报名 | 清华游凯超:预训练模型这么多,该如何选择?一种提速3000倍的高效方法...

    在深度学习时代,神经网络的参数量越来越大,从头开始训练(train from scratch)的成本也越来越大.幸运的是,在计算机视觉.自然语言处理等人工智能应用的主要领域,人们能够采用迁移学习的预训 ...

  7. AI算法效率每16个月提速一倍,算力革命超越摩尔定律

    AI算法效率每16个月提速一倍,算力革命超越摩尔定律 2020-05-06 22:10:26 作者 | 蒋宝尚 编辑 | 丛 末 摩尔定律预测芯片性能每18个月翻一倍,那 AI 算法性能多少个月翻一番 ...

  8. 50倍时空算力提升,阿里云RDS PostgreSQL GPU版本上线

    2019独角兽企业重金招聘Python工程师标准>>> 2019年3月19日,阿里云RDS PostgreSQL数据库GPU规格版本正式上线,开启了RDS异构计算并行加速之路.该版本 ...

  9. YOLOv3通道+层剪枝,参数压缩98%,砍掉48个层,提速2倍!

    点击我爱计算机视觉标星,更快获取CVML新技术 尽管目标检测新算法层出不穷,但在实际工程项目中不少52CV群友还是念着YOLOv3的好.将其部署到边缘设备等时,模型剪枝是非常有必要的,毕竟有原始模型有 ...

最新文章

  1. C语言之父:因拒付论文装订费错失博士学位,论文52年后重见天日
  2. c语言调用shell命令一 popen使用以及获取命令返回值
  3. AjaxPro对象参数传递
  4. 关于最近公司裁员和加班的思考
  5. httpurlconnection 封装_不要再封装各种Util工具类了,看看这个框架
  6. 使用Chrome Frame插件解决IE浏览器兼容问题
  7. Mac安装MongoDB
  8. java vcf文件 昵称怎么写,Vcf文件的突变ID号注释
  9. unity3d 关于如何画扇形
  10. 使用Spring Boot + Resilience 4j实现断路器
  11. php的坑,PHP中的这容易被踩的坑,新人必看
  12. java实现docx文档下载
  13. matplotlib绘制3D图像
  14. python字符串是啥_python字符串表示什么?
  15. c语言知识地图,【程序设计论文】C语言程序设计翻转课堂研究(共3546字)
  16. 二进制安装K8S - NODE 节点的安装
  17. 使用高防CDN有什么用处?
  18. matlab mcr调用,mcr环境下,vs调用matlab,报错access violation
  19. 机器学习 决策树篇——解决离散变量的分类问题
  20. 计算机网络——IP数据报的发送和转发过程

热门文章

  1. LayaAir引擎开发HTML5最简单教程(面向JS开发者)
  2. 服务注册中心,Eureka与Zookeeper比较
  3. JavaScript概述2
  4. iOS Mac Charels 抓包
  5. I.MX6 Manufacturing Tool V2 (MFGTool2) Emmc mksdcard-android.sh hacking
  6. 面试时,如何向公司提问?
  7. 二叉树的实现(Java语言描述)
  8. 100%防御ARP***
  9. linux关闭网卡休眠_CentOS_Linux常用实用指令整理三:高级指令
  10. android 动画xml属性总结