安妮 发自 北京国际饭店
量子位 出品 | 公众号 QbitAI

今年赛灵思开发者大会的参会成员,与往年有很大不同:不仅硬件开发者多,软件开发者也不少。

巧合么?不一定。回顾今天上午的整场发布会可以发现,发明了FPGA硬件起家的赛灵思,也将关注的焦点投向软件开发者了。

怎么说?

今天上午,赛灵思推出了两款新产品:

一是推出了业界首个ACAP(自适应计算加速平台)架构的芯片系列Versal,能为所有应用提供异构加速功能,并且适合所有开发者进行开发。

二是针对数据中心,推出了加速器卡Alveo,有望以较低时延实现突破性的性能提升。

这两款新品性能如何?新品背后有哪些逻辑,又各自有哪些亮点?

 赛灵思CEO Victor Peng

Versal平台:AI引擎加持

赛灵思CEO Victor Peng表示,当前芯片的设计周期需要18-24个月,已经跟不上创新的速度。因此,必须有一种产品可以在架构层面对芯片进行灵活的变化来适应技术的发展。

所以,发明了FPGA的赛灵思,这次又推出了一款比FPGA更灵活和易用的ACAP平台Versal。

Victor Peng表示,Versal有两大特色:

一是面向所有应用,即整合了标量处理引擎、自适应硬件引擎和智能引擎以及存储器和接口技术,能为所有的应用提供异构加速功能。

二是面向所有开发者,无论是软件开发者、数据科学家和硬件开发者,都可以在硬件和软件层面对其进行编程和优化。

Versal产品包含6个系列,全部采用了台积电的7nm FinFET 工艺技术,面向云、边缘和终端的产品。

在现场,Victor Peng主要介绍了计划明年面市的基础系列(Prime系列)和自带AI加速引擎的AI核心系列(AI Core)。

Victor Peng表示,Prime系列适用于多个市场的广泛应用,并针对各种工作负载的连接性和在线加速进行了优化。其中的9款产品采用双核Arm Cortex-A72应用处理器、双核Arm Cortex-R5实时处理器、256KB 片上存储器、超过4000个专为低时延高精度浮点运算优化的 DSP 引擎。

AI Core 系列的AI 推断性能较高档GPU预计提升8倍,AI推断吞吐量和性能较业界其他产品突破明显,是Versal系列计算性能最高、时延最低的。

Victor Peng表示,AI Core和Prime系列预计明年上市,到时还会提供全面的软件堆栈,包括驱动程序、中间件、库和软件框架支持等。

Alveo加速卡

除了加速平台,赛灵思还在现场发布了面向数据中心和AI的加速器卡Alveo U200 和Alveo U250,有望以较低时延实现突破性的性能提升。两款加速卡均基于赛灵思的UltraScale+FPGA打造。

Victor Peng说,这套加速卡性能超越GPU 4倍,超 CPU 90倍,并可针对不同工作负载提供灵活应变能力。与所有赛灵思技术一样,客户能对硬件进行重配置,从而针对工作负载迁移、新标准和更新的算法进行优化,而且无需支付替代产品衍生的成本。

目前,Alveo U200 8995美元起售,U250的价格为12995美元起。

通用、灵活的平台是未来

通过这场开发者大会能够看出,赛灵思的气质和此前不一样了。

此前大众印象中自带“半导体公司”title的赛灵思,这一次也开始以“自适应和智能计算企业”的头衔自居了,“灵活”“易用”和“可适应”也成了这场演讲中的关键词。

这不是赛灵思第四任CEO Victor Peng后的首场变革。今年三月,自赛灵思首次提出ACAP这种全新的产品类型起,就为今天这一步打下了基础。

此前,Victor Peng宣布ACAP的核心是新一代FPGA架构,结合了分布式存储器和硬件可编程的DSP模块、一个多核SoC以及一个或多个软件可编程而又具备硬件灵活性的计算引擎,并通过片上网络(NoC)实现互连,此外还拥有片上控制模块、硬件可编程存储器控制器、CCIX 和 PCIe 支持、可编程 I/O 接口等。

目前,赛灵思已经选择了在接下来几年继续利用ACAP发展Versal产品线,重金押注于此。

如此强势的ACAP未来如何?Victor Peng给出了自己的答案。

“ACAP不会取代所有GPU和ASIC,但未来,可能只有少数行业是固定芯片(如ASIC)能够发挥作用的,通用、灵活的平台才是未来大多数场景所需。”Victor Peng说。

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

赛灵思推7nm加速平台:面向所有场景、所有开放者,AI推理性能提升8倍相关推荐

  1. 移动端 GPU 推理性能提升 2 倍!TensorFlow 推出新 OpenCL 后端

    本文转载自TensorFlow. 文 / 软件工程师 Juhyun Lee 和 Raman Sarokin TensorFlow Lite (TFLite) GPU 团队在不断改进现有基于 OpenG ...

  2. 英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLM...

    Pine 发自 凹非寺 量子位 | 公众号 QbitAI "AI的iPhone时刻已至",英伟达或成最大赢家. 在GTC2023大会上,黄仁勋接连放出大招: 不仅发布了ChatGP ...

  3. 性能提升一倍,云原生网关支持 TLS 硬件加速

    简介:业界在优化 HTTPS 的性能上也做了诸多探索,传统的软件优化方案有 Session 复用.OCSP Stapling.False Start.dynamic record size.TLS1. ...

  4. 性能提升一倍!云原生网关支持 TLS 硬件加速

    作者|井轶 审核&校对|如葑 随着网络环境的日渐复杂,传统 HTTP 明文传输协议带来的传输安全风险也日渐升高,因此 HTTPS 的密文传输协议得到了业界的普遍认可与广泛应用:任何事情都有其两 ...

  5. AI解决方案:边缘计算和GPU加速平台

    AI解决方案:边缘计算和GPU加速平台 一.适用于边缘 AI 的解决方案 AI 在边缘蓬勃发展.AI 和云原生应用程序.物联网及其数十亿的传感器以及 5G 网络现已使得在边缘大规模部署 AI 成为可能 ...

  6. 黄仁勋从煤气灶下取出最新GPU:7nm全新安培架构,售价20万美元,训练性能顶6张V100...

    晓查 贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 深黑的皮衣,苍白的头发. 熟悉的老黄又来了,但是少了宽敞的会场和粉丝的尖叫. 因为美国疫情的原因,英伟达和其他科技公司一样,把今年的 ...

  7. 阅片机器人性能增8倍,帮电网大省钱:英特尔加速AI推理细节

    智东西(公众号: zhidxcom)文 | 心缘 智东西7月13日消息,英特尔AIDC开发者大会于本周四在深圳举行,在上午场中,英特尔展示围绕硬件.软件和生态活动的AI产品阵列.(英特尔AIDC秀肌肉 ...

  8. ai算子是什么_肇观电子刷新端侧AI芯片性能记录并发布“5分钟部署”AI开发平台 - 企业资讯...

    基于多年研发的CVKit™ NN IP的N1系列SoC芯片刷新了端侧AI芯片性能记录.领先的每TOPs处理帧数,实时数据流处理能力,支持高精度FP16神经网络模型直接无损部署,高性能的INT8网络支持 ...

  9. AI推理服务平台升级,阿里云机器学习PAI推出新规格

    随着生成式AI模型不断拓宽AI应用的场景边界,模型在线服务的数量级快速增长,AI推理环节亟需精细化的资源管理. 近日,阿里云机器学习平台PAI宣布全面升级模型服务平台PAI-EAS,面向文图生成.大语 ...

最新文章

  1. 编译-speex For iOS静态库
  2. php解析QQmv直链,网易云音乐直链解析API源代码^-^
  3. Ribbon-负载均衡原理
  4. python学习笔记(10)--组合数据类型(序列类型)
  5. 服务器内存超限问题_内存超限该怎么办?
  6. 如何解决: ModuleNotFoundError: No module named ‘object_detection‘
  7. 什么是思考?如何主动思考?
  8. 模糊聚类 matlab 代码,模糊聚类+Matlab代码
  9. TCP/IP的安全缺陷
  10. 图书销售系统可行性分析报告
  11. Discuz!X ≤3.4 任意文件删除漏洞(wooyun-2014-065513)
  12. 花两年时间去面试一个人——给准备面试的启发
  13. kotlin版贪吃蛇小游戏
  14. 【EasyUI篇】TreeGrid树表格组件
  15. SCI-EI-收录-检索-出版商 之间的关系
  16. fragment 中调用getactivity()的时候报 nullpoint错误
  17. 软考-嵌入式系统设计师-笔记:信息化和知识产权基础知识
  18. LeetCode#2379. 得到 K 个黑块的最少涂色次数
  19. Build Your Own Angularjs 读书笔记(AngularJS牛逼的地方在于它内嵌了一个表达式到Function对象的编译器。。。当然还有DI框架)
  20. python画中秋月饼,用turtle海龟库画中秋月饼

热门文章

  1. “衰亡”的雅虎:30 亿用户账号全部泄漏还能怎么活?
  2. 数据结构与算法之栈的用法
  3. 购买物品_1美元能买些啥?盘点1美元在10个不同的国家所能购买的物品
  4. java合并后求和_Java8使用stream实现list中对象属性的合并(去重并求和)
  5. 使用 Grafana+collectd+InfluxDB 打造现代监控系统
  6. Android Studio属性动画,Android开发-RecyclerView-AndroidStudio(六)属性动画(3)AddDuration
  7. python爬取京东商品属性_python爬虫小项目:爬取京东商品信息
  8. onestage方法_FCOS : 找到诀窍了,anchor-free的one-stage目标检测算法也可以很准 | ICCV 2019...
  9. 标题栏透明android,android改变标题栏的透明度
  10. angular监听输入框值的变化_angular 实时监听input框value值的变化触发函数方法