晓查 发自 望京
量子位 报道 | 公众号 QbitAI

11月,英特尔将在全球各地举办FPGA技术日,北京是第一站。在第一站的活动中,英特尔发布了全球最大容量的全新FPGA:Stratix 10 GX 10M FPGA。

这款FPGA包含1020万个逻辑单元,430亿个晶体管,并且采用了英特尔的EMIB封装技术,将多个晶片封装在一起。

该产品是全球密度最高的FPGA,现已量产。多家客户已经收到全新的英特尔Stratix 10 GX 10M FPGA样片。

Stratix 10 FPGA在5G网络、人工智能、ASIC验证上都有广泛地应用,未来几周内将会有合作伙伴公布与英特尔的合作计划。

现在,已有微软Bing、Azure云以及英国软件公司VMWare与英特尔在FPGA加速方案上展开合作。

密度最高FPGA

英特尔Stratix 10 FPGA是全球密度最高的FPGA,拥有1020 万个逻辑单元,其密度是英特尔之前密度最高FPGA设备的的3.7倍,后者为原英特尔 Stratix 10 系列中元件密度最高的设备。

因为自有的EMIB技术让英特尔得以设计、制造并交付目前世界上密度最高、计算能力最强的 FPGA。

使用EMIB技术将I/O和内存单元连接到 FPGA 构造晶片,从而实现了英特尔 Stratix 10 FPGA 家族的规模和种类不断扩张。

这些技术让英特尔能够通过整合不同的半导体晶片,包括 FPGA、ASIC、eASIC、3D堆叠内存单元和光子器件等,用于将几乎任何类型的设备整合到封装系统 (SiP) 中,以满足特定的客户需求。

英特Stratix 10 FPGA设备集成了8GB或16GB的3D堆叠HBM2存储单元,具备 PCIe 4.0兼容能力。

之后,英特尔还发布了为数据中心打造的Agilex FPGA,这是一个全新的产品,这款产品是基于英特尔最新的10nm技术。

在性能上相比前代产品有巨大的提升,在性能上提升了40%,功耗降低了40%,算力达40TFLOPS,并且支持下一代内存技术DDR5和傲腾内存,以PCIe Gen 5与英特尔CPU进行通讯,数据传输速率达112G。

英特尔表示,Stratix 10 FPGA和Agilex FPGA与英特尔原来的硬件技术也有紧密的结合。

至强处理器+FPGA,提供了面向特定工作负载的软件堆叠优化。

英特的傲腾技术,为FPGA提供一个内存层,从而支持更高容量、更低延迟的方案。

在传输方面,Stratix 10可以实现数据的快速移动,支持100G以太网传输。

这些FPGA技术为AI系统提供了优化,在加速语音识别、视频处理方面优于其他传统解决方案。

使用英特尔FPGA PAC D5005产品进行语音处理,功耗比GPU产品低6倍,延迟比GPU低29倍,而吞吐量高48倍。此外英特尔还提供Arria 10 GX FPGA为视频分析提供加速。

补上oneAPI的FPGA拼图

前不久,英特尔在北京的一场技术分享会上公布了一些“oneAPI”的技术细节。

顾名思义,“oneAPI”的目的就是提供统一的编程模型,简化在不同硬件架构上的AI程序开发工作,让开发者用一套源代码创建适用于不同硬件的AI应用程序。

早在去年12月,英特尔就推出了“oneAPI”,并将于今年11月下旬发布开发者测试版本。

目前在人工智能计算上主要有CPU、GPU、AI加速器和FPGA,分别用于标量、矢量、矩阵和空间运算。

开发者需要为不同工作负载选择合适的硬件架构,不同架构的硬件之间缺少通用语言和API,造成每个平台的AI开发者都需要提供额外的软件资源。

英特尔基于行业标准和开放式规范,提出了oneAPI,让开发者可以在不同架构上获得统一的软件开发体验。

英特尔在这四种芯片上均有涉足,今天随着Stratix FPGA和Agilex FPGA的推出,英特尔顺势公布了基于FPGA的OneAPI。

基于行业标准和开放式规范,开发者可以在不同架构上获得统一的软件开发体验。

考虑到不同平台语言的不统一,英特尔还为oneAPI加入了一个配套的直接编程语言数据并行C++ (DPC++),它基于C++,通过社区项目提供语言增强功能。

针对FPGA,英特尔还在oneAPI中提供Vtune分析器,它能在运行时收集数据,帮助用户分析CPU和FPGA数据交互效能。

现在已有GPU、AI加速器等专门用于AI的芯片架构,为何要在FPGA开发AI?

英特尔表示,FPGA空间架构提供了数据和任务的并行性,帮助用户显著提升性能。FPGA的优势在于低延迟,直接将数据读取和写入在具有内存属性的片上内存结构里。

问卷福利!人工智能行业白皮书即将发布

量子位&IDC中国将联合发布「2019中国人工智能行业白皮书」,并于12月6日MEET大会重磅发布,特请小伙伴们填写一下问卷,谢谢大家支持~

填写福利:发布后第一时间获得白皮书,AI内参、大会观众票3折优惠券。 点击下图即可填写问卷、领取问卷福利:

榜单征集!三大奖项,锁定AI Top玩家

2019中国人工智能年度评选启幕,将评选领航企业、商业突破人物、最具创新力产品3大奖项,并于MEET 2020大会揭榜,欢迎优秀的AI公司扫码报名!

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

430亿晶体管,1020万逻辑单元,英特尔发布全球最大容量FPGA,用全新硬件加速AI开发...相关推荐

  1. 30亿参数,华为云发布全球最大预训练模型,开启工业化AI开发新模式

    本文分享自华为云社区<HDC.Cloud 2021 | 华为云发布全球最大预训练模型,开启工业化AI开发新模式>,原文作者:技术火炬手 . 4月25日,华为云发布盘古系列超大规模预训练模型 ...

  2. 阅面携手英特尔发布“繁星”系列产品,推动机器视觉迈入AI芯片新纪元

    让机器视觉技术以更低门槛普及,是不少AI公司的核心愿景. 阅面科技,正是这样愿景下创立的关键玩家.现在,阅面交出初步成绩单. 11月1日,阅面科技携手英特尔重磅发布"繁星"系列产品 ...

  3. 效率达CPU一万倍、内含800万神经元:英特尔发布神经形态芯片超算

    效率达CPU一万倍.内含800万神经元:英特尔发布神经形态芯片超算 人类大脑由 860 亿个互相连接的神经元组成,英特尔最近推出的类脑芯片系统 Pohoiki Beach 向「模拟大脑」这一目标前进了 ...

  4. 晶体封装越小esr越大_SuperFin晶体管技术加持!英特尔新一代10nm可媲美台积电5nm?...

    △英特尔高级副总裁.首席架构师,兼架构.图形和软件部门总经理Raja Koduri 当地时间8月13日,英特尔在2020年架构日活动上,正式公布了全新的SuperFin晶体管技术."混合结合 ...

  5. 英伟达发布全球唯一千万亿级集成型 AI 工作组服务器

    IT之家 11 月 17 日消息 今天,英伟达发布全球唯一的千万亿级工作组服务器 NVIDIA DGX Station A100,配备四个 NVIDIA A100 GPU,具有高达 320GB 的 G ...

  6. 英特尔推出世界最大 FPGA 芯片;任正非表示华为尚未直接和美国公司商谈5G技术授权;OpenTitan开源……...

    戳蓝字"CSDN云计算"关注我们哦!  嗨,大家好,重磅君带来的[云重磅]特别栏目,如期而至,每周五第一时间为大家带来重磅新闻.把握技术风向标,了解行业应用与实践,就交给我重磅君吧 ...

  7. 专访英特尔AIPG全球研究负责人Casimir Wierzynski:物理学、隐私和大脑将根本性塑造AI

    出品| AI 科技大本营 在 11 月 14 日至 15 日在北京召开的英特尔人工智能大会(AIDC)上,英特尔人工智能产品事业部(AIPG)全球研究负责人 Casimir Wierzynski 发表 ...

  8. 英特尔发布年度企业社会责任报告,首次定义“全球性挑战”

    2020年5月14日,英特尔发布了年度企业社会责任报告. 基于英特尔数十年来在企业社会责任方面充分的透明度,该报告详细介绍了英特尔过去十年在减少温室气体排放.为当地社区恢复数十亿加仑水资源.实现全球员 ...

  9. 英特尔 超核芯显卡 620mac_显卡性能翻倍,AI能力加持:英特尔发布10代酷睿处理器...

    机器之心报道 作者:张倩.杜伟 代号 Ice Lake 的十代酷睿是英特尔第一批大规模采用 10nm 工艺的处理器,同时拥有全新设计的 Sunny Cove CPU 架构.11 代 GPU 核芯显卡架 ...

最新文章

  1. python内置的读取文件函数_Python函数篇(3)-内置函数、文件处理(已更新)
  2. 如何将 kitten编程猫里的以分号分隔的长字符串转换成列表结构
  3. HDU 3488 KM
  4. 电商网站(Django框架)—— 大纲内容与基本功能分析
  5. 【Mac Buf Install Solution】Mac Buf Not Provide support for this old version Solution
  6. Springboot2拦截器与文件上传
  7. Android使用惠普打印机,USB直连静默打印
  8. buildroot patch 补丁文件使用方法
  9. php图片64位处理,php实现图片以base64显示的方法
  10. 拉格朗日对偶问题一定是凸优化问题的证明
  11. 腾讯云服务器架设mir2
  12. 固态硬盘误格式化恢复图文教程
  13. 编写一个主函数和子函数char *tran(int x, int r), 要求是:函数tran将十进制整数x转换成r进制数y(r在2~16之间), x和r的值由主调函数(即主函数)传入,y的值需要返
  14. 公司文案编辑常用迅捷PDF转换成Word转换器
  15. 设计模式常用的七大原则总结
  16. 基于“机器学习”的智能聊天机器人---python实现(1)
  17. 倍福PLC和C#通过ADS通信传输bool类型变量
  18. terminate called without an active exception
  19. 项目式51单片机c语言题库,《单片机C语言项目式教程》选择题含答案.doc
  20. 嵌入式系统的体系结构 图解

热门文章

  1. MySQL的JOIN(一):用法
  2. Windows Server 2016 部署Hyper-V
  3. ASP.NET 2.0中如何连接到Mysql(转)
  4. 手工测试对比自动化测试
  5. 消费者关注的 Win8 问题汇总(下)
  6. PHP 之 函数 sprintf() 的学习
  7. Jenkins中运行脚本提示“Permission denied”,没有权限解决方法(MacOS)
  8. ec20 复位命令_《EC20 — AT指令》
  9. Java学习_day009(oop):引用类型数组、继承的意义
  10. iOS 11开发教程(八)定制iOS11应用程序图标