作者 | 宋慧

出品 | CSDN 云计算&AI 科技大本营

AI 人工智能毋庸置疑是目前最火的 IT 技术领域之一,而主攻图形计算的 NVIDIA GPU(图形处理器)又是现今 AI 领域的当红炸子鸡。不过 AI 芯片领域又迎来了新的挑战者,2016 年创立于英国的 Graphcore 设计并推出了 AI 专用芯片 IPU,在短短几年时间即完成 E 轮 2.22 亿美元融资,并在开拓全球多个市场。

在刚刚过去的 2021 年,Graphcore 在继续加速增长,一年时间内员工就从 400 人增至 700 人,几乎翻倍,而中国团队则从 20 人增至 80 人。2022 年初,CSDN 访问了 Graphcore 大中华区总裁兼全球首席营收官卢涛,对于 Graphcore IPU 的核心架构的设计思路,以及 AI 领域前沿的应用案例,他分享了最新的进展与见解。

IPU vs GPU:解耦后,更快更灵活

提到 AI 底层芯片,业界首先关注的,就是芯片性能与跑分的数据。Graphcore 全系列的芯片在 2021 年 11 月参加了 MLCommons 的 AI 基准评测 MLPerf 1.1 的训练模型评测,其中 IPU-POD16 在 ResNet 模型测试中,性能超过了 NVIDIA 旗舰的 DGX A100 80G  GPU 系统,另外,Graphcore IPU-POD64 也拿下了单一主机服务器下自然语言训练模型 BERT 最快的系统称号。

在 MLPerf 1.1 基准测试中,除了对 ResNet、BERT 等模型的支持,Graphcore 也在探索更多新的计算机视觉模型,如 EfficientNet,还有 2021 年下半年热门的基于 Transformer 的视觉模型 ViT,以及更大的主流 GPT 模型等。

卢涛对 CSDN 分享了,Graphcore IPU 的架构设计中,与 GPU 设计的三大核心差异点。第一,Graphcore IPU 的计算核心有多达 1400 多个处理器内核,每个内核可运行 6 个线程。第二,与 GPU 的存储架构不同的是,IPU 采用处理器片内分布式存储架构,如 Graphcore GC200 拥有 900MB 处理器内存储,而 GPU 采用显存或高宽带显存 HBM,是片外的大型存储。最后,在跨芯片多核通信调度设计上,GPU 是以多核多线程呈现,开发者需要处理不同线程之间的通信与数据同步问题,而 Graphcore IPU 设计了 BSP(Bulk Synchronous Parallel)的软硬件结合算法,让芯片内 1000 多个内核,以及多芯片可以跨 IPU 连接。

与 GPU、CPU 等芯片对比,Graphcore IPU 另一个重要的设计思想,是实现 CPU 与 AI 处理引擎的解耦,依据 AI 的不同场景,灵活和优化配置 CPU 与 IPU 的比例。为此,Graphcore 设计了一系列的系统级优化,例如对于谷歌的 BERT 模型,通常 NVIDIA 或 Intel 都是固定比例的架构,如 CPU 与 GPU 的 1:4 数量比,或 Intel 的 CPU 与 AI 加速引擎的 1:2 数量比。而 CPU 与 Graphcore 的 IPU 可以是 1:32,而基于计算机视觉,比例则又可以是 1:8。

解耦之后更加灵活的底层芯片性能,让 Graphcore 敢于设计并探索更多 AI 的前端场景。2021 年,Graphcore 在已有的、可用于初建或较小的机器学习的 IPU-POD16、IPU-POD64 之后,重磅推出了 IPU-POD128、IPU-POD256 两个可以应用于超大规模、云化的大型超算 AI 集群或计算系统的新品。现在,IPU-POD128、IPU-POD256 两个平台已下柜销售,用户可以直接商用部署。

除了硬件之外,Graphcore 也在软件层面持续丰富和完善自身的技术与软件生态。在 Graphcore 的 Poplar SDK 中,在硬件相关的驱动、协议栈,和机器学习框架 XLA、图编译器、PopART 等之外,2021年 Graphcore Poplar SDK 增加了对 PyTorch Lightning、百度飞桨、Hugging Face 的支持,其中百度飞桨在 Graphcore IPU 上已经实现训练与推理的全面支持。此外,对开发工具、硬件管理与 IPU 虚拟化的支持也在增强。

商用市场为核心,拥抱开放的生态

底层芯片之上,丰富的生态一直是芯片厂商重要的目标。在 AI 生态方面,Graphcore 已经与 PyTorch Lightning、百度飞桨、阿里云 HALO、Jupyter Notebook、Hugging Face、Weights & Biases、Spell、Gradient 等成为合作伙伴。

在基础设施层,2021 年 VMware 的 Project Radium 宣布将支持 Graphcore IPU 以作为其硬件分解倡议的一部分,云原生的 Docker、Kubernetes 均支持 IPU,这也可以看出人工智能在关注机器学习框架和模型之后,开始更细致地去改进底层资源的部署与调度,以及任务分配。

服务器 OEM 合作伙伴方面,在戴尔和浪潮之后,Graphcore 在 2021 年新增了 Atos、NEC、Supermicro、2CRSi 4 个服务器合作伙伴。存储方面,2021 年 Graphcore 和国际主流的商用存储设备,如 DDN、Pure Storage、Vast Data、WekaIO 均达成了合作。

卢涛表示,目前,对稳固和性能要求更高的商用市场,是 Graphcore 的核心目标,此外,Graphcore 将最大程度的拥抱开放的生态,并用技术为中国市场服务,实现科技惠民。

Graphcore IPU 的主场,从前沿科学到民生应用

除了产品与生态的建设,卢涛也分享了 Graphcore 在 2021 年最新的案例与应用,遍及前沿科学研究和惠及民生的应用领域。例如 Graphcore 与安捷数科合作,利用 IPU 进行气象预测、精准灌溉、防灾减灾等;与巴黎大学在宇宙学应用方面合作;与深势科技合作完成分子动力学模拟软件 DeePMD-kit 向 IPU 硬件的迁移,探索基于分子动力学模拟的科学计算、药物设计、材料设计和新型能源等场景。

在金融保险方面,牛津-英仕曼使用 Graphcore IPU 进行股价预测;Tractable 利用 IPU 进行 AI 保险理赔方面的辅助工作。在电信领域,Graphcore 与韩国电信合作发布了 IPU 云。关于城市环境可持续发展,Graphcore 和升哲科技基于 IPU 进行城市相关可持续发展应用。在医疗、生命科学领域,Graphcore 和斯坦福大学医学院合作,使用 IPU以“医疗+隐私计算”为核心方向进行了相关的研究和探索。

卢涛透露,2022 年,除了新的硬件产品发布计划之外,Graphcore 将与国内公有云厂商合作发布 IPU 产品。AI 应用领域的研究也将会进一步加深,例如 AI 辅助科研、自动驾驶等。

卢涛和 Graphcore 深知,Graphcore 一直被冠以 AI 芯片领域的新入局者,不过,在 2022 年和更远的未来,Graphcore 希望转变这一认知,在性能、创新、TCO、软件易用性多个维度建立市场领导力。

从挑战者到领导者,Graphcore 还有哪些转变,我们拭目以待。

GPU还是IPU?IPU 芯片厂商 Graphcore 的 2021相关推荐

  1. 飞桨 x Graphcore IPU适配方案深度解读与硬件介绍 | 洞见AI硬件

    Graphcore和飞桨联合发布了在Graphcore IPU上支持训练和推理完整流程的开源代码库.在本篇文章中,我们将会介绍飞桨与Graphcore的合作初衷和成果,并为大家解读飞桨与Graphco ...

  2. dts文件分析---以ov5640为例,修改dts文件使ov5640使用第二个IPU

    在ARMlinux中,每一个.dts文件都对应一个ARM的machine,这些文件都放在arch/arm/boot/dts文件夹中.同时,对于每一个SoC可能对应多个machine,这些dts文件中会 ...

  3. 2021-2027全球与中国GPU服务器市场现状及未来发展趋势

    本报告研究全球与中国市场GPU服务器的产能.产量.销量.销售额.价格及未来趋势.重点分析全球与中国市场的主要厂商产品特点.产品规格.价格.销量.销售收入及全球和中国市场主要生产商的市场份额.历史数据为 ...

  4. Imagination官方信息速递2021年12月期

    Imagination在线课程上新! 深入解读业界首个移动端光线追踪GPU架构 PowerVR Photon 架构有哪些全新性能?与软件级光线追踪相比,硬件级的光线追踪优势在哪儿?被称为业界首个移动端 ...

  5. 基辛格带领英特尔发起大反攻,以开源生态驱动异构计算

    在被英特尔 CEO 帕特·基辛格定位为转折之年的 2021 年里,英特尔以超高频率发布多个重磅举措.在近日举办的英特尔 On 技术创新峰会(Intel Innovation)期间,英特尔宣布重新拥抱广 ...

  6. Intel拟进军7nm,对标台积电5nm!

    Intel今天举行了两年来的第一次投资者会议,新任CEO司睿博亲自上阵,向投资者们披露了大量未来产品和技术规划. 首先是工艺方面,Intel承认在10nm工艺上冒险太大,设置了过高的技术指标,导致一再 ...

  7. 让电脑加速100倍!这家英国创业团队的芯片新思路

    图1:英国人工智能芯片硬件设计初创公司Graphcore推出的IPU加速卡 编译:网易智能 参与:小小 选自:Bloomberg 作者:DylanJackson  与其他数字处理软件不同的是,英国人工 ...

  8. 嵌入式监控【v4l2采集->vpu编码->live555推流】

    嵌入式监控[v4l2采集->vpu编码->live555推流] 文章目录 嵌入式监控[v4l2采集->vpu编码->live555推流] 介绍 数据流图 一.v4l2 1.1 ...

  9. 嵌入式监控【v4l2采集-vpu编码-live555推流】

    嵌入式监控[v4l2采集->vpu编码->live555推流] 文章目录 嵌入式监控[v4l2采集->vpu编码->live555推流] 介绍 数据流图 一.v4l2 1.1 ...

最新文章

  1. python【蓝桥杯vip练习题库】BASIC-26报时助手
  2. python使用说明书-InfluxDB——python使用手册
  3. LeetCode题组:第14题-最长公共前缀
  4. 使用airdrop进行文件共享
  5. 简述计算机文件的命名办法,如何进行文件命名-如何进行文件管理
  6. java基础IO流使用读取一个文件中的文字输出到控制台上
  7. HDOJ2000(ASC||码排序)【sort函数】
  8. python中什么是序列_在Python中,什么是字符串序列?(或者是油嘴滑舌的虫子?)...
  9. libpcap 中的 struct block
  10. 毕设题目:Matlab语音识别
  11. JavaScript的单线程性质以及定时器的工作原理
  12. matlab遗传算法 系统辨识,基于遗传算法的控制系统的系统辨识
  13. html在线排版编辑工具,html+css+js开发文本编辑器,有各种排版功能!
  14. iOS开发中有关图片裁切的问题
  15. 项目一 认识Linux操作系统
  16. 2022-2027年中国分散染料行业市场全景评估及发展战略规划报告
  17. Redis存储购物车
  18. uA741运算放大器电路基本原理
  19. 多语言软件开发之new CultureInfo(“”)与CultureInfoCreateSpecificCulture(“”)的异同
  20. 如何用利特尔法则调整线程池大小

热门文章

  1. 20201104CSP提高组训练
  2. DR007利率报价查询_图表加数据DR007存款类机构质押式回购利率
  3. 如果客户机同时得到多台dhcp服务器的ip地址_秘技,同时为三个女神装系统的方法...
  4. 国外知名地球物理研究小组
  5. 媲美软件安装管家的网站
  6. typescript 中的as
  7. 产品总监晋升之路(1):选育育留之产品经理胜任力模型
  8. MFC界面开发工具BCG v31.1 - 增强功能区、工具箱功能
  9. LCG(linear congruential generator)伪随机数生成器
  10. 【训练题27:单调队列实现RMQ(附带详细说明)】 H :圣诞糖果 | 吉首大学第十届“新星杯”