在之前发布的ZStack 3.5.0版本中,ZStack新增了对于NVIDIA及AMD vGPU方案的支持,从而在云中实现支持GPU透传、vGPU两种GPU方案的完善GPU云平台解决方案,能够帮助用户在云中实现工业设计、图形渲染、教学科研、深度学习等更为丰富的GPU应用场景。

前言

随着虚拟化与云计算技术的快速发展,越来越多的用户将应用迁移到云上。在这个过程中,用户希望一些特定的业务场景既能够在云环境中获得灵活、高效的资源交付能力,又能够获取与物理机无异的资源计算性能。GPU作为一种资源设备,近几年来随着大数据、人工智能等深度学习相关应用的深入,这一技术在云中的应用需求日益加深。

本文旨在以通俗易懂的方式让各位读者对于云中的GPU方案有一定的概况性了解。

一、了解GPU

在了解GPU之前,我们需要先了解GPU与我们最熟悉且常用的CPU区别:虽然两者都为了完成计算任务而设计,但各有侧重。

CPU 由专为串行顺序执行指令而设计的几个核心组成,主要是面向通用计算场景;

如:8个计算核心,每个计算核心计算力都相对较强

 GPU 则是拥有一个由数以千计的更小核心组成的大规模并行计算架构。更侧重用于面向并行计算场景;

如:1000个计算核心,单个计算核心计算力相对一般,

综合计算力强大

举一个比较容易理解的例子:

CPU可以比作一个数学教授,当解答一道或几道高难度数学问题时,效率更高;

GPU可以比作100个中学生,当解答数百上千低难度数学问题时,效率更高。

因此在实际应用场景中,GPU非常适合用于需要大量简单、重复、并行、矩阵等计算能力的场景。下面通过以下两个典型的GPU应用场景来进行需求说明。

二、GPU应用场景

1. 重GPU计算力需求场景

某市交管部门构建城市大数据智能交通调度系统以缓解绕城高速交通拥堵情况,建设规划将系统构建在云环境中,以解决部署在物理机环境中所存在的安装周期长、运维效率低下等问题,因此,如何将物理GPU设备交付给部署在云环境中人工智能应用以使用是项目的关键技术需求。

2. 轻GPU计算力需求场景

某制造型企业期望为工业设计人员部署云桌面以保护企业数据安全,还要简化桌面运维管理。但这需要依赖GPU的图形计算力以实现在云环境中运行工业设计软件这一需求。

在以上场景中,分别通过GPU透传及vGPU技术在云中交付GPU资源是满足用户需求的主要技术手段。

下面我们来进一步介绍以上两种云中GPU实现方案。

三.GPU云化方案

1. GPU透传

GPU透传主要技术原理是通过将宿主机(物理机)上GPU设备的PCI内存地址映射给云主机,从而能够绕过云环境中的虚拟化管理程序,将GPU设备直接加载给云主机进行使用。

透传后对比在物理机上使用GPU设备的优缺点如下:

  • 优点:性能损耗<5%、功能兼容性好(如2D/3D/图形渲染/CUDA等功能)、技术实现简单(对GPU厂商无依赖)、运维成本低;

  • 缺点:无法将GPU设备与其他云主机共享、已挂载GPU的云主机不支持热迁移;

  • 场景:深度学习、人工智能、高性能计算等;

2. vGPU(GPU虚拟化)

在vGPU实现方案上,由于目前市场上GPU厂商分为NVIDIA、AMD,因此在对接不同品牌GPU设备时所采用的vGPU技术方案也不一样。

3. AMD vGPU方案

首先我们来看一下AMD vGPU的方案,其设计遵循了SRIOV规范,这个规范定义了以标准化的方式支持实现多个云主机共享一个PCI设备:可理解为一个PCI设备在物理层面上被切分为多个,并且每个都是符合PCI标准的PCI设备。而由于这个能力,切分后的每个单元都可以再通过PCI透传的方式分别提供给多个云主机使用。GPU作为一种典型PCI设备,自然也支持以上技术的实现,AMD vGPU方案就是如此。

在了解完原理之后,我们来看一下这种GPU虚拟化方案的优缺点:

  • 优点:与GPU透传方案相比,性能损耗极小;功能兼容性好(如2D/3D/图形渲染/OpenCL等功能)、支持加载vGPU设备的云主机热迁移(技术上支持,云厂商各自实现情况不同);

  • 缺点:硬件设计相对复杂同时硬件更新周期长、云平台无法有效获取设备监控信息;

  • 场景:在虚拟桌面中运行工业设计、图形渲染,或人工智能教学科研环境中;

4. NIVDIA  vGPU方案

区别于AMD vGPU所使用SR-IOV方案,Mediated Passthrough(分片透传)是NIVDIA vGPU方案所使用的关键技术。Mediated Passthrough是一种完全软件定义的GPU虚拟化解决方案,其技术原理主要为:对于与GPU性能相关的访问直接透传给云主机,把与性能无关功能的相关访问在Mdev模块中来模拟实现。Mdev是此方案的关键技术,简单解释一下,Mdev即mediated 设备框架,能够驱动VFIO框架及接口支持虚拟PCI设备,因此也就能够完全基于软件实现,将宿主机上的物理GPU切分成为多个虚拟GPU设备并进行共享。

同样,我们也来看一下此方案的优缺点:

  • 优点:与GPU透传方案相比性能损耗极小;软件定义更灵活(如更新迭代速度更快不受限于硬件);云平台可以获取到vGPU设备监控信息;支持加载vGPU设备的云主机热迁移(技术上支持,云厂商各自实现情况不同);

  • 缺点:依赖于GPU硬件厂商开发Mdev驱动;功能上由于是Mdev模拟,所以有所取舍。

总结

1.   区别于CPU面向通用计算场景,GPU侧重于简单、重复性、并行、矩阵等计算场景,如图形渲染、视频编解码、并行计算场景;

2.   在云中使用GPU设备主要有两种技术实现方案,GPU透传与vGPU(GPU虚拟化);

3.   GPU透传方案将GPU设备透传给云主机使用,云主机独占该GPU资源,性能好、功能兼容强,适合深度学习、人工智能、高性能计算等重负载场景;

4.   vGPU是一种GPU虚拟化方案,GPU资源能够被切分后分配给多个云主机共享使用。vGPU方案中NIVDIA/AMD技术实现方式有所不同,NIVDIA是软件虚拟化方案、AMD是硬件虚拟化方案,两种方案性能相当;vGPU典型场景适合应用于虚拟桌面中运行工业设计、图形渲染或人工智能教学科研等轻负载场景;

5.   ZStack 3.5.0版本开始对以上GPU方案均支持;

视频演示如下

- END -

欢迎关注ZStack中国社区QQ群、ZStack官方微信!

相关阅读

产品上新|ZStack3.5.0正式发布啦!

【ZStack学堂】第二季第7期:ZStack产品3.5.0发布功能讲解 (高清视频回放)

ZStack实践汇 | ZStack部署实战之VDI异构部署

玩转混合云+边缘计算,且看ZStack Mini!

ZStack CMP多云管理平台有何不同?

新品Demo —— ZStack Mini 超融合一体机

新品Demo —— ZStack CMP多云管理平台

从云端到边缘 ZStack产品化版图基本完整

- 点击"阅读原文"进入ZStack最新版本 -

ZStack GPU解决方案相关推荐

  1. 分子模拟软件amber_容天AMBER优化的GPU解决方案

    AMBER认证的GPU系统 AMBER认证GPU系统提供商容天更快地运行MD仿真 容天与AMBER的主要开发商合作开发了交钥匙解决方案,为GPU加速的生物分子模拟提供增值系统. 经过验证的系统,每个用 ...

  2. 跑深度模型的显卡_2020年人工智能深度学习 GPU 解决方案推荐

    纵观人类几百年来的科技发展史,几乎所有的新兴学科的发展背后都有两个字--"烧钱"! 作为近年来最火热的行业--人工智能,在烧钱方面同样不遑多让.众所周知,人工智能的训练和推理都需要 ...

  3. 高性能计算GPU解决方案系列教程二--高性能计算集群性能指标

    本节课的内容对于很多不了解硬件指标的用户非常重要,超算用户是如何来评定自己集群的各方面能力呢?我们一起走进今天的课堂. 2 高性能计算集群性能指标 2.1 衡量高性能计算集群的评价指标 2.1.1.  ...

  4. 高性能计算GPU解决方案系列教程三--高性能计算集群测试程序

    世界上三大大学生超算比赛中,高性能计算机的性能测评必不可少,下面我们就来介绍下几大类测试程序.3.     测试程序 3.1.    Linpack 目前,HPL(Linpack)有CPU版,GPU版 ...

  5. 智慧渲染,通用为“先”---- 象帝先推动 “通用、好用、高性能、自主可控” GPU解决方案

    市场需要通用GPU GPU是计算机系统的必需组件,而且随着应用场景的多样化,GPU已经成为智算时代最为重要的生产力组件.一颗标准的GPU不仅能满足日常的桌面显示.图形渲染功能,而且可以提供AI智算的加 ...

  6. 软件工具将GPU代码迁移到fpga以用于AI应用

    软件工具将GPU代码迁移到fpga以用于AI应用 Software tools migrate GPU code to FPGAs for AI applications 人工智能软件初创公司Mips ...

  7. 摩尔线程推出首款数据中心级全栈功能GPU:MTT S2000

    2022年3月30日,北京--摩尔线程正式推出首款基于其先进架构MUSA统一系统架构(Moore Threads Unified System Architecture)打造的数据中心级多功能GPU产 ...

  8. 详解英伟达三大专业视觉解决方案,覆盖数据中心和边缘计算

    智东西(公众号:zhidxcom)文| 李水青 导语:英伟达RTX服务器.数据中心工作站和虚拟GPU三大解决方案,通过AI与专业可视化技术的结合,带来专业视觉领域效率的提升. 智东西7月17日消息,今 ...

  9. docker gpu报错Error response from daemon: could not select device driver ““ with capabilities: [[gpu]]

    Docker容器中使用Nvidia GPU报错 docker: Error response from daemon: could not select device driver "&qu ...

  10. 今晚7点,NVIDIA专家深度解析全新推荐系统解决方案Merlin

    腾讯广告算法大赛致力于通过赛事促进产研融合,助力选手探索算法技术的应用前景.为了让选手进一步打开视野,站在行业技术最前沿,腾讯广告算法大赛官方正式开启"技"高一筹专题直播,持续为选 ...

最新文章

  1. 98.512X4位的芯片,要怎么组成4K的存储空间要用多少个芯片级联?具体用多少引脚?
  2. 将String转化为Long,并将Long转化为Date
  3. java aop 实例_Spring aop 简单示例
  4. 学画画软件app推荐_路由器管理软件哪个好?6款路由器管理APP推荐_软件评测
  5. 力扣24,两两交换链表中的节点(javascript)
  6. SFML 与 VS2015 的安装配置
  7. Windows下配置OpenSSL(傻瓜式教程,一看就会)
  8. ubuntu PIL出错 重新安装
  9. 安装Linux镜像文件,通过iso镜像文件硬盘安装Liunx (转载)
  10. Redis底层数据结构-SDS
  11. Photoshop cs5 永久序列号
  12. hx1838 红外遥控(1):接收时序的解码
  13. 试用期、加班时间、加班补偿——职场常见知识《劳动法》
  14. Android 后台服务(Service)
  15. 串口通信学习(GPS模块)2021.5.10
  16. 陈剑高分指南2019_完整的ECMAScript 2015-2019指南
  17. 3. ackerman函数的递归实现算法用java语言_ackerman函数递归算法
  18. 基于粒子(Points)模拟雨雪天气效果
  19. Gerrit历史记录查询
  20. 电子血压计并非人人适用

热门文章

  1. 第2.01节 发布版本vs源码编译
  2. [转]c++中RTTI的观念和使用
  3. Educational Codeforces Round 61
  4. VS2010 MVC的 安装
  5. jstat 监控调整GC很好用
  6. 通过UDP广播实现Android局域网Peer Discovering
  7. 如何使用MOQ进行单元测试
  8. [CSS揭秘]不规则投影
  9. 去哪儿网2017校招在线笔试(前端工程师)编程题及JavaScript代码
  10. 二叉搜索树的两种实现(数组模拟,STL)