随着大数据、人工智能技术的发展,越来越多的用户产生了获取拥有GPU算力的弹性计算服务的需求,GPU云主机具有突出的图形处理和高性能计算能力,适用于科学计算、视频处理、深度学习等应用场景,受到了市场的青睐。

本期智汇华云,特别邀请到华云数据OpenStack开发工程师傅成超为大家带来“OpenStack 虚拟机 GPU 性能优化”。

首先为大家简单介绍一下 NUMA 的概念。NUMA 是一种解决多 CPU 工作的技术方案,在此之前,市面上主要采用 SMP 和 MPP 两种架构。

SMP 技术

计算机技术发展初期,服务器都是单 CPU 结构,随着技术的不断发展,多 CPU 结构开始流行起来,为了满足多 CPU 共同工作的需求,SMP 技术应运而生。

如图所示,多个 CPU 通过一个总线访问存储器,因此无论在什么时候,处理器只能为内存的每个数据保持或共享唯一一个数值。

SMP 的缺点是十分明显的,即扩展性有限,因此在存储接口达到饱和的时候,增加处理器的数量并不能获得更高的性能,因此 SMP 架构支持的 CPU 数量十分有限。

MPP 技术

MPP 则是一种分布式存储器模式,它能将更多的处理器纳入一个系统的存储器。一个分布式存储器具有多个节点,每个节点都有自己的存储器,单个节点相互连接形成了一个总系统。MPP 可以近似理解为一个 SMP 的横向扩展集群。

NUMA 技术

NUMA 是目前最常用的技术,在 NUMA体系中每个处理器都有自己的存储器,同时,每个处理器也可以访问其他处理器的存储器。

下图为多核 NUMA CPU 架构

如上文所说,每个处理器既可以访问自己的存储器,也可以访问其他处理器的存储器,事实上,前者的速度要比后者最高快到100倍之多。在 Linux 中,系统默认采用自动 NUMA 平衡策略,所以 NUMA 调优的目的就是让处理器尽可能地访问自己的存储器,以提高计算速度。

在 OpenStack 中,可以采用 virsh numatune 命令查看和修改虚拟机的 NUMA 配置,反映在 XML 文件上的便是和 < numatune > 中的 id 保持一致。

那么在 GPU 云主机中,是否可以采用相同的思路进行性能调优呢?答案自然是肯定的。

在进行 GPU 性能优化前,我们还需要进一步了解一下 render-nodes 的概念。

render-nodes 是一种用于访问具有 DRI 能力的 GPU 非特权功能的 DRM 接口,在 Linux 内核中,DRM 驱动程序通过 render-node 接口公开其用户空间 API 的非特权部分,并作为一个单独的设备文件 (/dev/dri/renderDXX) 存在。信息技术变革日新月异,如今,客户端已不再需要运行合成器或图形服务器来使用 GPU ,通过 render-node 即可实现对 GPU 资源的访问。

将 render-node 和所在的 NUMA 绑定,可以有效防止跨片 PCIE 访问带来的性能损耗。

通过 lspci –vvvs bus_id 命令便可查看 GPU 所在的 NUMA 节点,即 /dev/dri/renderDXX 与 NUMA 的对应关系。以我本机为例,renderD128 对应 NUMA 0,renderD129 对应 NUMA 1,此时我们便可以使用 numactl 进行绑定。

然而在一个 OpenStack 云环境中可能会运行着成百上千的云主机,云主机创建完成后逐一进行手动绑定明显不是一个现实的方案,此时可以通过修改 /nova/virt/libvirt/driver.py中的相关逻辑。当程序获取到 vcpu 被分配的 NUMA 节点后,通过设备之间的映射关系,在添加 GPU 设备阶段为其绑定对应的 render-node。这样虚拟机在创建之初便拥有了卓越的性能,无需后期进行人工绑定。

结束语

本文从 NUMA 出发,为大家简单介绍了多 CPU 的常用技术架构,并以此为延伸,分享了 GPU 虚拟机的性能调优方案。目前,华云数据公有云产品线中已经包含具有超强计算能力的 GPU 型云主机,在新基建的风口,推动中国企业全面上云,助力客户实现数字化转型。

openstack云主机无法绑定ip_智汇华云|OpenStack 虚拟机 GPU 性能优化相关推荐

  1. 智汇华云 | ArSDN之分布式路由及浮动IP简介

    随着互联网.云计算.网络存储.物联网为代表的新应用.新运营模式的兴起,不仅带来流量的快速增长,更使得用户在建设多业务IP网络的同时,面临更加复杂的运维挑战以及对业务进行快速导入与部署的要求.本期智汇华 ...

  2. 智汇华云|安超云套件Archer Cloudsuite为“信创强国”筑基

    华云数据作为信创云计算专家,为帮助政企用户实现全面云化,继2019年发布国产通用型云操作系统安超OS后,又于2020年推出了安超云套件 Archer Cloudsuite.安超云套件Archer Cl ...

  3. 智汇华云 | bcache原理及实践

    ​ 一.前言 简单介绍下bcache,bcache是linux内核块设备层的cache.主要是使用SSD盘在IO速度较慢的HDD盘上面做一层缓存,从而来提高HDD盘的IO速率.一个缓存设备(SSD)可 ...

  4. 赛迪顾问《中国政务云市场研究年度报告》发布:群雄逐鹿 华云数据成为政务云市场主力厂商

    日前,国内权威咨询机构赛迪顾问对外正式发布<2020-2021 年中国政务云市场研究年度报告>(以下简称<报告>).<报告>从全球政务云市场发展整体态势入手,介绍了 ...

  5. 《2021-2022年中国国资云市场发展状况研究报告》发布 华云数据位居中国国资云市场领先者

    近日,由国家工业信息安全发展研究中心指导的中国权威ICT研究咨询机构计世资讯正式对外发布了<2021-2022年中国国资云市场发展状况研究报告>(以下简称<报告>).华云数据凭 ...

  6. 云主机初体验(盛大云和阿里云)

    近来时常听到云计算.云主机的概念,它们一度挑战我的认知能力,在国外云主机已经非常流行,国内才刚刚兴起.近日,朋友给了个邀请码,卢松松这才有机会体验了把云主机,才算基本搞清楚是怎么回事.也希望为主机犯愁 ...

  7. 山寨云主机充斥市场 教您辨别真假云主机

    摘自: http://www.west263.com/services/CloudHost/pk.asp?ads=baidu916 云主机比起VPS到底有何优势?有没有简单的办法可以辨别云主机的真伪呢 ...

  8. 云服务器ECS_云主机_服务器托管_弹性计算-阿里云

    阿里云服务器ECS(Elastic Compute Service)是一种安全可靠.弹性可伸缩的云计算服务,阿里云提供多种云服务器ECS实例规格,如通用算力型u1.ECS计算型c7.通用型g7.GPU ...

  9. 《2020-2021年中国私有云市场发展状况研究报告》发布 华云数据持续稳居市场领导者位置

    近日,由国家工业信息安全发展研究中心指导的中国权威ICT研究咨询机构计世资讯正式对外发布了<2020-2021年中国私有云市场发展状况研究报告>(以下简称<报告>).华云数据凭 ...

最新文章

  1. 【面试题】Redis中是如何实现分布式锁的
  2. [BUUCTF-pwn]——judgement_mna_2016
  3. webrtc agc matlab,c++ WebRTC AGC(自动增益控制)
  4. 按逆向思维定义软件测试,软件测试基础相关概念
  5. 多帧点云数据拼接合并_自动驾驶:Lidar 3D传感器点云数据和2D图像数据的融合标注...
  6. 浅析常用软件架构中的一定要理解的三种架构模型
  7. Git 的安装和创建版本库 。
  8. 微信小程序来了,你准备好了吗?
  9. 未能卸载该设备.启动计算机,未能卸载该设备。启动计算机时可能需要该设备...
  10. python 中time, datetime的用法
  11. IJCAI最佳论文公布 华人斩获最佳学生论文奖!
  12. Linux主机SSH免密码登录设置
  13. vs2008软件测试实战 3 web test(1)
  14. pdf文档转换器绿色版
  15. python下使用gdal空间插值
  16. html 按钮 click事件无效,html中onClick HTML事件不能被触发
  17. tplink怎么进去_怎么进入TP-Link路由器设置界面?
  18. 于娟——《活着就是王道》博客精华文摘
  19. java下载m3u8转ts合成mp4
  20. OpenCL Function Qualifiers (函数限定符)

热门文章

  1. BZOJ 3870: Our happy ending( 状压dp )
  2. [文件系统]文件系统学习笔记(十)---杂项
  3. 不要再代码里频繁的new和delete
  4. 从难以普及的数据增强技术,看AI的性价比时代
  5. 机器学习与统计学的本质差异
  6. linux用卸载软件管理,Linux下软件的安装卸载管理
  7. java 内存泄漏场景_Java内存泄露的例子
  8. html 未来元素绑定事件,jquery on如何给未来元素绑定事件?
  9. java---某人在玩游戏的时候输入密码123456后成功进入游戏(输错5次则被强行退出),要求用程序实现密码验证的过程。
  10. 计算机组成原理平均cpi怎么算_计算机组成原理--1.2计算机系统性能评价