宿主机

系统

建议安装server版,通过ssh远程使用

环境

安装NVIDIA显卡驱动、CUDA、cudnn

LXD的安装与初始化

安装LXD

sudo apt-get install lxd zfsutils-linux bridge-utils
  • LXD 实现虚拟容器
  • ZFS 用于管理物理磁盘,支持LXD高级功能
  • bridge-utils 用于搭建网桥

配置ZFS

  • 查看可用磁盘和分区

    sudo fdisk -l
    

    可以看到这块磁盘一共3.65T,只使用了500G,剩余的空间专门留出来用于LXD容器的。

  • 查看分区

    sudo fdisk /dev/sda
    

    按下图操作,将磁盘所剩空间全部作为容器的存储空间。分区为 /dev/sda2

LXD初始化

lxd init

这里面的配置错了也没关系,还可以使用 sudo lxc profile edit default 再次修改配置

容器的创建与连接

创建容器

sudo lxc launch ubuntu:20.04 lgh

进入容器

sudo lxc exec lgh bash

这里进入的是root用户,实际上容器里面还有一个用户名为 ubuntu 的默认用户

修改密码

passwd root
passwd ubuntu

网上说默认密码和用户名相同,我输入一直双周,因此直接重置了密码

设置SSH

编辑 /etc/ssh/sshd_config 文件,将 PasswordAuthentication 改为yes

sudo nano /etc/ssh/sshd_config
# 重启ssh服务
sudo /etc/init.d/ssh restart

退出容器

exit

查看容器IP

sudo lxc list

端口转发

sudo lxc config device add lgh proxy0 proxy listen=tcp:{宿主机IP}:6002 connect=tcp:10.228.141.116:22 bind=host

这里将宿主机的6002端口映射到了容器的22端口,ssh连接宿主机的6002端口即可进入容器

初始容器的配置

连接容器

ssh ubuntu@{宿主机IP} -p 6002

添加显卡

添加所有显卡

lxc config device add {容器名} gpu gpu

添加指定显卡

lxc config device add {容器名} gpu0 gpu id=0

安装显卡驱动

与宿主机的显卡版本必须一致,需要注意的是容器里面安装显卡驱动时需要加上后面的参数,安装时不需要安装到内核

sudo sh ./NVIDIA-Linux-X86_64-[YOURVERSION].run --no-kernel-module

容器模板

可以将配置好的容器打包成镜像模板,方便后续的容器创建

  • 停止容器

    lxc stop {容器名}
    
  • 打包

    sudo lxc publish {容器名} --alias {镜像名} --public
    

共享目录

lxc profile device add default data disk source=/data/lxd-data path=/opt/data

遇到的问题

  • 宿主机的英伟达驱动重启了后宿主机不使用,容器内是不能用的,解决方法如下

    sudo -S /sbin/modprobe nvidia-uvm
    D=`grep nvidia-uvm /proc/devices | awk '{print $1}'`
    sudo -S mknod -m 666 /dev/nvidia-uvm c $D 0
    

参考文章

shenuiuin/LXD_GPU_SERVER: 实验室GPU服务器的LXD虚拟化 (github.com)

基于LXD搭建多人共用GPU服务器,简单易用,全网最详细! (cdsy.xyz)

用LXC/LXD搭建实验室多GPU共享系统用于深度学习 - 知乎 (zhihu.com)

多人共用GPU服务器LXD安装相关推荐

  1. 基于LXD搭建多人共用GPU服务器,简单易用,全网最详细!

    基于LXD搭建多人共用GPU服务器 一.引言 二.方案对比 2.1 单用户 2.2 多用户 2.3 KVM虚拟机 2.4 Docker 2.5 LXC 2.6 LXD 2.7 OpenPAI 2.8 ...

  2. GPU服务器中安装CUDA

    背景:本来以为买了一台GPU服务器,直接运行飞桨的模型就好了,实际上是我想多了,没想到GPU服务器只是带有显存,具体还是要靠驱动来运行模型的.所以就有了以下这些事情. 直接进入正题 下载并安装cuda ...

  3. Gpu 服务器相关驱动安装链接

    NVIDIA驱动与 CUDA Table 1. CUDA Toolkit and Compatible Driver Versions CUDA Toolkit Linux x86_64 Driver ...

  4. 六.开发记录之实验室服务器LXD部署

    专栏系列文章如下: 一.开发记录之AHRS.惯导传感器SBG-Ellipse-N传感器配置和使用_goldqiu的博客-CSDN博客 二.开发记录之派勤工控机远程使用和ubuntu和ROS环境配置_g ...

  5. 实验室服务器多人共用账号,搭建多人共用的GPU服务器

    背景 目前实验室GPU使用状况是:大部分同窗的配有单台1080/TITAN Xp.后来购入了两台4卡的机器,老师的意思是但愿能够做为服务器使用,可以多人同时使用,互不影响.因而便开始了本次折腾,记录采 ...

  6. GPU服务器使用教程

    转自https://ai.futurelab.tv/news/7 硬件型号和配置 本次大赛区域赛免费为选手提供GPU计算资源.GPU服务器为金山云P3I.14B1,配置如下: GPU:Tesla P4 ...

  7. 戴尔服务器R730安装centos7系统和GPU驱动注意事项

    本人安装centos7系统,花了很长时间慢慢才摸透一些,写下来总结一下,安装centos7要先按F2进入boot setting,将启动方式改为USB读入,这个网上有很多教程,正常安装就没事,安装好了 ...

  8. 腾讯云GPU桌面服务器驱动安装

    博文背景 为设计渲染需要,使用腾讯云GPU服务器,需要进行初始化环境的配置. 具体操作

  9. 基于LXC的GPU服务器搭建

    目录 前言 需求 为啥用LXC LXC的宿主机配置 安装 基础配置 配置ZFS 配置LXD 新建容器 显卡资源配置 共享目录 挂载nvidia-uvm 端口转发 进入容器内部 容器内部配置 显卡驱动安 ...

最新文章

  1. TensorFlow、PyTorch之后,“国产”AI框架还有没有机会?
  2. maven项目update报错
  3. MySQL之索引分类
  4. Python函数中4种参数的使用
  5. 一起谈.NET技术,Silverlight实例教程 - Out of Browser的Debug和Notifications窗口
  6. DocKer linux Centos 安装DocKer 只需要十步
  7. Windows下源码获取
  8. 人工智能诗歌写作平台_人工智能教作文,只写出二类文,人类语文老师稳赢
  9. pip: command not found
  10. Android判断是否使用MediaCodec硬解码(十二)
  11. STM32F103ZET6(野火霸道v2)串口烧录(mcuisp)
  12. 路径规划——RRT算法实现
  13. GNSS数据处理(二)——GAMP_GOOD操作说明
  14. 自己写的一个GPS卫星地图
  15. 华为云计算IE面试笔记-云磁盘和普通磁盘的区别。
  16. 字节跳动上班有多累?
  17. 周记录学习总结<大杂烩>
  18. TIFF图像文件(四):LZW压缩
  19. 华为首次自曝“天才少年”成果:入职不到一年就干成这件大事,网友:值200万年薪!...
  20. 为双系统 Ubuntu grub启动项中添加Windows启动项

热门文章

  1. ethos-专用系统 升级公告!
  2. 【转】jsp 表单form传值
  3. vant ui 官网网址
  4. 小鲲Python嘎嘎炫~day1.3
  5. 牛客小白月赛6 - A鲲
  6. 每日爬虫练习:爬取最新搞笑段子
  7. 某银行电子银行风险评估服务
  8. undefined reference to imread()
  9. 编译原理——第三章词法分析总结
  10. java excel转csv