搭建Ubuntu GPU服务器(宿主机篇)

1、安装Ubuntu 20.04

注意,安装千万不要选择最小安装,就选正常安装就行

2、换源

阿里源网站

注意千万别换成其他版本的源,一定要对应ubuntu 20.04

cd /etc/apt
sudo cp sources.list sources.list.bak
sudo vi sources.list

将以下内容替换进去

deb http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse

然后更新apt-get

sudo apt-get update

3、安装必要工具

安装vim

sudo apt-get install vim

安装net-tools

sudo apt-get install net-tools

安装ssh服务器

sudo apt-get install openssh-server
sudo apt-get install wget

4、安装Nvidia显卡驱动

Ubuntu 20.04提供了官方的驱动源,可以直接用图形界面安全安装

选择软件和更新,选择附加驱动,选择最新版本的驱动源。

等待安装结束,结束后重启电脑

输入

nvidia-smi

验证显卡驱动是否正确安装

5、安装CUDA

CUDA11.5官方下载网址

具体的安装方法在官网也有详细的文档说明 Installation Guide for Linux,强烈建议大家自己去看一手资料

1、确认自己的显卡是否在支持CUDA

输入指令,查看PCI设备,在其中查找nvidia

lspci | grep -i nvidia

去官网查找自己的网卡是否支持CUDA 查询网址

我们实验室的GPU是RTX4000可以看到是支持的

而我的笔记本是Geforce 940MX,官网上只有940M在内,但是不要慌,先点击940M,在Product Family中可以看到940MX,点击发现上面Supported Technologies是支持CUDA的,所以也可以安装CUDA

2、确认自己的显卡驱动版本

查看自己的显卡版本

nvidia-smi

在CUDA Downloads下面的Resources中点击CUDA Documentation/Release Notes就可以查看想要下载的CUDA需要什么版本的驱动


一般来说,最新版本的驱动支持所有的目前为止所有的CUDA,所以在最开始我安装了最新的驱动。

3、安装

以上所有检查结束之后就可以安装了 安装网页

按提示选择对应的版本,最后官网会显示指导下载安装的一系列指令

4、安装后的操作

1、修改环境变量

安装完成之后需要确认是否安装成功,有的小伙伴直接在安装结束后就输入nvcc -V,结果显示找不到该命令,然后重启也不行,是因为还差一步,修改环境变量。

在终端中输入

vim .bashrc

在文件最后添加

export PATH=/usr/local/cuda-11.4/bin${PATH:+:${PATH}}

注意此处的cuda-11.4是我的版本,你要改成和你的版本对应的数字

然后

source .bashrc

再次输入

nvcc -V

如果显示正确你会看到的

2、测试Samples

下载CUDA Samples

git clone https://github.com/NVIDIA/cuda-samples.git

进入Sample目录,输入

make -j4

完毕后进入bin的最深层目录

./deviceQuery

成功后会输出

6、安装cuDNN

cuDNN官网

官方安装指南

安装cuDNN需要注册一个Nvidia Developer账号,别嫌麻烦,注册一个吧,一劳永逸

1、根据CUDA版本确定cuDNN版本

官网的下载链接都有说明,比如cuDNN v8.3.0有for CUDA 11.5的还有for CUDA 10.2的

如果没有你想要的,你也可以点击下面的Archived cuDNN Releases

2、安装步骤

安装最好选择developer版

sudo dpkg -i libcudnn8_x.x.x-1+cudax.x_amd64.deb            #安装runtime
sudo dpkg -i libcudnn8-dev_8.x.x.x-1+cudax.x_arm64.deb     #安装developer library
sudo dpkg -i libcudnn8-samples_8.x.x.x-1+cudax.x_arm64.deb #安装samples和the cuDNN library documentation

安装依赖项

sudo apt-get install libfreeimage3 libfreeimage-dev

3、验证安装成功

验证方法就是编译/usr/src/cudnn_samples_v8目录下的mnistCUDNN

先把Samples拷贝到一个可读写目录,此处选择家目录,然后编译运行

cp -r /usr/src/cudnn_samples_v8/ $HOME
cd  $HOME/cudnn_samples_v8/mnistCUDNN
make clean && make
./mnistCUDNN

如果安装成功,则会显示

Test passed!

7、安装docker

docker官方文档

首先安装依赖

sudo apt-get update
sudo apt-get install \ca-certificates \curl \gnupg \lsb-release

添加docker官方GPG Key

curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg

添加软件源

 echo \"deb [arch=$(dpkg --print-architecture) signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu \$(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

安装docker

sudo apt-get update
sudo apt-get install docker-ce docker-ce-cli containerd.io

docker换源

vim /etc/docker/daemon.json

写入以下内容

{"registry-mirrors":["https://hub-mirror.c.163.com/","https://docker.mirrors.ustc.edu.cn/"]
}

重启docker服务

systemctl daemon-reload
systemctl restart docker

8、安装Nvidia-docker

Nvidia-docker官方博客

Nvidia-docker github repo

Nvida-docker安装指南

添加官方仓库GPG Key

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \&& curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \&& curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

安装

sudo apt-get update
sudo apt-get install -y nvidia-docker2

测试安装

sudo systemctl restart docker
sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi

如果成功的话,应该会出现以下的输出

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.51.06    Driver Version: 450.51.06    CUDA Version: 11.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla T4            On   | 00000000:00:1E.0 Off |                    0 |
| N/A   34C    P8     9W /  70W |      0MiB / 15109MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

安装Weave Scope

Weave Scope可用作docker容器的集群监控,非常好用。

sudo mkdir /usr/local/bin
sudo curl -L git.io/scope -o /usr/local/bin/scope
sudo chmod a+x /usr/local/bin/scope
sudo scope launch

上述命令就是启动一个脚本,从docker上拉取Weave Scope镜像并运行。但执行curl下载时需要打开你的赛因斯上网。
然后打开http://localhost:4040就可以看到监控画面

搭建Ubuntu GPU服务器(宿主机篇)相关推荐

  1. 搭建GPU服务器(容器篇)

    搭建GPU服务器(容器篇) VNC服务器 安装vncserver 首先更新源 sudo apt update 然后安装Xfce sudo apt install xfce4 xfce4-goodies ...

  2. 群晖python套件包_利用群晖Docker安装ubuntu16.04搭建python网站服务器(部署篇)

    在帖子<利用群晖Docker安装ubuntu16.04搭建python网站服务器(安装篇)(地址:http://www.cirdown.com:81/thread-185-1-1.html)&g ...

  3. 群晖 python_利用群晖Docker安装ubuntu16.04搭建python网站服务器(安装篇)

    折腾的原因:我目前有两个网站需要挂载,因为为了玩,并不是为了大流量,所以就挂在家里的群晖中.一个是小圈子(www.cirdown.com:81),因为用的是discuz论坛,php的,所以直接用我的黑 ...

  4. 分享关于搭建高性能WEB服务器的一篇文章

    这篇文章主要介绍了Centos5.4+Nginx-0.8.50+UWSGI-0.9.6.2+Django-1.2.3搭建高性能WEB服务器的相关资料,需要的朋友可以参考下(http://m.0813s ...

  5. 从零开始一步一步搭建Ubuntu Server服务器、修改数据源、安装Docker、配置镜像加速器、Compose部署Gitlab服务

    场景 最终目的是使用Docker Compose部署一个Gitlab服务. 效果 注: 博客: https://blog.csdn.net/badao_liumang_qizhi 关注公众号 霸道的程 ...

  6. Vmware Esxi宿主机及虚拟机网络配置

    1.网络规划 ESXI管理网段==>10.10.10.0/24==>vlan10 虚拟机网段==>10.10.20.0/24==>vlan20 2.当前ESXi主机使用两块物理 ...

  7. 通过共享文件夹实现虚拟机VMware与宿主机文件共享

    通过共享文件夹实现虚拟机VMware与宿主机文件共享 说明: 虚拟机系统:Ubuntu 16.04 宿主机系统:Windows 10 通过共享文件夹实现虚拟机VMware与宿主机文件共享 第1步:宿主 ...

  8. dovecot MySQL配置_dovecot+mysql配置及搭建邮件云服务器方法

    dovecot+mysql配置及搭建邮件云服务器方法 发布时间:2020-05-12 11:31:26 来源:亿速云 阅读:195 作者:三月 下面一起来了解下dovecot+mysql配置及搭建邮件 ...

  9. 基于LXC的GPU服务器搭建

    目录 前言 需求 为啥用LXC LXC的宿主机配置 安装 基础配置 配置ZFS 配置LXD 新建容器 显卡资源配置 共享目录 挂载nvidia-uvm 端口转发 进入容器内部 容器内部配置 显卡驱动安 ...

最新文章

  1. python官方-Python官方中文文档强势来袭
  2. zoj 3327 Friend Number 模拟题
  3. linux启动过程中内核拷贝,轻松识破linux内核启动过程中的“”套路“”
  4. 快速判断一个数是否是2的幂次方
  5. VB 超简单的屏幕截图代码
  6. C# FAQ: const和static readonly有什么区别?
  7. 【Vue实战】汽车品牌列表表格实现(添加、删除功能)
  8. 钣金缺口lisp_【Gu_xl】Lisp程序设计错误处理的技巧
  9. win10安装centos子系统
  10. HDTune硬盘检测工具
  11. iOS----------关于UDID和UUID的一些理解
  12. WARN: Establishing SSL connection without server‘s identity verification
  13. 【视频学习】完结 王霸胆 -美式发音28天完美养成计
  14. 计算机应用基础难点,计算机应用基础(本科)重、难点
  15. java面试宝典2013
  16. 2021年中国奶粉行业发展现状分析,行业集中度不断提升,下沉市场发展空间广阔「图」
  17. 数字化时代,全方位解读商业智能BI
  18. 代码灵异事件 -- php使用redis的hgetall方法出现的怪问题
  19. vue移动端图片裁剪上传
  20. jQuery筛选-文档处理

热门文章

  1. 盛大哼唱检索前端提取算法分析
  2. MCE公司:RIP1 激酶抑制剂可应用于自身免疫性脑脊髓炎的治疗
  3. 网易_在数组中查找前K个元素
  4. vue 拖拽功能样式优化
  5. 蓝牙发射功率dBm换算,发射总能量公式
  6. python求图形面积_如何使用python语言中的if语句实现求取图形面积
  7. 18日精读掌握《费曼物理学讲义-卷一》计划(2019/6/12-2019/6/29)
  8. C语言--指针作为数组参数获取数组平均数
  9. php立方体相册源码,纯CSS实现3D的代码(正方体、动态立体图片册、平面的星空)...
  10. cuda安装linux命令,ubuntu下安装cuda的两种方法