八、服务器【Ubuntu】GPU-TeslaP100部署
服务器[Ubuntu]GPU-TeslaP100部署
- 服务器[Ubuntu]GPU-TeslaP100部署
- 一、初始设置
- 1、禁用nouveau
- 1.1【ubuntu】设置为:
- 1.2【centos】参考:[https://sixiangdefairy.blog.csdn.net/article/details/108118951](https://sixiangdefairy.blog.csdn.net/article/details/108118951)
- 二、Nvidia驱动
- 1、驱动下载链接:https://www.nvidia.cn/Download/index.aspx?lang=cn
- 2、实际下载链接:
- 3、安装
- 3.1 如下图为,ubuntu18.04+teslaP100安装的driver440的版本安装成功图:
- 三、CUDA【不需要安装】
- 1、驱动下载链接:https://developer.nvidia.com/cuda-toolkit-archive
- 2、实际下载链接:
- 3、安装
- 四、CUDNN【不需要安装】
- 1、驱动下载链接:https://developer.nvidia.com/rdp/cudnn-archive
- 2、实际下载链接:
- 3、安装
- 4、测试:
- 五、Docker安装
- 1、切换阿里云源
- 2、安装docker
- 3、启动docker
- 4、问题解决(若无此问题,跳过):
- 5、nvidia-docker 离线安装成功!!
服务器[Ubuntu]GPU-TeslaP100部署
一、初始设置
1、禁用nouveau
lsmod | grep nouveau
无显示,则不必再设置。
1.1【ubuntu】设置为:
1.1.1 执行 sudo vim /etc/modprobe.d/blacklist.conf
, 在文件末尾添加一句blacklist nouveau
1.1.2 执行sudo update-initramfs -u
并重启
1.1.3 重启电脑后执行lsmod | grep nouveau
,如果没有输出则说明禁用nouveau成功
1.2【centos】参考:https://sixiangdefairy.blog.csdn.net/article/details/108118951
二、Nvidia驱动
1、驱动下载链接:https://www.nvidia.cn/Download/index.aspx?lang=cn
2、实际下载链接:
wget https://cn.download.nvidia.com/tesla/460.32.03/nvidia-driver-local-repo-ubuntu1604-460.32.03_1.0-1_amd64.deb
3、安装
参考:https://www.nvidia.cn/Download/driverResults.aspx/169718/cn
i) `dpkg -i nvidia-driver-local-repo-ubuntu1604-460.32.03_1.0-1_amd64.deb’ for Ubuntu
ii) `apt-get update`
iii) `apt-get install cuda-drivers`
iv) `reboot`
3.1 如下图为,ubuntu18.04+teslaP100安装的driver440的版本安装成功图:
三、CUDA【不需要安装】
1、驱动下载链接:https://developer.nvidia.com/cuda-toolkit-archive
2、实际下载链接:
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-ubuntu1604.pin
sudo mv cuda-ubuntu1604.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.2.1/local_installers/cuda-repo-ubuntu1604-11-2-local_11.2.1-460.32.03-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1604-11-2-local_11.2.1-460.32.03-1_amd64.deb
sudo apt-key add /var/cuda-repo-ubuntu1604-11-2-local/7fa2af80.pub
sudo apt-get update
sudo apt-get -y install cuda
3、安装
四、CUDNN【不需要安装】
1、驱动下载链接:https://developer.nvidia.com/rdp/cudnn-archive
2、实际下载链接:
wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.1.0.77/11.2_20210127/cudnn-11.2-linux-x64-v8.1.0.77.tgz
3、安装
将文件重命名, 以.tgz作为后缀, 然后使用tar -zxvf file.tgz命令解压即可
解压下载的文件,可以看到cuda文件夹,在当前目录打开终端,执行如下命令:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
4、测试:
查看CUDNN版本:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
五、Docker安装
1、切换阿里云源
参考:https://blog.csdn.net/Bankeey/article/details/106478513
sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak
sudo vim /etc/apt/sources.list
填入如下内容:
deb http://mirrors.aliyun.com/ubuntu/ xenial main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ xenial-security main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ xenial-updates main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ xenial-proposed main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ xenial-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ xenial main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-proposed main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-backports main restricted universe multiversedeb http://archive.ubuntu.com/ubuntu/ xenial main restricted universe multiverse
deb http://archive.ubuntu.com/ubuntu/ xenial-security main restricted universe multiverse
deb http://archive.ubuntu.com/ubuntu/ xenial-updates main restricted universe multiverse
deb http://archive.ubuntu.com/ubuntu/ xenial-proposed main restricted universe multiverse
deb http://archive.ubuntu.com/ubuntu/ xenial-backports main restricted universe multiverseapt-get update
2、安装docker
参考:https://blog.csdn.net/qq_27731689/article/details/92969266
#在Ubuntu系统中安装较为简单,官方提供了脚本供我们进行安装。
sudo apt install curl
curl -fsSL get.docker.com -o get-docker.sh
sudo sh get-docker.sh --mirror Aliyun
3、启动docker
参考:https://blog.csdn.net/qq_27731689/article/details/92969266
sudo systemctl enable docker
sudo systemctl start docker
4、问题解决(若无此问题,跳过):
问题:
root@ubuntu:/pro_setup/software/nvidia# sudo curl -s -L https://nvidia.github.io/nvidia-docker/ubuntu16.04/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo: sudounable to resolve host ubuntu:
unable to resolve host ubuntu
解决方案:
vi /etc/hosts
填入:
127.0.1.1 ubuntu
5、nvidia-docker 离线安装成功!!
1)离线安装包下载:http://mirror.cs.uchicago.edu/nvidia-docker/nvidia-container-runtime/stable/ubuntu16.04/amd64/
2)安装步骤参考:https://blog.51cto.com/dldxzjr/2541070
3)安装:
准备以下几个安装包:
libnvidia-container1_1.0.1-1_amd64.deb
libnvidia-container-tools_1.0.1-1_amd64.deb
nvidia-container-runtime_3.1.4-1_amd64.deb
nvidia-container-toolkit_1.0.5-1_amd64.deb
安装:
sudo apt install ./lib* ./nvidia*
更新daemon.json
sudo tee /etc/docker/daemon.json <<EOF
{"default-runtime":"nvidia","runtimes": {"nvidia": {"path": "/usr/bin/nvidia-container-runtime","runtimeArgs": []}}
}
EOF
重启docker
sudo systemctl daemon-reload
sudo systemctl restart docker
sudo pkill -SIGHUP dockerd
测试:
也可通过:https://hub.docker.com/进行查询版本。
docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi
docker run --gpus all --rm nvidia/cuda nvidia-smi
八、服务器【Ubuntu】GPU-TeslaP100部署相关推荐
- 搭建Ubuntu GPU服务器(宿主机篇)
搭建Ubuntu GPU服务器(宿主机篇) 1.安装Ubuntu 20.04 注意,安装千万不要选择最小安装,就选正常安装就行 2.换源 阿里源网站 注意千万别换成其他版本的源,一定要对应ubuntu ...
- Vue项目部署到服务器(ubuntu)
Vue项目部署到服务器(ubuntu) 工具:WinSCP.PuTTy(可能不是专业的工具,是本人上操作系统的课用到的软件,直接用来部署了) 打包项目,npm run build 执行npm run ...
- AI视频行为分析系统项目复盘——技术篇1:Ubuntu 18.04部署编译OpenCV+contrib、TensorFlow2.1、CUDA10.1+cuDNN7.6.5、tensorRT6.0.1等
0 项目背景 接手他人的项目,全过程重头梳理下. 7台服务器,其中6台GPU服务器(GPU:2*2080Ti,CPU:2*Xeon Gold 5118(12核24线程)),一台调度服务器,Ubuntu ...
- ubuntu服务器系统介绍,服务器ubuntu可视化
服务器ubuntu可视化 内容精选 换一换 以上配置完成后,进入控制台界面,选择"管理与部署 > 云监控",在左侧导航栏选择"主机监控 > 裸金属服务器&qu ...
- 阿里云ECS服务器前后端项目部署
最近自己写了一个小项目,想把它部署在服务器上以便实时查看,在此记录一下自己的部署过程以及在部署过程中遇到的问题,方便日后查看. 参考:www.kovli.com/2017/09/19/- 作者:Kov ...
- Ubuntu系统Apache2部署SSL证书
Ubuntu系统Apache2部署SSL证书 前提条件 已从SSL证书控制台下载Apache服务器证书 步骤 在apache2目录下创建SSL目录 mkdir /etc/apache2/ssl 使用命 ...
- 利用flask写的接口(base64, 二进制, 上传视频流)+异步+gunicorn部署Flask服务+多gpu卡部署
一.flask写的接口 1.1 manage.py启动服务(发送图片base64版) 这里要注意的是用docker的话,记得端口映射 #coding:utf-8 import base64 impor ...
- kurento和打洞的服务器的安装及部署
kurento和打洞的服务器的安装及部署 文章目录 `kurento`和打洞的服务器的安装及部署 前言 使用docker安装kurento docker安装stun和turn服务器(打洞服务器) ku ...
- 服务器 虚拟gpu,云服务器 虚拟gpu
云服务器 虚拟gpu 内容精选 换一换 欢迎使用弹性云服务器(Elastic Cloud Server ,ECS).弹性云服务器是由CPU.内存.镜像.云硬盘组成的一种可随时获取.弹性可扩展的计算服务 ...
最新文章
- 草根seo站长利用网站赚钱的方法
- 多个tab可以组成一个表单吗 js_11个表单设计小技巧
- scala之Actors
- 2018-2019-2 网络对抗技术 20165337 Exp4 恶意代码分析
- 关于WM_NCHITTEST消息(移动无标题对话框多个)
- iptables规则备份和恢复 firewalld服务
- 锐起无盘服务器安装教程,锐起无盘安装方法 图文教程
- 新编计算机英语第六章,新编计算机英语-电子教案.ppt
- 用css画出一个圆圈,里面有个叉号(不能用英文字母x)
- unity 的Cinemachine组件运用
- pandas 提取某几列_用Pandas做数据清洗,我一般都这么干……
- python给用户打标签_用户画像—打用户行为标签
- 如何用ESP8266/ESP8285做一个WIFI中继(WiFi信号放大器)
- 基于springboot老年人健康体检系统(带论文)
- SE:14.Annotation
- 【WLAN】【基础知识】WIFI那些事儿之DFS
- python 图像对比度_Python: PS 图像调整--对比度调整
- 45页精华《2022中国建筑行业数字化转型研究报告》出炉(附下载)
- 嘟噜噜的难受伴快乐的一天。
- 【Jboss EAP】初识JBoss EAP