服务器[Ubuntu]GPU-TeslaP100部署

  • 服务器[Ubuntu]GPU-TeslaP100部署
    • 一、初始设置
      • 1、禁用nouveau
        • 1.1【ubuntu】设置为:
        • 1.2【centos】参考:[https://sixiangdefairy.blog.csdn.net/article/details/108118951](https://sixiangdefairy.blog.csdn.net/article/details/108118951)
    • 二、Nvidia驱动
      • 1、驱动下载链接:https://www.nvidia.cn/Download/index.aspx?lang=cn
      • 2、实际下载链接:
      • 3、安装
        • 3.1 如下图为,ubuntu18.04+teslaP100安装的driver440的版本安装成功图:
    • 三、CUDA【不需要安装】
      • 1、驱动下载链接:https://developer.nvidia.com/cuda-toolkit-archive
      • 2、实际下载链接:
      • 3、安装
    • 四、CUDNN【不需要安装】
      • 1、驱动下载链接:https://developer.nvidia.com/rdp/cudnn-archive
      • 2、实际下载链接:
      • 3、安装
      • 4、测试:
    • 五、Docker安装
      • 1、切换阿里云源
      • 2、安装docker
      • 3、启动docker
      • 4、问题解决(若无此问题,跳过):
      • 5、nvidia-docker 离线安装成功!!

服务器[Ubuntu]GPU-TeslaP100部署

一、初始设置

1、禁用nouveau

lsmod | grep nouveau

无显示,则不必再设置。

1.1【ubuntu】设置为:

1.1.1 执行 sudo vim /etc/modprobe.d/blacklist.conf, 在文件末尾添加一句blacklist nouveau
1.1.2 执行sudo update-initramfs -u并重启
1.1.3 重启电脑后执行lsmod | grep nouveau,如果没有输出则说明禁用nouveau成功

1.2【centos】参考:https://sixiangdefairy.blog.csdn.net/article/details/108118951

二、Nvidia驱动

1、驱动下载链接:https://www.nvidia.cn/Download/index.aspx?lang=cn

2、实际下载链接:

wget https://cn.download.nvidia.com/tesla/460.32.03/nvidia-driver-local-repo-ubuntu1604-460.32.03_1.0-1_amd64.deb

3、安装

参考:https://www.nvidia.cn/Download/driverResults.aspx/169718/cn

i) `dpkg -i nvidia-driver-local-repo-ubuntu1604-460.32.03_1.0-1_amd64.deb’ for Ubuntu
ii) `apt-get update`
iii) `apt-get install cuda-drivers`
iv) `reboot`

3.1 如下图为,ubuntu18.04+teslaP100安装的driver440的版本安装成功图:

三、CUDA【不需要安装】

1、驱动下载链接:https://developer.nvidia.com/cuda-toolkit-archive

2、实际下载链接:

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-ubuntu1604.pin
sudo mv cuda-ubuntu1604.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.2.1/local_installers/cuda-repo-ubuntu1604-11-2-local_11.2.1-460.32.03-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1604-11-2-local_11.2.1-460.32.03-1_amd64.deb
sudo apt-key add /var/cuda-repo-ubuntu1604-11-2-local/7fa2af80.pub
sudo apt-get update
sudo apt-get -y install cuda

3、安装

四、CUDNN【不需要安装】

1、驱动下载链接:https://developer.nvidia.com/rdp/cudnn-archive

2、实际下载链接:

wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.1.0.77/11.2_20210127/cudnn-11.2-linux-x64-v8.1.0.77.tgz

3、安装

将文件重命名, 以.tgz作为后缀, 然后使用tar -zxvf file.tgz命令解压即可
解压下载的文件,可以看到cuda文件夹,在当前目录打开终端,执行如下命令:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

4、测试:

查看CUDNN版本:

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

五、Docker安装

1、切换阿里云源

参考:https://blog.csdn.net/Bankeey/article/details/106478513
sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak
sudo vim /etc/apt/sources.list

填入如下内容:

deb http://mirrors.aliyun.com/ubuntu/ xenial main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ xenial-security main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ xenial-updates main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ xenial-proposed main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ xenial-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ xenial main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-proposed main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-backports main restricted universe multiversedeb http://archive.ubuntu.com/ubuntu/ xenial main restricted universe multiverse
deb http://archive.ubuntu.com/ubuntu/ xenial-security main restricted universe multiverse
deb http://archive.ubuntu.com/ubuntu/ xenial-updates main restricted universe multiverse
deb http://archive.ubuntu.com/ubuntu/ xenial-proposed main restricted universe multiverse
deb http://archive.ubuntu.com/ubuntu/ xenial-backports main restricted universe multiverseapt-get update

2、安装docker

参考:https://blog.csdn.net/qq_27731689/article/details/92969266
#在Ubuntu系统中安装较为简单,官方提供了脚本供我们进行安装。

sudo apt install curl
curl -fsSL get.docker.com -o get-docker.sh
sudo sh get-docker.sh --mirror Aliyun

3、启动docker

参考:https://blog.csdn.net/qq_27731689/article/details/92969266

sudo systemctl enable docker
sudo systemctl start docker

4、问题解决(若无此问题,跳过):

问题:

root@ubuntu:/pro_setup/software/nvidia# sudo curl -s -L https://nvidia.github.io/nvidia-docker/ubuntu16.04/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo: sudounable to resolve host ubuntu:
unable to resolve host ubuntu

解决方案:

vi /etc/hosts

填入:

127.0.1.1 ubuntu

5、nvidia-docker 离线安装成功!!

1)离线安装包下载:http://mirror.cs.uchicago.edu/nvidia-docker/nvidia-container-runtime/stable/ubuntu16.04/amd64/
2)安装步骤参考:https://blog.51cto.com/dldxzjr/2541070

3)安装:
准备以下几个安装包:

libnvidia-container1_1.0.1-1_amd64.deb
libnvidia-container-tools_1.0.1-1_amd64.deb
nvidia-container-runtime_3.1.4-1_amd64.deb
nvidia-container-toolkit_1.0.5-1_amd64.deb

安装:

sudo apt install   ./lib*   ./nvidia*

更新daemon.json

sudo tee /etc/docker/daemon.json <<EOF
{"default-runtime":"nvidia","runtimes": {"nvidia": {"path": "/usr/bin/nvidia-container-runtime","runtimeArgs": []}}
}
EOF

重启docker

sudo systemctl daemon-reload
sudo systemctl restart docker
sudo pkill -SIGHUP dockerd

测试:
也可通过:https://hub.docker.com/进行查询版本。

docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi
docker run --gpus all --rm nvidia/cuda nvidia-smi

八、服务器【Ubuntu】GPU-TeslaP100部署相关推荐

  1. 搭建Ubuntu GPU服务器(宿主机篇)

    搭建Ubuntu GPU服务器(宿主机篇) 1.安装Ubuntu 20.04 注意,安装千万不要选择最小安装,就选正常安装就行 2.换源 阿里源网站 注意千万别换成其他版本的源,一定要对应ubuntu ...

  2. Vue项目部署到服务器(ubuntu)

    Vue项目部署到服务器(ubuntu) 工具:WinSCP.PuTTy(可能不是专业的工具,是本人上操作系统的课用到的软件,直接用来部署了) 打包项目,npm run build 执行npm run ...

  3. AI视频行为分析系统项目复盘——技术篇1:Ubuntu 18.04部署编译OpenCV+contrib、TensorFlow2.1、CUDA10.1+cuDNN7.6.5、tensorRT6.0.1等

    0 项目背景 接手他人的项目,全过程重头梳理下. 7台服务器,其中6台GPU服务器(GPU:2*2080Ti,CPU:2*Xeon Gold 5118(12核24线程)),一台调度服务器,Ubuntu ...

  4. ubuntu服务器系统介绍,服务器ubuntu可视化

    服务器ubuntu可视化 内容精选 换一换 以上配置完成后,进入控制台界面,选择"管理与部署 > 云监控",在左侧导航栏选择"主机监控 > 裸金属服务器&qu ...

  5. 阿里云ECS服务器前后端项目部署

    最近自己写了一个小项目,想把它部署在服务器上以便实时查看,在此记录一下自己的部署过程以及在部署过程中遇到的问题,方便日后查看. 参考:www.kovli.com/2017/09/19/- 作者:Kov ...

  6. Ubuntu系统Apache2部署SSL证书

    Ubuntu系统Apache2部署SSL证书 前提条件 已从SSL证书控制台下载Apache服务器证书 步骤 在apache2目录下创建SSL目录 mkdir /etc/apache2/ssl 使用命 ...

  7. 利用flask写的接口(base64, 二进制, 上传视频流)+异步+gunicorn部署Flask服务+多gpu卡部署

    一.flask写的接口 1.1 manage.py启动服务(发送图片base64版) 这里要注意的是用docker的话,记得端口映射 #coding:utf-8 import base64 impor ...

  8. kurento和打洞的服务器的安装及部署

    kurento和打洞的服务器的安装及部署 文章目录 `kurento`和打洞的服务器的安装及部署 前言 使用docker安装kurento docker安装stun和turn服务器(打洞服务器) ku ...

  9. 服务器 虚拟gpu,云服务器 虚拟gpu

    云服务器 虚拟gpu 内容精选 换一换 欢迎使用弹性云服务器(Elastic Cloud Server ,ECS).弹性云服务器是由CPU.内存.镜像.云硬盘组成的一种可随时获取.弹性可扩展的计算服务 ...

最新文章

  1. 草根seo站长利用网站赚钱的方法
  2. 多个tab可以组成一个表单吗 js_11个表单设计小技巧
  3. scala之Actors
  4. 2018-2019-2 网络对抗技术 20165337 Exp4 恶意代码分析
  5. 关于WM_NCHITTEST消息(移动无标题对话框多个)
  6. iptables规则备份和恢复 firewalld服务
  7. 锐起无盘服务器安装教程,锐起无盘安装方法 图文教程
  8. 新编计算机英语第六章,新编计算机英语-电子教案.ppt
  9. 用css画出一个圆圈,里面有个叉号(不能用英文字母x)
  10. unity 的Cinemachine组件运用
  11. pandas 提取某几列_用Pandas做数据清洗,我一般都这么干……
  12. python给用户打标签_用户画像—打用户行为标签
  13. 如何用ESP8266/ESP8285做一个WIFI中继(WiFi信号放大器)
  14. 基于springboot老年人健康体检系统(带论文)
  15. SE:14.Annotation
  16. 【WLAN】【基础知识】WIFI那些事儿之DFS
  17. python 图像对比度_Python: PS 图像调整--对比度调整
  18. 45页精华《2022中国建筑行业数字化转型研究报告》出炉(附下载)
  19. 嘟噜噜的难受伴快乐的一天。
  20. 【Jboss EAP】初识JBoss EAP

热门文章

  1. 基金定投--1.基金的基础知识
  2. Java-JFrame窗体美化
  3. curl证书过期_定时检测SSL证书过期情况并发送通知
  4. Log4j2官方文档翻译--欢迎使用Log4j2!
  5. 引领盲返消费新潮流,共创社交电商新时代
  6. 广域网技术-PPP协议
  7. 读懂这三个关键词,就明白迅雷链为什么受开发者欢迎
  8. 关于element-ui中轮播图手动切换轮播图片
  9. odoo:开源 ERP/CRM 入门与实践 -- 上海嘉冰信息技术公司提供咨询服务
  10. 苹果系统怎么链接共享服务器,mac连接共享服务器设置