文章目录

一、Linux卸载并更新显卡驱动
- 1. 下载对应版本的驱动
- 2. 卸载已有驱动
- 3. 重启服务器
- 4. 安装新驱动
二、安装cuda
三、安装docker
四、安装nvidia-docker2
五、出错的解决办法
六、制作容器
- 1. 下载镜像
- 2. 制作容器
- 3. 启动并进入容器
- 4. 进入容器安装其他工具
- 5. 将安装新工具后的容器保存
- 6. 加载别人做好的镜像
- 7. 一些docker命令

一、Linux卸载并更新显卡驱动

1. 下载对应版本的驱动

https://www.nvidia.com/Download/index.aspx?lang=en-us

2. 卸载已有驱动

sudo sh NVIDIA-Linux-x86_64-450.80.02.run --uninstall
或
sudo /usr/bin/nvidia-uninstall

3. 重启服务器

sudo reboot

4. 安装新驱动

sudo sh NVIDIA-Linux-x86_64-450.80.02.run注：安装后提示
To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-11.1/bin
To uninstall the NVIDIA Driver, run nvidia-uninstall

二、安装cuda

提示安装驱动时，选择no，其他yes、默认即可。

三、安装docker

# step 1: 安装必要的一些系统工具
sudo apt-get update
sudo apt-get -y install apt-transport-https ca-certificates curl software-properties-common
# step 2: 安装GPG证书
curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add -
# Step 3: 写入软件源信息
sudo add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable"
# Step 4: 更新并安装 Docker-CE
sudo apt-get -y update
sudo apt-get -y install docker-ce

四、安装nvidia-docker2

# 清理以前的。If you have nvidia-docker 1.0 installed: we need to remove it and all existing GPU containers
sudo docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f
sudo apt-get purge -y nvidia-docker
sudo apt autoremove# 执行命令。Add the package repositories
# command 1
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \sudo apt-key add -# command 2
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)# command 3
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update# 正式安装。Install nvidia-docker2 and reload the Docker daemon configuration
sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP dockerd# 测试一下。 Test nvidia-smi with the latest official CUDA image
sudo docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi#如果已经安装过，并且知道版本，例如服务器上已经安装了cuda10.0,则如下进行测试是否可用。
sudo docker run --runtime=nvidia --rm nvidia/cuda:10.0-base nvidia-smi
此处cuda:10.0-base 可以根据自己实际换成cuda:10.0-runtime、cuda:10.0-devel,分别代表基本版，运行时、开发

五、出错的解决办法

一般出错是由于驱动版本与docker版本不一致导致，按照提示修改即可。

六、制作容器

1. 下载镜像

从网站下载已有镜像：hub.docker.com例如：在linux中输入： docker pull pytorch/pytorch
则会下载名字为pytorch/pytorch的镜像。注意：
1、镜像cuda版本需要和宿主机上cuda一致。
下载镜像时要根据cuda驱动与cuda工具包的版本选择相应的pytorch版本。例如你通过nvidia-smi获得的信息如下:
NVIDIA-SMI 410.93 Driver Version: 410.93 CUDA Version: 10.0
那么你需要选择：
docker pull pytorch/pytorch:1.2-cuda10.0-cudnn7-devel
或者
docker pull pytorch/pytorch:1.2-cuda10.0-cudnn7-runtime
2、runtime与devel版本选择
如果你需要编译cuda源代码，那么最好选择devel版本，这样cuda对应的工具、头文件、库等会在镜像中安装好了。如果选择了runtime版本，但你需要编译自己写的cuda源码，那么需要将宿主机上cuda目录映射到容器中，否则会提示找不到cuda头文件等。

2. 制作容器

例如：利用名字为pytorch/pytorch:latest的镜像创建名字为dv的容器
nvidia-docker run -itd --name dv pytorch/pytorch:latest /bin/bash 如果创建容器时要将docker的宿主机上目录映射到docker中，则：
//将目录 /home/test映射到docker中/home/test
nvidia-docker run -itd -v /home/test:/home/test --ipc=host --name dv pytorch/pytorch:latest /bin/bash如果创建容器时要将docker的宿主机上的多个目录映射到docker中，则：
//将目录 /home/test映射到docker中/home/test，将/usr/local/cuda映射到docker中的/usr/local/cuda
nvidia-docker run -itd -v /home/test:/home/test -v /usr/local/cuda:/usr/local/cuda --ipc=host --name dv pytorch/pytorch:latest /bin/bash注：有时当用命令：nvidia-docker run -itd --name dv pytorch/pytorch:latest /bin/bash 制作容器时，会出现如下错误：
/bin/bash: /bin/bash: cannot execute binary file
此时将命令中/bin/bash去除即可。

3. 启动并进入容器

例如：nvidia-docker start dv && nvidia-docker exec -it dv /bin/bash

4. 进入容器安装其他工具

自行安装即可。

5. 将安装新工具后的容器保存


5.1 将容器dv存为名字为pytorch/pytorch:v2的镜像
docker commit dv pytorch/pytorch:v2
5.2 将名字为pytorch/pytorch:v2的镜像存为名字为ver2.tar的文件，以备其他人复制使用
docker save -o ver2.tar pytorch/pytorch:v2

6. 加载别人做好的镜像

docker load -i ver2.tar #加载已存在的镜像文件ver2.tar

7. 一些docker命令

gpasswd -a xx docker #将账户xx加入docker组
newgrp docker        #将账户xx加入docker组后更新组docker ps -a         #查看容器
docker images        #查看镜像
docker rmi pytorch/pytorch:v2   #删除名字为pytorch/pytorch:v2的镜像
docker stop 9103045e5074        #停止id为9103045e5074的容器
docker rm 9103045e5074          #删除id为9103045e5074的容器

ubuntu卸载旧的NVIDIA驱动，安装新驱动，并安装Nvidia-docker2相关推荐

ubuntu卸载_ROS入门笔记（二）：ROS安装与环境配置及卸载（重点）
1 ROS安装步骤 1.1 ROS版本 ROS目前只支持在Linux系统上安装部署, 它的首选开发平台是Ubuntu. 注:如果Ubuntu版本和ROS版本不对应的话,安装就不会成功了- 笔者使用的平 ...
新中新电子f200a驱动安装_RX 5700显卡安装新驱动：待机风扇加速66％
AMD近日发布了19.7.3版显卡驱动,<德军总部:新血脉>性能提升最多13%,还在RX 5700系列上支持Radeon GPU Profiler.微软PIX,并扩大了Vulkan API ...
新安装的ubuntu启动root权限_炼铁厂焦炉新熄焦车制作安装工程全面启动
日前,由检修中心维修作业区承担的炼铁厂焦炉新熄焦车制作.安装工程全面启动. 由于长时间高温炙烤,焦炉原熄焦车车门.底板等部位破损严重,已不能满足正常生产需要.此次制作的新熄焦车钢结构件重30余吨,对原 ...
inter uhd graphics630显卡驱动_Intel新驱动已支持Win10 H2更新、11代酷睿狂喜
10月份又要到微软升级Windows 10系统了,Intel今天也发布了最新的核显驱动,支持Win10 H2更新,同时给11代酷睿的锐炬核显增加了多款游戏支持,包括最新的魔兽世界资料片. 以下是详细的 ...
linux图形驱动安装失败,红旗Linux 下NVIDIA的驱动安装问题
说明下,本人菜鸟,在一人指点下,在红旗Linux下成功安装NV驱动,现在把过程描述下: (一).在没装NV驱动情况下,可以用以下办法官方提供的安装流程大概说的如下: 1. 下载驱动,最新版NVIDI ...
[Ubuntu] 16.04 卸载旧内核并禁止内核更新
文章目录卸载旧内核查看当前内核版本查看已安装的内核版本 grub 启动项里面的所有内核卸载旧内核更新 grub 禁止内核更新卸载旧内核查看当前内核版本 uname -r 查看已安装的内核 ...
amd 安装 linux驱动怎么安装教程,请教,怎么在ubuntu里安装amd显卡驱动
AMD发布新版本时fglrx-updates驱动就会自动升级,但其实并不总是这样,因为Ubuntu的源的更新老是会有延迟.所以,你可以自己安装指定版本的专有驱动. 准备开始吧,在终端敲入以下命令: s ...
更新NVIDIA显卡的CUDA驱动出错，You appear to be running an X server; please exit X before
(一)错误信息: You appear to be running an X server; please exit X before... 原来,更新驱动需要关闭图形桌面.赶紧查看一下,是不是真的有 ...
关于服务器显卡驱动和Docker环境的安装
说明:关于显卡驱动的安装,主要有三步:1. gcc的安装,2. nouveau驱动的静止运行.3. 安装驱动关于daocker环境的安装,主要有两步,1. 安装docker 2.安装nvidia-d ...

ubuntu卸载旧的NVIDIA驱动，安装新驱动，并安装Nvidia-docker2

文章目录

一、Linux卸载并更新显卡驱动

1. 下载对应版本的驱动

2. 卸载已有驱动

3. 重启服务器

4. 安装新驱动

二、安装cuda

三、安装docker

四、安装nvidia-docker2

五、出错的解决办法

六、制作容器

1. 下载镜像

2. 制作容器

3. 启动并进入容器

4. 进入容器安装其他工具

5. 将安装新工具后的容器保存

6. 加载别人做好的镜像

7. 一些docker命令

ubuntu卸载旧的NVIDIA驱动，安装新驱动，并安装Nvidia-docker2相关推荐

最新文章

热门文章