ubuntu卸载旧的NVIDIA驱动,安装新驱动,并安装Nvidia-docker2
文章目录
- 一、Linux卸载并更新显卡驱动
- 1. 下载对应版本的驱动
- 2. 卸载已有驱动
- 3. 重启服务器
- 4. 安装新驱动
- 二、安装cuda
- 三、安装docker
- 四、安装nvidia-docker2
- 五、出错的解决办法
- 六、制作容器
- 1. 下载镜像
- 2. 制作容器
- 3. 启动并进入容器
- 4. 进入容器安装其他工具
- 5. 将安装新工具后的容器保存
- 6. 加载别人做好的镜像
- 7. 一些docker命令
一、Linux卸载并更新显卡驱动
1. 下载对应版本的驱动
https://www.nvidia.com/Download/index.aspx?lang=en-us
2. 卸载已有驱动
sudo sh NVIDIA-Linux-x86_64-450.80.02.run --uninstall
或
sudo /usr/bin/nvidia-uninstall
3. 重启服务器
sudo reboot
4. 安装新驱动
sudo sh NVIDIA-Linux-x86_64-450.80.02.run注:安装后提示
To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-11.1/bin
To uninstall the NVIDIA Driver, run nvidia-uninstall
二、安装cuda
提示安装驱动时,选择no,其他yes、默认即可。
三、安装docker
# step 1: 安装必要的一些系统工具
sudo apt-get update
sudo apt-get -y install apt-transport-https ca-certificates curl software-properties-common
# step 2: 安装GPG证书
curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add -
# Step 3: 写入软件源信息
sudo add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable"
# Step 4: 更新并安装 Docker-CE
sudo apt-get -y update
sudo apt-get -y install docker-ce
四、安装nvidia-docker2
# 清理以前的。If you have nvidia-docker 1.0 installed: we need to remove it and all existing GPU containers
sudo docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f
sudo apt-get purge -y nvidia-docker
sudo apt autoremove# 执行命令。Add the package repositories
# command 1
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \sudo apt-key add -# command 2
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)# command 3
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update# 正式安装。Install nvidia-docker2 and reload the Docker daemon configuration
sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP dockerd# 测试一下。 Test nvidia-smi with the latest official CUDA image
sudo docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi#如果已经安装过,并且知道版本,例如服务器上已经安装了cuda10.0,则如下进行测试是否可用。
sudo docker run --runtime=nvidia --rm nvidia/cuda:10.0-base nvidia-smi
此处cuda:10.0-base 可以根据自己实际换成cuda:10.0-runtime、cuda:10.0-devel,分别代表基本版,运行时、开发
五、出错的解决办法
一般出错是由于驱动版本与docker版本不一致导致,按照提示修改即可。
六、制作容器
1. 下载镜像
从网站下载已有镜像:hub.docker.com例如:在linux中输入: docker pull pytorch/pytorch
则会下载名字为pytorch/pytorch的镜像。注意:
1、镜像cuda版本需要和宿主机上cuda一致。
下载镜像时要根据cuda驱动与cuda工具包的版本选择相应的pytorch版本。例如你通过nvidia-smi获得的信息如下:
NVIDIA-SMI 410.93 Driver Version: 410.93 CUDA Version: 10.0
那么你需要选择:
docker pull pytorch/pytorch:1.2-cuda10.0-cudnn7-devel
或者
docker pull pytorch/pytorch:1.2-cuda10.0-cudnn7-runtime
2、runtime与devel版本选择
如果你需要编译cuda源代码,那么最好选择devel版本,这样cuda对应的工具、头文件、库等会在镜像中安装好了。如果选择了runtime版本,但你需要编译自己写的cuda源码,那么需要将宿主机上cuda目录映射到容器中,否则会提示找不到cuda头文件等。
2. 制作容器
例如:利用名字为pytorch/pytorch:latest的镜像创建名字为dv的容器
nvidia-docker run -itd --name dv pytorch/pytorch:latest /bin/bash 如果创建容器时要将docker的宿主机上目录映射到docker中,则:
//将目录 /home/test映射到docker中/home/test
nvidia-docker run -itd -v /home/test:/home/test --ipc=host --name dv pytorch/pytorch:latest /bin/bash如果创建容器时要将docker的宿主机上的多个目录映射到docker中,则:
//将目录 /home/test映射到docker中/home/test,将/usr/local/cuda映射到docker中的/usr/local/cuda
nvidia-docker run -itd -v /home/test:/home/test -v /usr/local/cuda:/usr/local/cuda --ipc=host --name dv pytorch/pytorch:latest /bin/bash注:有时当用命令:nvidia-docker run -itd --name dv pytorch/pytorch:latest /bin/bash 制作容器时,会出现如下错误:
/bin/bash: /bin/bash: cannot execute binary file
此时将命令中/bin/bash去除即可。
3. 启动并进入容器
例如:nvidia-docker start dv && nvidia-docker exec -it dv /bin/bash
4. 进入容器安装其他工具
自行安装即可。
5. 将安装新工具后的容器保存
5.1 将容器dv存为名字为pytorch/pytorch:v2的镜像
docker commit dv pytorch/pytorch:v2
5.2 将名字为pytorch/pytorch:v2的镜像存为名字为ver2.tar的文件,以备其他人复制使用
docker save -o ver2.tar pytorch/pytorch:v2
6. 加载别人做好的镜像
docker load -i ver2.tar #加载已存在的镜像文件ver2.tar
7. 一些docker命令
gpasswd -a xx docker #将账户xx加入docker组
newgrp docker #将账户xx加入docker组后更新组docker ps -a #查看容器
docker images #查看镜像
docker rmi pytorch/pytorch:v2 #删除名字为pytorch/pytorch:v2的镜像
docker stop 9103045e5074 #停止id为9103045e5074的容器
docker rm 9103045e5074 #删除id为9103045e5074的容器
ubuntu卸载旧的NVIDIA驱动,安装新驱动,并安装Nvidia-docker2相关推荐
- ubuntu卸载_ROS入门笔记(二):ROS安装与环境配置及卸载(重点)
1 ROS安装步骤 1.1 ROS版本 ROS目前只支持在Linux系统上安装部署, 它的首选开发平台是Ubuntu. 注:如果Ubuntu版本和ROS版本不对应的话,安装就不会成功了- 笔者使用的平 ...
- 新中新电子f200a驱动安装_RX 5700显卡安装新驱动:待机风扇加速66%
AMD近日发布了19.7.3版显卡驱动,<德军总部:新血脉>性能提升最多13%,还在RX 5700系列上支持Radeon GPU Profiler.微软PIX,并扩大了Vulkan API ...
- 新安装的ubuntu启动root权限_炼铁厂焦炉新熄焦车制作安装工程全面启动
日前,由检修中心维修作业区承担的炼铁厂焦炉新熄焦车制作.安装工程全面启动. 由于长时间高温炙烤,焦炉原熄焦车车门.底板等部位破损严重,已不能满足正常生产需要.此次制作的新熄焦车钢结构件重30余吨,对原 ...
- inter uhd graphics630显卡驱动_Intel新驱动已支持Win10 H2更新、11代酷睿狂喜
10月份又要到微软升级Windows 10系统了,Intel今天也发布了最新的核显驱动,支持Win10 H2更新,同时给11代酷睿的锐炬核显增加了多款游戏支持,包括最新的魔兽世界资料片. 以下是详细的 ...
- linux图形驱动安装失败,红旗Linux 下NVIDIA的驱动安装问题
说明下,本人菜鸟,在一人指点下,在红旗Linux下成功安装NV驱动,现在把过程描述下: (一).在没装NV驱动情况下,可以用以下办法 官方提供的安装流程大概说的如下: 1. 下载驱动,最新版NVIDI ...
- [Ubuntu] 16.04 卸载旧内核并禁止内核更新
文章目录 卸载旧内核 查看当前内核版本 查看已安装的内核版本 grub 启动项里面的所有内核 卸载旧内核 更新 grub 禁止内核更新 卸载旧内核 查看当前内核版本 uname -r 查看已安装的内核 ...
- amd 安装 linux驱动怎么安装教程,请教,怎么在ubuntu里安装amd显卡驱动
AMD发布新版本时fglrx-updates驱动就会自动升级,但其实并不总是这样,因为Ubuntu的源的更新老是会有延迟.所以,你可以自己安装指定版本的专有驱动. 准备开始吧,在终端敲入以下命令: s ...
- 更新NVIDIA显卡的CUDA驱动出错,You appear to be running an X server; please exit X before
(一)错误信息: You appear to be running an X server; please exit X before... 原来,更新驱动需要关闭图形桌面.赶紧查看一下,是不是真的有 ...
- 关于服务器显卡驱动和Docker环境的安装
说明:关于显卡驱动的安装,主要有三步:1. gcc的安装,2. nouveau驱动的静止运行.3. 安装驱动 关于daocker环境的安装,主要有两步,1. 安装docker 2.安装nvidia-d ...
最新文章
- 原生JS和jQuery操作DOM的区别小结
- 计算机管理与维护实践课程,天津2012年自考“计算机维护维修(实践)”课程考试大纲...
- 【网络基础】 PAUSE帧总结
- vue学习—Convert HTML string to AST,如何将html字符串转换为ast数组结构
- linux ftp服务器已拒绝访问,linux ftp服务器已拒绝
- C语言-05内存剖析
- apache配置好后编译rewrite
- 记一次针对Centos的入侵分析
- java项目中遇到的幂等性问题
- GoogleEarth的安装与使用
- SVN、GIT图标不显示解决方案
- python 自动换ip_python实现自动更换ip的方法
- 基于LSTM-Attention模型的光伏电站发电量预估(1)
- Android 图片毛玻璃的实现方法
- 电脑游戏计算机哪年发明的,电子计算机发明于哪一年
- kali liunx使用心得之命令行模式下如何配置连接无线网络
- 朝花夕拾:Java中实现对EXCEL文件的读取
- 加入域时提示“不能访问网络位置”
- Win32学习笔记 第三章 HelloWin 选择自 villager 的 Blog
- 这能忍?阿里、京东、腾讯、百度联合出手了!!