(1)查看torch版本,及其是否与cuda版本是否匹配:

(2)查看cuda是否还存在以及cuda的版本

(3)查看显卡驱动是否正常

(4)安装显卡驱动--这一步可能不需要执行

(5)解决显卡驱动问题

(6) 测试cuda是否可用


好久没使用cuda,今天需要使用cuda,但是报错了,

>>> print(torch.cuda.is_available())
False

下面记录排查和解决步骤:

(1)查看torch版本,及其是否与cuda版本是否匹配

>>> import torch
>>> print(torch.__version__)
1.7.1+cu110

当时是按照torch官网上面的命令安装的,torch和cuda的版本是匹配的版本,如上所示,其中torch版本为对应cuda为11.0的1.7.1版本

(2)查看cuda是否还存在以及cuda的版本

nvcc -V

如下所示,可以看出cuda版本确实为11.0

meng@meng:~/ideas/python_kit/pytorch$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Thu_Jun_11_22:26:38_PDT_2020
Cuda compilation tools, release 11.0, V11.0.194
Build cuda_11.0_bu.TC445_37.28540450_0

(3)查看显卡驱动是否正常

nvidia-smi
meng@meng:~/ideas/python_kit/pytorch$ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

没有出现显卡驱动的信息内容,我第一印象是显卡驱动可能被删了,或者出错了

(4)安装显卡驱动--这一步可能不需要执行

(注:这里采用“系统推荐”这个流程来重新安装显卡驱动)

查看推荐版本,为nvidia-driver-470(查看驱动与cuda的版本要求,470符合cuda-11.0的要求)

ubuntu-drivers devices
meng@meng:~/ideas/python_kit/pytorch$ ubuntu-drivers devices
WARNING:root:_pkg_get_support nvidia-driver-510-server: package has invalid Support PBheader, cannot determine support level
WARNING:root:_pkg_get_support nvidia-driver-510: package has invalid Support PBheader, cannot determine support level
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00002484sv00001462sd00003906bc03sc00i00
vendor   : NVIDIA Corporation
driver   : nvidia-driver-470-server - distro non-free
driver   : nvidia-driver-510-server - distro non-free
driver   : nvidia-driver-510 - distro non-free
driver   : nvidia-driver-470 - distro non-free recommended
driver   : xserver-xorg-video-nouveau - distro free builtin== /sys/devices/pci0000:00/0000:00:14.3 ==
modalias : pci:v00008086d000043F0sv00008086sd00000074bc02sc80i00
vendor   : Intel Corporation
manual_install: True
driver   : backport-iwlwifi-dkms - distro free

安装推荐版本:

sudo ubuntu-drivers autoinstall

中途可能需要执行

sudo apt-get update
或
sudo apt-get update --fix-missing

测试安装效果,又回到“(3)查看显卡驱动是否正常”

meng@meng:~/ideas/python_kit/pytorch$ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

(5)解决显卡驱动问题

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running

是一个常见问题,经常出现在ubuntu系统中,主要原因还是系统内核升级了,导致新版本内核和原来显卡驱动不匹配

查看nvidia版本号,我这里出现了两个版本号:

ll /usr/src/

安装dkms

sudo apt-get install dkms

匹配内核与显卡驱动:因为上面查看得到的nvidia版本号有两个,而“(4)安装显卡驱动--这一步可能不需要执行”中下载的先看驱动为470

先尝试让470版本与系统内核建立匹配--出错

尝试用495版本的----居然通了(不知为什么成了???)

 sudo dkms install -m nvidia -v 495.46

查看显卡驱动是否正常:--正常

(6) 测试cuda是否可用

重新打开一个终端,并进入python环境----cuda可用!!!

程序也可以跑通了:

参考链接:【NVIDIA】显卡报错:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver__Hyomin_LL的博客-CSDN博客

深度学习(16):print(torch.cuda.is_available()) False的一个解决流程/思路相关推荐

  1. 记录一次 torch.cuda.is_available()==false的问题解决过程

    今天发现 torch.cuda.is_available()==false 无法初始化GPU进行训练. 于是着手开始检查torch的版本和cuda的版本 检查torch的版本 输入python > ...

  2. Cuda CuDnn Pytorch 安装 print(torch.cuda.is_available())输出报错。NVDIA 940MX

    这个问题来源于我想用我电脑的古董显卡跑一个开源程序,结果测试的时候下面的代码输出False,我就无法用显卡跑. import torch print(torch.cuda.is_available() ...

  3. cuda11.2安装pytorch——torch.cuda.is_available()=false

    这两天正在用服务器跑程序,但是发现运行速度极慢,查看正在运行的进程,也没看到自己的进程,但是程序又确确实实在运行,这就奇了怪了,一通查找,发现程序竟然是在CPU上运行,也就是 torch.cuda.i ...

  4. 安装pytorch报错torch.cuda.is_available()=false的解决方法

    问题介绍 在安装torch之后,命令行(Anaconda Powershell Prompt)运行这三行代码: python # python import torch torch.cuda.is_a ...

  5. WIN10环境下深度学习中使用torch时无法启用GPU的一些坑

    使用DeepCTR-zorch来进行深度学习时, torch.cuda.is_available() 返回值总是false而导致无法使用GPU来进行计算.这对笔者这拥有号称卡皇1080Ti的人来说,简 ...

  6. 稀里糊涂的解决了 cuda 和cudnn的安装以及conda安装pytorch出现的torch.cuda.is_available()为false的问题

    参考的链接: https://blog.csdn.net/ashome123/article/details/105822040#commentBox  Ubuntu 20.04 CUDA&c ...

  7. torch.cuda.is_available()返回false?

    问题描述: >>python >>import torch >>torch.cuda.is_available() >>false 解决措施: 1.检查 ...

  8. 深度学习环境搭建之cuda、cudnn以及pytorch和torchvision的whl文件安装方法

    一.前言 假设已经装好了pycharm.anaconda,并且新建了一个conda虚拟环境(我的虚拟环境名为pytorch).接下来需要安装新版的显卡驱动,安装cuda.cudnn.pytorch和t ...

  9. 深度学习系列错误笔记(一)之print(‘gpu‘,torch.cuda.is_available())输出gpu False

    0.问题出现背景 ps: win10 64位环境.cuda已经安装,显卡驱动版本472对应torch1.8.0版本对应cuda10.2版本都没问题. 因为硬盘坏了,所以从头开始装按照深度学习系列(一) ...

最新文章

  1. python 创建只读的函数(@property的介绍与使用)
  2. 关于IE记录Cookie的问题
  3. linux64bit安装mysql、jdk、nodejs、nginx笔记
  4. java反序列化时区,Jackson使用Java 8将Elasticsearch反序列化为LocalDateTime
  5. 2020湖南省技能竞赛获奖名单_高光时刻!肇庆市中等职业学校学生专业技能竞赛获奖名单公布~...
  6. mysql导出成execl
  7. python数值分为3种类型_Python数值类型
  8. android游戏源码
  9. 支付宝、京东支付场景之策略模式实战
  10. 豆瓣评分9.3!运动规划圣经,自动驾驶学习必备书!
  11. 视频教程-2021软考软件设计师--基础知识培训视频-软考
  12. xdroid on linux 黑屏,常见问题及解决方案
  13. Matplotlib 25张图,数据分析可视化利器,不收藏女友要和我分手
  14. P5960 【模板】差分约束算法
  15. Win10下使用nvm安装多个版本node.js
  16. 构建一个额外的语义网络进行关键词生成
  17. js根据IP地址获取当前的省市
  18. AGV的关键技术与细节
  19. hadoop 错误锦集
  20. pdb怎么调试python_如何在用pdb调试python时更改值?

热门文章

  1. Linux 系统进程、线程之间的爱恨纠葛
  2. 常见的考勤管理系统有哪些功能?
  3. AWS-小型企业-服务架构设计
  4. python植物大战僵尸 豆约翰,python植物大战僵尸六之添加僵尸
  5. HDU1814 Peaceful Commission 2SAT
  6. 不止SQL优化,数据库还有哪些优化大法?
  7. cad中简单流程图制作_如何制作流程图,word快速生成流程图技巧
  8. 迅为iTop4412精英板运行QT程序触摸/鼠标失灵
  9. PHP 之道中文简体版
  10. 代码随想录贪心算法——买卖股票的最佳时机含手续费