windows10

GTX GeForce 1070+CUDA9.0+CUDNN7.6.4+TensorFlow_GPU1.5

5天星期前开始搭建tensorflow GPU环境,途中屡屡踩雷,

现在把环境已经完全搭好,

搭配版本如上

首先的首先,要知道你

  • 是否有独立显卡
  • 显卡是否能做深度学习

搭了一半的时候被告知我的显卡不能做深度学习,去网上查了一下,geforce显卡被英伟达禁止做深度学习,好在后来问了一下别的同学,其实也可以做,我的显卡内存8G,可用内存6G

接下来首要的任务,了解一下自己该配什么版本相关配置,可以简单参考一下,后面还会有讲到。

版本参考:https://blog.csdn.net/mangobar/article/details/93624545

搭建步骤:

  1. 更新nvidia显卡驱动到最新版本
  2. 下载合适版本的cuda
  3. 下载合适版本的cudnn
  4. 配置系统环境变量
  5. 卸载conda下的tensorflow,pip安装tensorflow_gpu。卸载一些conda包,改为pip重新安装

一、更新nvidia显卡驱动

1、查看自己的电脑显卡配置

方法一:控制面板>>nvidia控制面板

方法二:电脑左下角搜索>>nvidia control panel

界面如下:

我这里是更新过后的驱动版本

2、访问nvidia官网,查找适合显卡型号的驱动版本,下载

点击官网https://www.nvidia.cn/Download/index.aspx?lang=cn

3、安装显卡驱动

双击安装

中途不要安装geforce experience(自动更新驱动程序)经常自己更新不太好,我选择了精简版,默认安装

4、确认显卡驱动安装完毕

按照步骤一再次寻找自己的nvidia控制面板,

注意:如果用搜索能找得到,但是控制面板里面没有,这没有关系,下载最新驱动就是完成了

注意:如果搜索里面也找不到,就用下面的办法

windows10的这个程序有在windows应用商店手动下载

下载之后再检查一遍,就能找到这个图形界面了

或者

在cmd 中使用 nvcc-V命令

二、下载适合版本的CUDA

1、进入官网下载CUDAhttps://developer.nvidia.com/cuda-toolkit-archive

我选择了9.0版本的CUDA下载,

其余选项如下图:

2、安装CUDA,精简版。默认路径,如果自定义路径,要记得这些路径,一会儿配置环境变量需要

默认路径

软件:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0

DATA:C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0

3、检查是否安装成功

可以使用CUDA内置的deviceQuery.exe 和 bandwithTest.exe:
首先win+R启动cmd,cd到安装目录下的 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\demo_suite

,然后分别执行bandwidthTest.exedeviceQuery.exe,应该得到下面两图:

如果以上两步都返回了Result=PASS,那么就算成功啦。

三、下载适合版本的CUDNN

1、下载

下载cuDNN需要在nvidia上注册账号,免费下载。

cuDNN历史版本在该网址下载:https://developer.nvidia.com/rdp/cudnn-archive

我选择7.6.4版本

2、解压下载好的cuDNN,“cudnn-9.0-windows10-x64-v7.3.1.20”,将三个文件夹,拷贝到CUDA安装的根目录下。

拷贝到:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0

四、配置环境变量

1、正常情况下的配置

右键计算机>>属性>>高级系统设置>>高级>>环境变量>>系统变量>>

发现

加入以下变量

  • 变量名:CUDA_SDK_PATH                    变量值:C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0
  • 变量名:CUDA_LIB_PATH                      变量值:%CUDA_PATH%\lib\x64
  • 变量名:CUDA_BIN_PATH                     变量值:%CUDA_PATH%\bin
  • 变量名:CUDA_SDK_BIN_PATH            变量值:%CUDA_SDK_PATH%\bin\win64
  • 变量名:CUDA_SDK_LIB_PATH             变量值:%CUDA_SDK_PATH%\common\lib\x64

添加完成后:

然后:

在系统变量 PATH 的末尾再添加如下4条(默认安装路径):

  • C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\lib\x64;
  • C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin;
  • C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0\common\lib\x64;
  • C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0\bin\win64;

添加完成后:

而且系统变量path里面有2个值是自动生成的

2、不正常情况下的配置

如果不慎将系统变量path或其他变量的值删掉了或者覆盖了,找不回来了,有三种方法

第一种:

通过注册表挽回
1.win + R,打开运行,输入regedit,进入注册表。
2.定位至HYEK_LOCAL_MACHINE\SYSTEM\ControlSet001\Control\Session Manager\Environment
3.右键修改,将数值数据一栏全选,复制


4.右键此电脑-属性-高级系统设置-高级-环境变量
5.在系统变量里找到path,编辑(或编辑文本),粘贴

第二种:可以复制别人的path值

%SystemRoot%\system32;%SystemRoot%;%SystemRoot%\System32\Wbem;%SYSTEMROOT%\System32\WindowsPowerShell\v1.0\;

第三种:path变量值不记得,又不能直接复制他人的值。

可以将系统还原到上一个就近的还原点

右键点击计算机>>属性>>系统保护>>系统还原

选择还原点,下一步

选择就近的两天前的系统还原点,点击下一步,坐等就好了,中途可能要重启

最后发现原来的path又回来了!!!!

再重新配置系统变量

五、pip安装和conda卸载(如果你一直用python虚拟环境不用conda,可以省去)

1、卸载tensorflow

conda uninstall tensorflow,此版本默认cpu运行,必须卸载

2、安装GPU版本的tensorflow

pip install tensorflow-gpu==1.5

试验一下是否可用gpu:

在配置好的环境中,进入python,输入以下命令:

import tensorflow as tftf.test.gpu_device_name()

结果若出现,device:GPU:0,代表安装成功。

3、处理不兼容的包

conda uninstall numpy

conda uninstall scipy

conada uninstall scikit-learn

conda uninsall keras

然后

pip install numpy

pip install scipy

pip install scikit-learn

pip install keras

注意这里pip install 顺序numpy>>scipy>>scikit-learn

4、一些pip安装时报的错

  1. 缺少       ×××dist-info\\METADATA      文件:文件夹中找到这个包,删掉重下,或者,直接无视,或者,从其他python环境文件夹中将这个包的METADATA文件拷贝过来
  2. ModuleNotFoundError: No module named '_pywrap_tensorflow_internal'--解决方法https://blog.csdn.net/qq_36556893/article/details/86406455

  3. ImportError:DLL load failed:找不到指定模块的解决方法:查看报错行,将报错的模块conda uninstall然后pip install,还有它的依赖包也需要用pip重装

  4. 报错Could not install packages due to an EnvironmentError: [Errno 2] No such file or directory: 'C:\\Users\\asus\\AppData\\Local\\Temp\\pip-req-tracker-xmyu9uqv\\9b71a09296342e78a4dfb3ad80cf2411a9846b653bf0f4dc51d4c58e'

或者

Could not install packages due to an EnvironmentError

解决方法是 在install后面 加上 --user:pip install --user

5.Could not install packages due to an EnvironmentError: [Errno 2] No such file or directory: …

参考stackoverflow的回答:

conda install html5lib

https://stackoverflow.com/questions/53901270/could-not-install-packages-due-to-an-environmenterror-errno-2-no-such-file-or

6.导入Keras库时报错“ ImportError: cannot import name 'tf_utils'”:

conda uninstall keras;    pip install keras

https://blog.csdn.net/Leeoo_lyq/article/details/103794226

7.cannot import name 'descriptor':

卸载TensorFlow;卸载protobuf(如果已安装protobuf);重新安装TensorFlow,自动安装正确的protobuf依赖项。

https://stackoverflow.com/questions/42006320/tensorflow-pip-installation-issue-cannot-import-name-descriptor

终于搞定,原先用cpu进行深度学习训练,epoch=32时,程序崩坏

现在用epoch=46时,达到earlystop,完美

用了4天搞定,解决了各种踩雷挖坑,必须写下来这苦闷的5天所干的事

然后,还是习惯性结尾——

欢迎交流~~!

windows10:GTX GeForce 1070+更新nvidia显卡驱动+CUDA+CUDNN+tensorflow_gpu深度学习GPU环境搭建(史上排雷最多版本)相关推荐

  1. Jetson Nano开发深度学习实践(六) :工作站(主机)装机-NVIDIA显卡驱动,Cuda,Cudnn

    最近多了很多点赞和关注,非常感谢支持.本意是将最近开发过程中遇到的问题记录一下,如果你觉得有些启发将荣幸之至.应博客内评论的请求,穿插一张主机工作站的装机操作,毕竟nano进行推理的边缘计算端,大多数 ...

  2. ubuntu20.04 RTX2060||nvidia显卡驱动|cuda|cudnn|pytorch

    安装显卡驱动 自动安装: ubnutu-drivers devices sudo ubuntu-drivers autoinstall 软件与更新->驱动->安装专有最新版本 cuda11 ...

  3. conda cudnn版本升级_ubuntu18.04系统下NVIDIA显卡驱动+cuda+cudnn安装+conda虚拟环境配置...

    深度学习的显卡环境配置是一个非常麻烦的问题,理论上这是一个深度学习开发必须要面临的问题,那么教程就应该很多,后人学习起来的时候应该会很容易,实际上却是教程良莠不齐,而且很多教程往往是针对特定显卡的,但 ...

  4. Ubuntu22 Linux 服务器安装显卡驱动,cuda,cudnn和pytorch

    Ubuntu22 Linux 服务器安装显卡驱动,cuda,cudnn和pytorch 1. 首先了解自己服务器的操作系统内核版本等信息: (1)查看操作系统的版本信息:cat /etc/issue或 ...

  5. windows7系统,NVIDIA GeForce GTX 750 Ti 2G显卡搭建caffe、TensorFlow、Keras深度学习GPU环境

    windows7系统,NVIDIA GeForce GTX 750 Ti 2G显卡搭建caffe.TensorFlow.Keras深度学习GPU环境 事情的由来 第一步,你得先有个windows7操作 ...

  6. 【亲测】Ubuntu16.04手动安装nvidia显卡驱动+CUDA 8.0--Acer E5-572G版

    前言 前段时间,配置实验室新服务器上的Tesla P4,结果一直有问题,最后终于解决之后.昨天晚上想在自己的笔记本上安装pytorch,sudo apt-get update的时候,结果提示系统缺少一 ...

  7. NVIDIA 显卡驱动CUDA ToolkitcuDNN下载地址

    NVIDIA 显卡驱动&CUDA Toolkit&cuDNN下载地址 1.驱动下载 中文网址:https://www.nvidia.cn/Download/index.aspx?lan ...

  8. Ubuntu 16.04 + Nvidia 显卡驱动 + Cuda 8.0 (问题总结 + 解决方案)

    Ubuntu 16.04 + Nvidia 显卡驱动 + Cuda 8.0 (问题总结 + 解决方案) 安装Nvidia驱动出现的问题 问题主要是三种,(1)循环登录,也就是登录之后在退出来到登录界面 ...

  9. Ubuntu 20.04 安装NVIDIA显卡驱动+cuda 11.7+cudnn 8.4

    Ubuntu 18.04 安装NVIDIA显卡驱动+cuda 10.2+cudnn 本机环境 1 相关查询命令 一.Ubuntu 20.04 安装NVIDIA显卡驱动 二.Ubuntu 20.04 安 ...

最新文章

  1. java docx4j 合并word_利用docx4j来处理word的合并与拆分
  2. 2020-07-07 内模原理(The Internal Mode Principle)
  3. CF1540B Tree Array(期望,dp)
  4. c语言程序实际问题,《编程解决问题之程序规划语言(c语言)》.doc
  5. 【Docker】docker设置固定ip地址
  6. Photoshop小技巧集锦八十条
  7. CentOS7/RHEL7 systemd详解
  8. Java 设计模式 之 观察者模式(Observer)
  9. torchdiffeq中odeint函数的输入输出参数分析
  10. 这3款在线PS工具,得试试
  11. python GPS解析,坐标转换,两经纬度直线距离,方位角
  12. 含有一般疑问句的歌_一般疑问句,特殊疑问句和否定句
  13. Ubuntu 20.04.2.0 LTS 下安装Geany 1.36的命令列表
  14. 【洛谷 P4408】逃学的小孩【树的直径】
  15. python绘制动态心电图_东软医院收费端使用手册.doc
  16. 关于STM32F103 TIM2重映射
  17. 有关计算机基础的论文,有关计算机基础论文范文
  18. MOSFET(二):米勒效应
  19. 城市交通指挥与应急疏导广播系统解决方案
  20. VMware安装vmtools后不能粘贴复制和拖拽文件

热门文章

  1. 实验二:熟悉常用的HDFS操作
  2. 《十二生肖的文创(下)》|看毛球科技如何玩转NFT文创新理念
  3. NFS,RS宕机问题
  4. 第二次 作业——APP案例分析
  5. Java实现 LeetCode 638 大礼包(阅读理解题,DFS)
  6. 财务人日常要用到的10大网站,这次给你整全了!
  7. Linux 清理buff/cache缓存
  8. 彩色牛顿摆球Canvasjs特效
  9. 微信小程序在网络差情况下打不开?后台优化处理思路
  10. sketch android 切图,sketch mac怎么切图 sketch mac切图基础教程