最近开始配置自己的深度学习主机,由于之前只在笔记本上和单显卡主机上安装过,所以可以说是zero经验,以至于很多问题不了解都当成了bug,故为了方便以后的自己以及大众,特在此写下post一篇。(由于可能会有很多的问题我没有遇到但各位可能遇到,故在文末贴出其他的安装链接,请自取)

~~~~~~~~~~~~~~~~~~~~华丽丽分割线~~~~~~~~~~~~~~~~~~~~

一、ubuntu16.04安装

1.首先当然是系统盘的制作,这个不作赘言,一般使用 UltraISO,具体度娘会告诉你;

2.紧接着就是安装,如何安装,如何分区,度娘也会一一告知,此处就说几个不同之处:

1)首先,带有独立显卡的主机,通常有独显输出和集显输出两种端口,而独显是需要安装驱动才可以使用的,所以最初装系统的时候需要使用集显输出的端口,否则你可能完全进不去安装界面

2)其次,在BOOT界面选择启动项的时候,对U盘启动会出现两个选项,第一个带有前缀UEFI,另一个这没有。这是因为现在的主板驱动一般有 BIOS 和 UEFI 两种,虽说 UEFI 是BIOS 的继任者,但 BIOS 才用起来 更加顺手。更重要的是在用UEFI模式进行ubuntu16.04安装的时候,在安装后期会出现bug中断,具体什么不记得了,与grub有关,会导致系统无法启动,而这与UEFI有莫大的关系,所以安全起见,选后不带UEFI前缀的,也就是BIOS模式进行系统安装;

3)ubuntu16.04 安装好之后,启动可能会出现 grub rescue 故障,找不到 normal.mod,这可以通过我的另一篇 post 解决,附上解救指南:ubuntu系统下grub rescue故障恢复

3.至此,ubuntu16.04 算是安装完毕,第一次撒花o(∩_∩)o

注:需要注意的是,目前我们也一直在使用集成显卡输出!且直到安装好nvidia驱动重启都要一直使用集成显卡输出!!!

二、各种依赖环境安装:

sudo apt-get updatesudo apt-get upgradesudo apt-get install -y build-essential cmake git pkg-configsudo apt-get install -y libprotobuf-dev libleveldb-dev libsnappy-dev libhdf5-serial-dev protobuf-compilersudo apt-get install -y libatlas-base-dev sudo apt-get install -y --no-install-recommends libboost-all-devsudo apt-get install -y libgflags-dev libgoogle-glog-dev liblmdb-dev# (Python general)
sudo apt-get install -y python-pip# (Python 2.7 development files)
sudo apt-get install -y python-dev
sudo apt-get install -y python-numpy python-scipy# (or, Python 3.5 development files)
sudo apt-get install -y python3-dev
sudo apt-get install -y python3-numpy python3-scipy# (OpenCV 2.4)
sudo apt-get install -y libopencv-dev(or, OpenCV 3.X - see other blogs in the end of the post)

以上是caffe官方安装指南的内容,亲测好用无疑,其实文末的caffe官方安装指南还是很不多错的指南,只是在nvidia驱动、cuda、cudnn、open3.x方面很不足(貌似这些都是重点内容,结果都被caffe官方文档屏蔽了,手动滑稽(*^__^*) )

注:在upgrade时,可能会提起缺少fireware,这个不是大问题,直接上网下载相应版本的固件安装即可

三、Nvidia驱动+cuda安装

写在安装前:

1)其实在cuda的安装中会涉及到nvidia驱动的安装,但是屡次尝试,总是会出现kernel souce的error,所以,还是提前安装为好。

2)安装nvidia驱动需要在命令行模式下,但有时可能会出现无法进入命令行或者进入命令行黑屏及显示nouveau相关的error提示,这是可通过以下的改动进行修复,重启后可能会出现屏幕显示非常延迟卡顿的现象,这正常,因为我们把显示驱动修改了。不过建议把需要的nvidia驱动、cuda和cudnn都下载好后再进行处理,否则如此卡顿会很忧伤的o(∩_∩)o

sudo gedit /etc/default/grub# set GRUB_CMDLINE_LINUX_DEFAULT = "quiet splash nomodeset"sudo update-grubsudo reboot

1.下载需要的nvidia驱动程序(下载最新的即可),附上飞行链接:NVIDIA驱动程序下载

2.下载需要的cuda程序,下载runfile版本的,同样附上飞行链接:CUDA下载

2.卸载之前安装的nvidia驱动程序,新安装的系统不需要的这一步,但依旧写在此以告后人,因为nvidia驱动重复安装会出现循环登录无法进入系统的问题,或者反过来说,循环登录无法进入系统一般都是由于显卡驱动出现问题导致的,卸载后重新安装即可(如何卸载重装)

sudo apt-get remove –purge nvidia*

3.禁用nouveau,其实这一步可能并不需要,因为在厂商安装的原始系统中并没有相关文件,我想可能是因为我们的集成显卡和独立显卡分别有各自的输出端口,可以自主插拔选择显示使用的显卡,而在笔记本等上面,两种显卡是同时连接的,故需要进行禁用:

sudo gedit /etc/modprobe.d/blacklist-nouveau.conf# add blacklist nouveau option nouveau modeset=0 sudo update-initramfs -u

再配置环境

sudo gedit ~/.bashrc# add the following two linesexport LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATHexport LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH source ~/.bashrc

4.开始正式安装驱动

1)进入命令行模式(Ctrl+Alt+F1),并关闭桌面

sudo service lightdm stop

2)  进入驱动文件所在目录,修改文件权限(可选),然后执行文件

sudo chmod a+x NVIDIA-Linux-x86_64-375.26.run  # optionalsudo bash ./NVIDIA-Linux-x86_64-375.26.run

3)安装过程中开始会提示一个预安装script安装失败,问你要continue 还是abort,点击 continue就行,不用管。

5.进入cuda安装文件的文件夹,安装cuda

sudo sh cuda_8.0.61_375.26_linux.run

1)在选择是否安装nvidia驱动时,选‘n’,因为我们已经安装好了

2)在选择安装cuda samples,选 ‘n’,因为不需要

3)其余选项选择‘y’,或默认就行了

4)安装成功后,关机(命令为 shutdown -h now),更换显示输出端口为独立显卡的输出端后再启动;此处如果直接重启(sudo reboot)的话,由于未更换显示输出端口,而原驱动被禁用等原因,会出现循环登录的情况,此时强行关机再更换显示输出端口即可。

6.启动后配置cuda环境变量

1)一般配置此步即可,但有时会出现问题,可以选择用root用户进行编辑,也可以尝试后两步

gedit ~/.bashrc  # if can't edit, add sudo before# add the two lines followingexport PATH=/usr/local/cuda/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH# cuda can change as cuda-8.0 specificallysource ~/.bashrc  # MUST source

2)

sudo gedit /etc/ld.so.conf.d/cuda.conf# add the two lines following/usr/local/cuda/lib64/libsudo ldconfig -v

3)

sudo gedit /etc/profile  # add following two linesPATH=/usr/local/cuda/bin:$PATH  #  不能有空格!! export PATH  source /etc/profile

7.验证是否安装成功:

cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuerysudo make./deviceQuery

四、安装cudnn

1.下载对应cuda版本的cudnn,可以去官网下载,需要注册;不想注册的可以从网盘下载,网盘有5.1和6.0,建议下载cudnn 6.0(tensorflow要求6.0);也可以用下面的命令行下载:

wget http://developer.download.nvidia.com/compute/redist/cudnn/v6.0/cudnn-8.0-linux-x64-v6.0.tgz

2.下载后解压,得到cuda文件夹,里面有include和lib64两个子文件夹

3.进入include子文件夹

sudo cp cudnn.h /usr/local/cuda/include/  # 复制头文件到之前安装的cuda目录

4.进入lib64子文件夹,可以图形界面进入看清楚版本号,方便后期修改

sudo cp lib* /usr/local/cuda/lib64/  # 复制动态链接库到之前安装的cuda目录,注意查看

5.重新生成软链接

cd /usr/local/cuda/lib64/sudo rm -rf libcudnn.so libcudnn.so.x  # 删除原有动态文件,版本号注意变化,可在cudnn的lib64文件夹中查看sudo ln -s libcudnn.so.x.x.x libcudnn.so.x  # 生成软衔接,具体看cudnn的lib64中为什么版本,注意变化sudo ln -s libcudnn.so.x libcudnn.so  # 生成软链接sudo ldconfig -v

6.验证安装cudnn后cuda是否依旧可用

nvcc --version  # or nvcc -V

五、安装caffe

1.下载caffe,此处下载caffe-master源码,并解压至任何地方即可;

2.进入caffe根目录,进行配置,文件中对每项设置都有注释,看看基本能懂

sudo cp Makefile.config.example Makefile.configsudo gedit ./Makefile.config

配置好后,Makefile.config会包含以下有效内容

USE_CUDNN := 1
CUDA_DIR := /usr/local/cuda    # or cuda-8.0
CUDA_ARCH := -gencode arch=compute_20,code=sm_20 \-gencode arch=compute_20,code=sm_21 \-gencode arch=compute_30,code=sm_30 \-gencode arch=compute_35,code=sm_35 \-gencode arch=compute_50,code=sm_50 \-gencode arch=compute_52,code=sm_52 \-gencode arch=compute_60,code=sm_60 \-gencode arch=compute_61,code=sm_61 \-gencode arch=compute_61,code=compute_61
BLAS := atlas
PYTHON_INCLUDE := /usr/include/python2.7 \/usr/lib/python2.7/dist-packages/numpy/core/include \/usr/local/lib/python2.7/dist-packages/numpy/core/include
PYTHON_LIB := /usr/lib
WITH_PYTHON_LAYER := 1
INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include /usr/include/hdf5/serial/
LIBRARY_DIRS := $(PYTHON_LIB) /usr/local/lib /usr/lib /usr/lib/x86_64-linux-gnu /usr/lib/x86_64-linux-gnu/hdf5/serial/
BUILD_DIR := build
DISTRIBUTE_DIR := distribute
TEST_GPUID := 0
Q ?= @

3.进一步更改配置

sudo gedit ./Makefile# replace this lineNVCCFLAGS += -ccbin=$(CXX) -Xcompiler -fPIC $(COMMON_FLAGS)
# with the following lineNVCCFLAGS += -D_FORCE_INLINES -ccbin=$(CXX) -Xcompiler -fPIC $(COMMON_FLAGS)

并打开CMakelists.txt添加一下内容

# ---[ Includes
set(${CMAKE_CXX_FLAGS} "-D_FORCE_INLINES ${CMAKE_CXX_FLAGS}")

4.为hdf5添加软连接,ubuntu16.04的某些升级之后,此步不再需要,但安全起见依然进行

cd /usr/lib/x86_64-linux-gnusudo ln -s libhdf5_serial.so.10.1.0 libhdf5.so  # 源文件的版本可能有所不同,可进入文件夹进行查看后再确定sudo ln -s libhdf5_serial_hl.so.10.0.2 libhdf5_hl.so 

5.安装需要的python模块,先进入caffe根目录(可以以root用户运行,避免出现一些权限问题)

cd pythonfor req in $(cat requirements.txt); do pip install $req; done

如果有任何问题,可以再次执行以下命令

for req in $(cat requirements.txt); do sudo -H pip install $req --upgrade; done

6.开始正式编译caffe

make all -j8

7.编译成功后,进行验证,没有错误即安装成功,大大地撒花o(∩_∩)o

make runtest -j8

注:有的时候可能会出现找不到cuda相关的文件,可以直接进入cuda安装目录进行确认,一般都是存在的,可能是环境没有配置好,可以使用root用户重新配置环境并用root用户运行runtest,或者重启,一般都不会有大问题

六、编译其他结构

可以编译caffe的matlab和python接口,此处我们只编译python接口

1.直接进入caffe根目录,编译pycaffe

make pycaffe -j8

2.配置环境

sudo gedit ~/.bashrc# add the following line
export PYTHONPATH=/path/to/caffe-master/python:$PYTHONPATHsource ~/.bashrc

3.测试pycaffe

python>>> import caffe    # 不报错即安装成功

注:如果提示找不到caffe,可以尝试用root用户配置环境,并用root用户执行;或者今后在写代码的时候,每次都直接将caffe的路径加入即可,只要caffe安装成功了,其他都是小问题

import syssys.path.append('/path/to/caffe-master/python')import caffe

4.最后,可以安装jupyter神器

sudo pip install jupyter# 命令终端输入以下语句即可使用
jupyter notebook

~~~~~~~~~~~~~~~~~~~~~~华丽丽分割线~~~~~~~~~~~~~~~~~~~~

参考:

1.Ubuntu 16.04 or 15.10 Installation Guide:https://github.com/BVLC/caffe/wiki/Ubuntu-16.04-or-15.10-Installation-Guide#the-gpu-support-prerequisites

2.Install caffe-GPU on Ubuntu-16.04:http://gear.github.io/2017-03-30-caffe-gpu-installation/
3.Ubuntu16.04 Caffe 安装步骤记录(超详尽):http://blog.csdn.net/yhaolpz/article/details/71375762

4.Ubuntu16.04+CUDA8.0+cudnn7.5+Caffe安装过程:http://blog.csdn.net/u010159842/article/details/54291930

ubuntu16.04+cuda8.0+cudnn5.1+caffe 安装(基于独立主机集成显卡GTX1080Ti)相关推荐

  1. 从零开始安装TensorFlow1.0+keras(Ubuntu16.04+CUDA8.0+Cudnn5.1+TITANX)

    NVIDIA TITANX 显卡安装 官网下载NVIDIA驱动 点击进入驱动下载地址 按照需求选择合适的GPU,因为我们使用的是TITAN X GPU 所以选择如下,操作系统旋转Linux 64-bi ...

  2. [深度学习]Ubuntu16.04 + GTX 1050 + cuda8.0 + cuDNN5.1 + caffe安装详解

    首先吐个槽,ubuntu + nvidia的显卡驱动简直是反人类,害的我折腾了一天多. 一.问题及解决办法 寒假放假回家没事干,正好给家里电脑升级了显卡gtx1050可以跑跑CNN.我在实验室的显卡是 ...

  3. Ubuntu16.04+CUDA8.0+cudnn5.1+TensorFlow-GPU详细安装步骤

    最近学习机器学习的基本算法,想着配合Python2.7+TensorFlow-gpu进行学习,奈何Windows上TensorFlow只支持Python3.5.x,虚拟机上用Ubuntu对硬件的调用又 ...

  4. Ubuntu16.04 +cuda8.0+cudnn+opencv+caffe+theano+tensorflow配置明细

    本文为原创作品,未经本人同意,禁止转载,禁止用于商业用途!本人对博客使用拥有最终解释权 欢迎关注我的博客:http://blog.csdn.net/hit2015spring和http://www.c ...

  5. Ubuntu16.04+cuda8.0+GTX TITAN X安装配置

    安装环境 显卡型号:Nvidia GeForce GTX TITAN X(pascal) 系统:ubuntu16.04 1.给出cuda下载地址(含历史版本): https://developer.n ...

  6. ubuntu16.04 cuda8.0 caffe 编译 error: cublas_v2.h 没有那个文件或目录

    ubuntu16.04 cuda8.0 caffe 编译时遇到 caffe fatal error: cublas_v2.h 没有那个文件或目录 参考:http://blog.csdn.net/qq_ ...

  7. Ubuntu16.04LTS+CUDA8.0+cuDNN5.1+Anaconda3(python3.6)+tensorflow_gpu-1.2.1安装过程全记录

    Ubuntu16.04LTS+CUDA8.0+cuDNN5.1+Anaconda3(python3.6)+tensorflow_gpu-1.2.1安装过程全记录 最近搭建了一台用于深度学习的服务器,其 ...

  8. cuda8.0.44linux.run,ubuntu16.04+cuda8.0+cudnn6+tensorflow(gpu)1.4,一遍成功

    8种机械键盘轴体对比 本人程序员,要买一个写代码的键盘,请问红轴和茶轴怎么选? 0 python环境(ubuntu16.04自带2.7.12)0.1 查看python版本与安装路径1 2 3 4pyt ...

  9. 深度学习环境配置Ubuntu16.04+CUDA8.0+CuDNN+Anaconda2+openCV2.4.9+caffe(全离线GPU版)

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/Bernice_lying [前言] 深度学习燎原之势势不可当,现在很多现场使用深度方法的比赛需要自行 ...

最新文章

  1. php post 文件,PHP响应post请求上传文件的方法_php技巧
  2. 浙江科技学院计算机专业录取分数线,浙江科技学院2017年艺术类本科专业录取分数线...
  3. POST和GET有什么区别? [重复]
  4. python项目-30 个惊艳的Python开源项目
  5. 基础才是重中之重~.net中的显式事务与隐式事务
  6. 实战 | 利用Delta Lake使Spark SQL支持跨表CRUD操作
  7. pandas 作图 统计_Pandas数据可视化工具——Seaborn用法整理(下)
  8. Android-Universal-Image-Loader学习笔记(一)
  9. java多线程-线程池
  10. 使用JMeter进行接口压力测试
  11. ESAPI配置文件自定义路径
  12. mysql杏林中医诊所管理系统毕业设计源码133742
  13. 开源协议比较:BSD、Apache、GLP、LGLP、MIT
  14. 打印的时候显示域服务器不可用,Win10打印时active directory域服务不可用解决方法...
  15. C++ C1 -namespace-using-域解析符-const-引用
  16. 解决ubuntu下微信不能发图片的问题。
  17. 我的软件销售生涯(一)
  18. 用CPU-Z查看内存插槽个数与频率
  19. 杰理之IIS总线【篇】
  20. 三万字 | Kafka 知识体系保姆级教程宝典

热门文章

  1. 创业有什么好的项目吗?
  2. CSS内联样式的使用,吐血整理
  3. lg-1 x 怎么算_上汽大众大众途观X怎么样,coupe SUV里的一匹黑马_实况网
  4. 腾讯广点通到底是做什么的
  5. 自定义收缩TextView
  6. 知识星球|内网安全攻防星球活动开幕...
  7. Google's BBR TCP拥塞控制算法的四个变速引擎
  8. Python 数据类型总结(数字字符串)
  9. c语言阶乘求自然数e,求10000的阶乘(c语言代码实现)
  10. git安装、初次配置及密钥生成