4. 安装CUDA Sample 及 ATLAS

4.1 Build sample

cd /usr/local/cuda/samples
sudo make all -j8

我电脑是八核的,所以make 时候用-j8参数,大家根据情况更改,整个过程有点长,十分钟左右。

4.2 查看驱动是否安装成功

cd bin/x86_64/linux/release
./deviceQuery

出现以下信息则成功:

./deviceQuery Starting...

CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 670"
CUDA Driver Version / Runtime Version          6.5 / 6.5
CUDA Capability Major/Minor version number:    3.0
Total amount of global memory:                 4095 MBytes (4294246400 bytes)
( 7) Multiprocessors, (192) CUDA Cores/MP:     1344 CUDA Cores
GPU Clock rate:                                1098 MHz (1.10 GHz)
Memory Clock rate:                             3105 Mhz
Memory Bus Width:                              256-bit
L2 Cache Size:                                 524288 bytes
Maximum Texture Dimension Size (x,y,z)         1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096)
Maximum Layered 1D Texture Size, (num) layers  1D=(16384), 2048 layers
Maximum Layered 2D Texture Size, (num) layers  2D=(16384, 16384), 2048 layers
Total amount of constant memory:               65536 bytes
Total amount of shared memory per block:       49152 bytes
Total number of registers available per block: 65536
Warp size:                                     32
Maximum number of threads per multiprocessor:  2048
Maximum number of threads per block:           1024
Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
Maximum memory pitch:                          2147483647 bytes
Texture alignment:                             512 bytes
Concurrent copy and kernel execution:          Yes with 1 copy engine(s)
Run time limit on kernels:                     Yes
Tntegrated GPU sharing Host Memory:            No
Support host page-locked memory mapping:       Yes
Alignment requirement for Surfaces:            Yes
Device has ECC support:                        Disabled
Device supports Unified Addressing (UVA):      Yes
Device PCI Bus ID / PCI location ID:           1 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 6.5, CUDA Runtime Version = 6.5, NumDevs = 1, Device0 = GeForce GTX 670
Result = PASS

4.3 安装ATLAS

ATLAS是做线性代数运算的,还有俩可以选:一个是Intel 的 MKL,这个要收费,还有一个是OpenBLAS,这个比较麻烦;但是运行效率ATLAS < OpenBLAS < MKL

我就用ATLAS咯:

sudo apt-get install libatlas-base-dev

5. 安装Caffe需要的Python包

网上介绍用现有的anaconda,我反正不建议,因为路径设置麻烦,很容易出错,而且自己安装很简单也挺快的。

首先需要安装pip

sudo apt-get install python-pip

再下载caffe,我把caffe放在用户目录下

cd
git clone https://github.com/BVLC/caffe.git

再转到caffe的python目录,安装scipy

cd caffe/python
sudo apt-get install python-numpy python-scipy python-matplotlib ipython ipython-notebook python-pandas python-sympy python-nose

最后安装requirement里面的包,需要root权限

sudo su
for req in $(cat requirements.txt); do pip install $req; done

如果提示报错,一般是缺少必须的包引起的,直接根据提示 pip install <package-name>就行了。

安装完后退出root权限

exit

6. 编译caffe

首先修改配置文件,回到caffe目录

cd ~/caffe
cp Makefile.config.example Makefile.config
gedit Makefile.config

这里仅需修改两处:

i) 使用cuDNN

# USE_CUDNN := 1

这里去掉#,取消注释为

USE_CUDNN := 1

ii) 修改python包目录,这句话

PYTHON_INCLUDE := /usr/include/python2.7 \
/usr/lib/python2.7/dist-packages/numpy/core/include

改为

PYTHON_INCLUDE := /usr/include/python2.7 \
/usr/local/lib/python2.7/dist-packages/numpy/core/include

因为新安装的python包目录在这里: /usr/local/lib/python2.7/dist-packages/

接下来就好办了,直接make

make all -j8
make test
make runtest
make pycaffe

这时候cd 到caffe 下的 python 目录,试试caffe 的 python wrapper安装好没有:

python
import caffe

如果不报错,那就说明安装好了。

cuda测试caffe编译安装相关推荐

  1. 压力测试以及编译安装httpd2.4

    压力测试以及编译安装httpd2.4 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.使用 deflate_module模块压缩页面优化传输速度 我们的httpd软件自带的有一个 ...

  2. Caffe 编译安装

    From: http://caffe.berkeleyvision.org/installation.html 安装 安装前,最好阅读下面的安装指导并注意和你的系统平台相关的细节问题.我们已经在 Ub ...

  3. Intel+Nvidia双显卡笔记本Linuxmint18下安装CUDA+OpenCV+Caffe的安装记录

    一.安装环境: 硬件:微星GE70 2PC 089-XCN,14年性价比较高的一款,然而两年多过去后配置已经落伍...当年的价格现在能买到i7+GTX1050了... CPU:intel i5 420 ...

  4. Windows+VS2013爆详细Caffe编译安装教程

    1. 安装cuda Cuda是英伟达推出的GPU加速运算平台 我这里安装的是cuda7.5,已经安装过的忽略,还没有安装过的这里有安装教程.windows下面安装还是非常简单的. 点击打开链接    ...

  5. Ubuntu16.04 Caffe 编译安装步骤记录

    历时一周终于在 ubuntu16.04 系统成功安装 caffe 并编译,网上有很多教程,但是某些步骤并没有讲解详尽,导致配置过程总是出现各种各样匪夷所思的问题,尤其对于新手而言更是欲哭无泪,在我饱受 ...

  6. centos7 cuda测试_CentOS 7 安装cuda环境

    创建时间:2016-11-25 作者:海滨 背景介绍:为了加速类prisma风格图片渲染速度(开源项目yusuketomoto/chainer-fast-neuralstyle),先需要对一台装有Ge ...

  7. PSPNet Caffe 编译安装

    和Caffe安装流程一样,CUDA,cudnn, OpenCV 网上有很多,请参考实验室巨佬杰作 https://github.com/Mannix1994/SfSNet-Python/blob/ma ...

  8. Ubuntu16.04+Cuda9.1+Cudnn7.5+Anaconda3(Python3.6)+opencv3.4.1+caffe编译安装(多坑已排!)

    我第一次装ubuntu16.04的时候由于是小白,分区的时候分的不合理,所以空间不够用了,索性重装了一次,装ubuntu16.04双系统这里不再赘述,可参考文章 https://blog.csdn.n ...

  9. centos7 cuda测试_CentOS7.3安装NVIDIA-1080ti驱动、cuda、cudnn、TensorFlow(示例代码)

    Ubuntu非要换centOS...好吧... 看了很多是通过ELRepo源安装驱动,不过我没有成功,只是通过它的步骤检测了显卡驱动型号. 0.安装gcc yum -y install gcc-c++ ...

最新文章

  1. 西安翻译学院计算机分数线,西安翻译学院录取投档线
  2. EmbeddedWebBrowser(EmbeddedWB)不显示图片
  3. python计算奖金_2020还有3个月,收了这套Python资料,年终奖翻倍!
  4. (运维)VMware-vCenter-Server-Appliance-5.0安装与部署
  5. ajax获取网页新闻,基于Ajax的新闻网页动态数据的抓取方法及系统
  6. PHP获取客户端的真实IP
  7. 7-5 公路村村通 (30 分)(C语言实现)
  8. java socket 实现增删改查 + 在线答题小案例
  9. OpenShift 4 Hands-on Lab (12) 通过 KubeFed 配置 OpenShift 联邦集群
  10. Qt4_使用QXmlStreamReader读取XML
  11. matlab 运行 释放内存,怎么能释放已经使用的内存
  12. 关于XML字符串和XML Document之间的转换
  13. 【平衡小车】新手应知一二之过程梳理和问题总结
  14. 小水智能-智能楼宇智慧建筑3D可视化系统,实现了数据的整合
  15. 国内外期货、外汇、股指期货 交易时间(转载)
  16. java的populate_JAVA BeanUtils.populate错误当离开空日期输入
  17. 大厂项目经理分享 Code Review经验
  18. 机器学习之泰坦尼克号预测生还案例的分析(逻辑回归)
  19. python 中 np.sum()函数 通俗易懂理解!
  20. css实现文字左右添加横线

热门文章

  1. bcc Reference Guide 中文翻译
  2. 查题接口 源码 php 爬题,大学网课查题公众号查题教程_网课查题题库接口API-在线搜答案...
  3. java 内部类泛型,java – 使用泛型强制转换为内部类
  4. mysql返回页面乱码java_解决Java程序使用MySQL时返回参数为乱码的示例教程
  5. mysql 多配置文件实例安装_mysql安装之多实例多配置文件安装
  6. 如何利用自定义注解放行 Spring Security 项目的接口
  7. 为什么 StringBuilder 不是线程安全的?
  8. 一文让你秒懂AQS,附带源码剖析!
  9. pytorch默认初始化_小白学PyTorch | 9 tensor数据结构与存储结构
  10. windows 安装python-pcl 测试ok