目录

一  CUDA 安装

二  CUDA环境变量配置

三  CUDA配置VS2017


一  CUDA 安装

   1.1 CUDA下载

网址:https://developer.nvidia.com/cuda-toolkit-archive

可以根据需要下载不同版本的CUDA安装包。

1.2 CUDA安装

   1.2.1 双击下载的.exe文件安装

  1.2.2 点击‘OK’

 1.2.3 上一步解压完成后,会自动跳到下图,点击‘同意并继续’即可,由于我已经安装过了,下图是我在网上找的一个图,各版             本都一样

二  CUDA环境变量配置

    2.1 右击此电脑→属性→高级系统设置→环境变量

2.2 系统变量里添加:

CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.1

CUDA_LIB_PATH = %CUDA_PATH%\lib\x64

CUDA_BIN_PATH = %CUDA_PATH%\bin

CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64

CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64

注意:CUDA _PATH与CUDA _PATH_V10_1是CUDA安装时自动添加的;

CUDA _PATH_V10_1中的10_1是你安装CUDA的版本号

2.3 添加以下到系统变量path中,添加完点确定

%CUDA_LIB_PATH%

%CUDA_BIN_PAHT%

%CUDA_SDK_BIN_PAHT%

%CUDA_SDK_LIB_PATH%

2.4 重启电脑,然后打开cmd,输入: set cuda   即可看到下图

2.5 检查cuda是否安装好, 打开cmd,

      2.5.1  输入:cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\demo_suite

输入之后,注意是否为自己安装的目录,然后按‘Enter’键

     2.5.2 找到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\demo_suite目录下的deviceQuery.exe,在                 cmd里输入:deviceQuery.exe

上图中Result=PASS,表示安装好,否则Result=Fail重装或更换cuda版本吧。

2.5.3 找到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\demo_suite目录下的bandwidthTest.exe,在                cmd里输入:bandwidthTest.exe

上图中Result=PASS,表示安装好,否则Result=Fail重装或更换cuda版本吧。

三  CUDA配置VS2017

3.1  打开VS2017新建工程

3.2 右击源文件→添加→新建项→CUDA C/C++ File;创建一个.cu文件

3.3 右击项目名称test_cuda2→生成依赖项→生成自定义,→选择CUDA10.1→确定

3.4 右击cuda_test.cu文件→属性→配置属性→常规→项类型→CUDA C/C++

3.5 右击test_cuda2→属性

3.5.1→VC++目录。在包含目录中添加C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\include;在库目录中添加                               C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib\x64。

注意:要根据自己的CUDA安装添加正确的目录

3.5.2 →链接器→输入→附加依赖项。再附加依赖项中添加相应的.lib文件名称

我这里加的比较多cublas.lib

cublasLt.lib

cuda.lib

cudadevrt.lib

cudart.lib

cudart_static.lib

cufft.lib

cufftw.lib

curand.lib

cusolver.lib

cusparse.lib

nppc.lib

nppial.lib

nppicc.lib

nppicom.lib

nppidei.lib

nppif.lib

nppig.lib

nppim.lib

nppist.lib

nppisu.lib

nppitc.lib

npps.lib

nvblas.lib

nvgraph.lib

nvml.lib

nvrtc.lib

OpenCL.lib

3.6  配置成功后,这里附带一个测试程序:


// CUDA runtime 库 + CUBLAS 库
#include "cuda_runtime.h"
#include "cublas_v2.h"  #include <time.h>
#include <iostream>  using namespace std;// 定义测试矩阵的维度
int const M = 5;
int const N = 10;int main()
{// 定义状态变量  cublasStatus_t status;// 在 内存 中为将要计算的矩阵开辟空间  float *h_A = (float*)malloc(N*M * sizeof(float));float *h_B = (float*)malloc(N*M * sizeof(float));// 在 内存 中为将要存放运算结果的矩阵开辟空间  float *h_C = (float*)malloc(M*M * sizeof(float));// 为待运算矩阵的元素赋予 0-10 范围内的随机数  for (int i = 0; i < N*M; i++) {h_A[i] = (float)(rand() % 10 + 1);h_B[i] = (float)(rand() % 10 + 1);}// 打印待测试的矩阵  cout << "矩阵 A :" << endl;for (int i = 0; i < N*M; i++) {cout << h_A[i] << " ";if ((i + 1) % N == 0) cout << endl;}cout << endl;cout << "矩阵 B :" << endl;for (int i = 0; i < N*M; i++) {cout << h_B[i] << " ";if ((i + 1) % M == 0) cout << endl;}cout << endl;/*** GPU 计算矩阵相乘*/// 创建并初始化 CUBLAS 库对象  cublasHandle_t handle;status = cublasCreate(&handle);if (status != CUBLAS_STATUS_SUCCESS){if (status == CUBLAS_STATUS_NOT_INITIALIZED) {cout << "CUBLAS 对象实例化出错" << endl;}getchar();return EXIT_FAILURE;}float *d_A, *d_B, *d_C;// 在 显存 中为将要计算的矩阵开辟空间  cudaMalloc((void**)&d_A,    // 指向开辟的空间的指针  N*M * sizeof(float)    // 需要开辟空间的字节数  );cudaMalloc((void**)&d_B,N*M * sizeof(float));// 在 显存 中为将要存放运算结果的矩阵开辟空间  cudaMalloc((void**)&d_C,M*M * sizeof(float));// 将矩阵数据传递进 显存 中已经开辟好了的空间  cublasSetVector(N*M,    // 要存入显存的元素个数  sizeof(float),    // 每个元素大小  h_A,    // 主机端起始地址  1,    // 连续元素之间的存储间隔  d_A,    // GPU 端起始地址  1    // 连续元素之间的存储间隔  );cublasSetVector(N*M,sizeof(float),h_B,1,d_B,1);// 同步函数  cudaThreadSynchronize();// 传递进矩阵相乘函数中的参数,具体含义请参考函数手册。  float a = 1; float b = 0;// 矩阵相乘。该函数必然将数组解析成列优先数组  cublasSgemm(handle,    // blas 库对象   CUBLAS_OP_T,    // 矩阵 A 属性参数  CUBLAS_OP_T,    // 矩阵 B 属性参数  M,    // A, C 的行数   M,    // B, C 的列数  N,    // A 的列数和 B 的行数  &a,    // 运算式的 α 值  d_A,    // A 在显存中的地址  N,    // lda  d_B,    // B 在显存中的地址  M,    // ldb  &b,    // 运算式的 β 值  d_C,    // C 在显存中的地址(结果矩阵)  M    // ldc  );// 同步函数  cudaThreadSynchronize();// 从 显存 中取出运算结果至 内存中去  cublasGetVector(M*M,    //  要取出元素的个数  sizeof(float),    // 每个元素大小  d_C,    // GPU 端起始地址  1,    // 连续元素之间的存储间隔  h_C,    // 主机端起始地址  1    // 连续元素之间的存储间隔  );// 打印运算结果  cout << "计算结果的转置 ( (A*B)的转置 ):" << endl;for (int i = 0; i < M*M; i++) {cout << h_C[i] << " ";if ((i + 1) % M == 0) cout << endl;}// 清理掉使用过的内存  free(h_A);free(h_B);free(h_C);cudaFree(d_A);cudaFree(d_B);cudaFree(d_C);// 释放 CUBLAS 库对象  cublasDestroy(handle);getchar();return 0;
}

程序运行结果:

CUDA10.1配置VS2017相关推荐

  1. Qt配置VS2017

    目录 一  Qt安装 二  VS2017安装 三  Qt配置VS2017 一  Qt安装     1.1  下载网址:http://download.qt.io/archive/qt/ 这里选择   ...

  2. win8安装PCL1.8.1配置VS2017

    安装环境:VS2017+win8+64位 由于当时安装VS安装的是2017版本,所以参考了网上2015版本进行相关安装和配置. 准备: 首先下载这两个文件:(链接里还有VS2015,根据自己版本下载) ...

  3. C++cgal库配置+VS2017

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 CGAL配置+vs2017 一.下载CGAL库 1.1 CGAL下载链接:https://github.com/CGAL/c ...

  4. (64位)opengl配置+vs2017+glew+glfw

    注意****本机OpenGL版本必须高于GLEW库版本 本机OpenGL版本如何查看? 只需先随意下载任意版本的glew解压,点击文件夹bin目录下的visualinfo.exe,屏幕一闪而过,这时该 ...

  5. caffe-gpu ubuntu 安装_ubuntu16.04 cuda10.0 配置caffe gpu环境

    caffe gpu环境的配置就是一部赤裸裸的血泪史,每次都能遇到很多问题~ 环境依赖 ubuntu 16.04cuda 10.0python 3.5opencv 3.4.10sudo apt-get ...

  6. OpenGL(预备篇3)---OpenGL编程环境配置 vs2017篇---GLM---(自己动手系列)

    什么是GLM,有什么用? OpenGL Mathematics (GLM). 看样子这是一个OpenGL的数学库.在OpenGL编程中用处很大,可以下载来用用. 幸运的是,这个不用编译,下载后解压了就 ...

  7. RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED,以及tensorflow1.14.0+torch1.2.0+CUDA10.0配置

    环境: Anaconda3-5.2.0 python3.6.5 初始tensorflow版本是1.8.0,cuda9.0,升级tensorflow至1.10.0时,出现torch1.1.0的运行错误: ...

  8. 【Deeplearning】暗影精灵3安装Windows10+Ubuntu18.04双系统及CUDA10.0配置

    一.系统盘制作 官网下载ubuntu18.04镜像,使用Rufus(https://rufus.ie/)制作系统盘 二.Windows准备 磁盘管理-->压缩卷-->重启按ESC进入BIO ...

  9. cuda10.0配置pytorch1.7.0+monai0.9.0

    1. pytorch安装 没有对应cuda10.0的命令,重装10.2嫌麻烦,尝试直接用10.2的cudatoolkit,结果可行. # CUDA 10.2  (10.0能用,但如果命令里面写cuda ...

最新文章

  1. 翻译翻译:什么叫架构?
  2. CVPR2021|基于分类深度分布网络的单目3D物体检测
  3. spring4声明式事务—02 xml配置方式
  4. BZOJ4004: [JLOI2015]装备购买
  5. 产品规划,要考虑哪些方面?
  6. mysql mos login_MySQL 中常用的函数
  7. nginx的指令root和alias的区别
  8. linux adb 驱动 home,Ubuntu下adb驱动问题
  9. 适合学计算机学生喝的茶,学生喝什么茶能够提高记忆力
  10. 疫情居家想做点副业?推荐五个居家兼职,总有一个适合你
  11. 机器人行业最新年度预测出炉:中国仍是需求大国,强调全球联动合作
  12. STM32——OLED显示实验
  13. labview由于其他对话正在访问FIFO_Windows内核逻辑漏洞:IO管理器访问模式不匹配...
  14. 2023最新SSM计算机毕业设计选题大全(附源码+LW)之java青岛恒星科技学院机房管理系统0k0u9
  15. python脚本模板
  16. VMware虚拟机 Linux 安装与配置网络
  17. android浏览器获取设备id,html 或者HTML5 加上js能获取手机设备的id号吗
  18. ie9 去掉bing 加速
  19. #创新应用#点心桌面:桌面美化利器!
  20. 雅思在线模拟测试软件,雅思在线模拟测试:语法测试题

热门文章

  1. 北科大计算机技术研招考纲,北京科技大学2021年全国硕士研究生招生考试自命题科目考试大纲...
  2. python 合并word文件,在Python上的WordCloud中,我想合并两种语言
  3. 输入文字自动生成图片_批量生成变化的图片文字海报
  4. 视频光端机使用、保养与维护方法详解
  5. 【渝粤教育】 国家开放大学2020年春季 1032成本管理 参考试题
  6. 【渝粤题库】陕西师范大学100071教育学作业(高起本)
  7. java 1.8签名apk_给Android的APK程序签名和重新签名的方法
  8. matlab 进度条/waitbar 显示运行进度
  9. 梦幻,MySQL视图,虚实表,完整详细可收藏
  10. Java数组(3)--二维(多维)数组