CUDA10.1配置VS2017
目录
一 CUDA 安装
二 CUDA环境变量配置
三 CUDA配置VS2017
一 CUDA 安装
1.1 CUDA下载
网址:https://developer.nvidia.com/cuda-toolkit-archive
可以根据需要下载不同版本的CUDA安装包。
1.2 CUDA安装
1.2.1 双击下载的.exe文件安装
1.2.2 点击‘OK’
1.2.3 上一步解压完成后,会自动跳到下图,点击‘同意并继续’即可,由于我已经安装过了,下图是我在网上找的一个图,各版 本都一样
二 CUDA环境变量配置
2.1 右击此电脑→属性→高级系统设置→环境变量
2.2 系统变量里添加:
CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.1
CUDA_LIB_PATH = %CUDA_PATH%\lib\x64
CUDA_BIN_PATH = %CUDA_PATH%\bin
CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64
CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64
注意:CUDA _PATH与CUDA _PATH_V10_1是CUDA安装时自动添加的;
CUDA _PATH_V10_1中的10_1是你安装CUDA的版本号
2.3 添加以下到系统变量path中,添加完点确定
%CUDA_LIB_PATH%
%CUDA_BIN_PAHT%
%CUDA_SDK_BIN_PAHT%
%CUDA_SDK_LIB_PATH%
2.4 重启电脑,然后打开cmd,输入: set cuda 即可看到下图
2.5 检查cuda是否安装好, 打开cmd,
2.5.1 输入:cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\demo_suite
输入之后,注意是否为自己安装的目录,然后按‘Enter’键
2.5.2 找到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\demo_suite目录下的deviceQuery.exe,在 cmd里输入:deviceQuery.exe
上图中Result=PASS,表示安装好,否则Result=Fail重装或更换cuda版本吧。
2.5.3 找到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\demo_suite目录下的bandwidthTest.exe,在 cmd里输入:bandwidthTest.exe
上图中Result=PASS,表示安装好,否则Result=Fail重装或更换cuda版本吧。
三 CUDA配置VS2017
3.1 打开VS2017新建工程
3.2 右击源文件→添加→新建项→CUDA C/C++ File;创建一个.cu文件
3.3 右击项目名称test_cuda2→生成依赖项→生成自定义,→选择CUDA10.1→确定
3.4 右击cuda_test.cu文件→属性→配置属性→常规→项类型→CUDA C/C++
3.5 右击test_cuda2→属性
3.5.1→VC++目录。在包含目录中添加C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\include;在库目录中添加 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib\x64。
注意:要根据自己的CUDA安装添加正确的目录
3.5.2 →链接器→输入→附加依赖项。再附加依赖项中添加相应的.lib文件名称
我这里加的比较多cublas.lib
cublasLt.lib
cuda.lib
cudadevrt.lib
cudart.lib
cudart_static.lib
cufft.lib
cufftw.lib
curand.lib
cusolver.lib
cusparse.lib
nppc.lib
nppial.lib
nppicc.lib
nppicom.lib
nppidei.lib
nppif.lib
nppig.lib
nppim.lib
nppist.lib
nppisu.lib
nppitc.lib
npps.lib
nvblas.lib
nvgraph.lib
nvml.lib
nvrtc.lib
OpenCL.lib
3.6 配置成功后,这里附带一个测试程序:
// CUDA runtime 库 + CUBLAS 库
#include "cuda_runtime.h"
#include "cublas_v2.h" #include <time.h>
#include <iostream> using namespace std;// 定义测试矩阵的维度
int const M = 5;
int const N = 10;int main()
{// 定义状态变量 cublasStatus_t status;// 在 内存 中为将要计算的矩阵开辟空间 float *h_A = (float*)malloc(N*M * sizeof(float));float *h_B = (float*)malloc(N*M * sizeof(float));// 在 内存 中为将要存放运算结果的矩阵开辟空间 float *h_C = (float*)malloc(M*M * sizeof(float));// 为待运算矩阵的元素赋予 0-10 范围内的随机数 for (int i = 0; i < N*M; i++) {h_A[i] = (float)(rand() % 10 + 1);h_B[i] = (float)(rand() % 10 + 1);}// 打印待测试的矩阵 cout << "矩阵 A :" << endl;for (int i = 0; i < N*M; i++) {cout << h_A[i] << " ";if ((i + 1) % N == 0) cout << endl;}cout << endl;cout << "矩阵 B :" << endl;for (int i = 0; i < N*M; i++) {cout << h_B[i] << " ";if ((i + 1) % M == 0) cout << endl;}cout << endl;/*** GPU 计算矩阵相乘*/// 创建并初始化 CUBLAS 库对象 cublasHandle_t handle;status = cublasCreate(&handle);if (status != CUBLAS_STATUS_SUCCESS){if (status == CUBLAS_STATUS_NOT_INITIALIZED) {cout << "CUBLAS 对象实例化出错" << endl;}getchar();return EXIT_FAILURE;}float *d_A, *d_B, *d_C;// 在 显存 中为将要计算的矩阵开辟空间 cudaMalloc((void**)&d_A, // 指向开辟的空间的指针 N*M * sizeof(float) // 需要开辟空间的字节数 );cudaMalloc((void**)&d_B,N*M * sizeof(float));// 在 显存 中为将要存放运算结果的矩阵开辟空间 cudaMalloc((void**)&d_C,M*M * sizeof(float));// 将矩阵数据传递进 显存 中已经开辟好了的空间 cublasSetVector(N*M, // 要存入显存的元素个数 sizeof(float), // 每个元素大小 h_A, // 主机端起始地址 1, // 连续元素之间的存储间隔 d_A, // GPU 端起始地址 1 // 连续元素之间的存储间隔 );cublasSetVector(N*M,sizeof(float),h_B,1,d_B,1);// 同步函数 cudaThreadSynchronize();// 传递进矩阵相乘函数中的参数,具体含义请参考函数手册。 float a = 1; float b = 0;// 矩阵相乘。该函数必然将数组解析成列优先数组 cublasSgemm(handle, // blas 库对象 CUBLAS_OP_T, // 矩阵 A 属性参数 CUBLAS_OP_T, // 矩阵 B 属性参数 M, // A, C 的行数 M, // B, C 的列数 N, // A 的列数和 B 的行数 &a, // 运算式的 α 值 d_A, // A 在显存中的地址 N, // lda d_B, // B 在显存中的地址 M, // ldb &b, // 运算式的 β 值 d_C, // C 在显存中的地址(结果矩阵) M // ldc );// 同步函数 cudaThreadSynchronize();// 从 显存 中取出运算结果至 内存中去 cublasGetVector(M*M, // 要取出元素的个数 sizeof(float), // 每个元素大小 d_C, // GPU 端起始地址 1, // 连续元素之间的存储间隔 h_C, // 主机端起始地址 1 // 连续元素之间的存储间隔 );// 打印运算结果 cout << "计算结果的转置 ( (A*B)的转置 ):" << endl;for (int i = 0; i < M*M; i++) {cout << h_C[i] << " ";if ((i + 1) % M == 0) cout << endl;}// 清理掉使用过的内存 free(h_A);free(h_B);free(h_C);cudaFree(d_A);cudaFree(d_B);cudaFree(d_C);// 释放 CUBLAS 库对象 cublasDestroy(handle);getchar();return 0;
}
程序运行结果:
CUDA10.1配置VS2017相关推荐
- Qt配置VS2017
目录 一 Qt安装 二 VS2017安装 三 Qt配置VS2017 一 Qt安装 1.1 下载网址:http://download.qt.io/archive/qt/ 这里选择 ...
- win8安装PCL1.8.1配置VS2017
安装环境:VS2017+win8+64位 由于当时安装VS安装的是2017版本,所以参考了网上2015版本进行相关安装和配置. 准备: 首先下载这两个文件:(链接里还有VS2015,根据自己版本下载) ...
- C++cgal库配置+VS2017
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 CGAL配置+vs2017 一.下载CGAL库 1.1 CGAL下载链接:https://github.com/CGAL/c ...
- (64位)opengl配置+vs2017+glew+glfw
注意****本机OpenGL版本必须高于GLEW库版本 本机OpenGL版本如何查看? 只需先随意下载任意版本的glew解压,点击文件夹bin目录下的visualinfo.exe,屏幕一闪而过,这时该 ...
- caffe-gpu ubuntu 安装_ubuntu16.04 cuda10.0 配置caffe gpu环境
caffe gpu环境的配置就是一部赤裸裸的血泪史,每次都能遇到很多问题~ 环境依赖 ubuntu 16.04cuda 10.0python 3.5opencv 3.4.10sudo apt-get ...
- OpenGL(预备篇3)---OpenGL编程环境配置 vs2017篇---GLM---(自己动手系列)
什么是GLM,有什么用? OpenGL Mathematics (GLM). 看样子这是一个OpenGL的数学库.在OpenGL编程中用处很大,可以下载来用用. 幸运的是,这个不用编译,下载后解压了就 ...
- RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED,以及tensorflow1.14.0+torch1.2.0+CUDA10.0配置
环境: Anaconda3-5.2.0 python3.6.5 初始tensorflow版本是1.8.0,cuda9.0,升级tensorflow至1.10.0时,出现torch1.1.0的运行错误: ...
- 【Deeplearning】暗影精灵3安装Windows10+Ubuntu18.04双系统及CUDA10.0配置
一.系统盘制作 官网下载ubuntu18.04镜像,使用Rufus(https://rufus.ie/)制作系统盘 二.Windows准备 磁盘管理-->压缩卷-->重启按ESC进入BIO ...
- cuda10.0配置pytorch1.7.0+monai0.9.0
1. pytorch安装 没有对应cuda10.0的命令,重装10.2嫌麻烦,尝试直接用10.2的cudatoolkit,结果可行. # CUDA 10.2 (10.0能用,但如果命令里面写cuda ...
最新文章
- 翻译翻译:什么叫架构?
- CVPR2021|基于分类深度分布网络的单目3D物体检测
- spring4声明式事务—02 xml配置方式
- BZOJ4004: [JLOI2015]装备购买
- 产品规划,要考虑哪些方面?
- mysql mos login_MySQL 中常用的函数
- nginx的指令root和alias的区别
- linux adb 驱动 home,Ubuntu下adb驱动问题
- 适合学计算机学生喝的茶,学生喝什么茶能够提高记忆力
- 疫情居家想做点副业?推荐五个居家兼职,总有一个适合你
- 机器人行业最新年度预测出炉:中国仍是需求大国,强调全球联动合作
- STM32——OLED显示实验
- labview由于其他对话正在访问FIFO_Windows内核逻辑漏洞:IO管理器访问模式不匹配...
- 2023最新SSM计算机毕业设计选题大全(附源码+LW)之java青岛恒星科技学院机房管理系统0k0u9
- python脚本模板
- VMware虚拟机 Linux 安装与配置网络
- android浏览器获取设备id,html 或者HTML5 加上js能获取手机设备的id号吗
- ie9 去掉bing 加速
- #创新应用#点心桌面:桌面美化利器!
- 雅思在线模拟测试软件,雅思在线模拟测试:语法测试题
热门文章
- 北科大计算机技术研招考纲,北京科技大学2021年全国硕士研究生招生考试自命题科目考试大纲...
- python 合并word文件,在Python上的WordCloud中,我想合并两种语言
- 输入文字自动生成图片_批量生成变化的图片文字海报
- 视频光端机使用、保养与维护方法详解
- 【渝粤教育】 国家开放大学2020年春季 1032成本管理 参考试题
- 【渝粤题库】陕西师范大学100071教育学作业(高起本)
- java 1.8签名apk_给Android的APK程序签名和重新签名的方法
- matlab 进度条/waitbar 显示运行进度
- 梦幻,MySQL视图,虚实表,完整详细可收藏
- Java数组(3)--二维(多维)数组