写这篇文章主要是针对CUDA调试经验分享,网上可供参考的资料太少了,最后靠自学CUDA官网help文档成功进入global函数断点,感兴趣的继续看下去吧!

本人的电脑配置:本机win10+vs2013+NVIDIA GeForce GTX 1050Ti 

1、CUDA加速环境配置,主要包括4项:

1)电脑配有NVIDA显卡

2)安装NVIDA驱动

3)安装VS开发环境(一个C语言编译器)

4)CUDA开发包

简单的说,想要用CUDA加速电脑需要有支持CUDA加速的图形处理器;并且安装NVIDA驱动,版本可能受限于GPU显卡的型号,后面我想CUDA调试的时候发现显卡决定了的cuda调试器版本,也决定了cuda版本,具体关系请慢慢看下去。

2、分享一下资料

1)CUDA包(英文全称:CUDA Toolkit)官网下载:https://developer.nvidia.com/cuda-toolkit-archive

2)本人参考教程并成功安装链接:https://blog.csdn.net/qq_21792169/article/details/105842776

3)CUDA教学视频:https://www.iqiyi.com/v_19rrnosmz8.html

4)如何查看cuda是否安装成功:https://jingyan.baidu.com/article/bea41d43d5741fb4c51be6f7.html

5)CUDA调试器(英文全称:Nsight Visual Studio Edition;针对WIN系统,安装后会集成到VS里面)下载:https://developer.nvidia.com/nsight-visual-studio-edition-archive

3、CUDA示例

求一张图像的均值。

#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <cuda.h>
#include <device_functions.h>
#include <iostream>using namespace std;const int THREADS = 1024;
//typedef int DT;
typedef unsigned short DT;__global__ void matSum(DT *dataIn, double *dataOutAverage, int nPixels)
{__shared__ double sharedSum[THREADS];  //int threadIndex = threadIdx.x;int nPixelsPerThread = nPixels / blockDim.x;double nSum = 0;for (int i = threadIndex * nPixelsPerThread; i < (threadIndex + 1) * nPixelsPerThread && i < nPixels; ++i){nSum += dataIn[i];}sharedSum[threadIndex] = nSum;__syncthreads();if (0 == threadIndex){double fSum = 0;for (int i = 0; i < THREADS; ++i){fSum += sharedSum[i];}*dataOutAverage = fSum / nPixels;}
}int main()
{FILE *fpsrc = NULL;int Width = 3072;int Height = 3072;//fopen read imageDT *image = new DT[Width * Height];//if ((fpsrc = fopen("E:\\SmileDoc\\MATLAB\\GL\\test.raw", "rb")) == NULL)if ((fpsrc = fopen("D:\\VG2020-SHARE\\imagecases\\103\\total-3072x3072-chest-ap-NoGrid85KV1.6mAs.raw", "rb")) == NULL){printf("Can not open the raw image.");system("pause");return 0;}fread(image, sizeof(DT), Width* Height, fpsrc);fclose(fpsrc);double average = 0;DT *d_src = NULL;double *d_average = NULL;cudaMalloc((DT**)&d_src, Width*Height*sizeof(DT));cudaMalloc((double**)&d_average, sizeof(double));cudaMemcpy(d_src, image, Width*Height*sizeof(DT), cudaMemcpyHostToDevice);matSum << <1, THREADS >> >(d_src, d_average, Width * Height);cudaMemcpy(&average, d_average, sizeof(double), cudaMemcpyDeviceToHost);cudaFree(d_src);cudaFree(d_average);cout << endl << "The average is :" << average << endl;return 0;
}

4、CUDA调试

关于CUDA调试经验,我上网搜了很多资料,可供参考的太少了,下面是关于我自己的经验分享。

首先,你要查一下自己电脑的显卡型号,它所支持的调试器版本,比如我的显卡是NVIDIA GeForce GTX 1050Ti ,支持CUDA调试器Nsight Visual Studio Edition 5.5 或者5.6版本,保险起见选择了5.5版本;

这个Nsight Visual Studio Edition调试器 没有办法单独下载,你下载的CUDA Toolkit在安装时会自动绑定一个CUDA调试器版本,由于没有经验,我先安装了CUDA10.0版本,后面调试怎么都不能进到global函数断点中,vs界面上有Nsight菜单,最底下有个help,在help文档中找到了版本支持的相关信息,提示我的显卡型号支持Nsight 5.5/5.6,单独下载Nsight5.5下载不了,只能卸载CUDA包重新安装CUDA9.1版本,这个信息是在调试器5.5版那个下载页面有说明;特别注意:重新安装CUDA9.1自动会安装Nsight5.5,然后重新配置PATH环境,VS里面配置include/lib等,新建个工程后,成功进入global函数断点:

我说的比较粗犷,如果想知道详细流程欢迎加我微信讨论,微信号:zm5547;废话不多索了,工作工作,哈哈哈哈哈

CUDA安装教程及调试:本机win10+vs2013+NVIDIA GeForce GTX 1050Ti相关推荐

  1. Windows中cuda安装教程及调试Error总结

    问题小结 最近学习并行计算,学习搭建cuda,没想到遇到很简单的问题却难了我好几天,现在已经解决了所以写个博客留个纪念. 分享下我觉得比较好的cuda安装教程,补充一下:先装vs再装cuda,cuda ...

  2. linux安装两个独立显卡驱动,Manjaro Linux 双显卡安装步骤及独立显卡运行游戏(Nvidia GeForce GTX 980m)...

    manjaro是基于Arch Linux的一个发行版,继承了Arch滚动更新的特点,也可用使用AUR上大量的软件,开箱即用. 安装manjaro是十分简单的事,但对于双显卡的支持来说,还是存在BUG, ...

  3. NVIDIA GeForce GTX 850M win10 cuda配置及安装教程

    NVIDIA GeForce GTX 850M win10 cuda配置 cuda10.0+cudnn7.6.4+tensorflow2.0.0+keras2.3.0 ---------------- ...

  4. Windows10 系统下cuda安装教程,小白教程 !很详细!!

    Windows10 系统下cuda安装教程 1.查看适合自己电脑的cuda版本 1.点击Windows+R 输入nvidia-smi 看一下自己电脑支持的conda 版本是: 根据下图白框标出的地方可 ...

  5. CUDA安装教程(超详细)

    目录 前言 cuda的下载及安装 cuda版本 CUDA toolkit Download cuda安装 cuDNN下载及安装 cuDNN下载 cuDNN配置 参考自 前言 windows10 版本安 ...

  6. win10 NVIDIA GeForce GTX 950M安装tensorflow_gpu_1.9.0、torch_1.1.0和paddlepaddle1.5.1

    迫于计算需求,最近将笔记本上的GPU也利用了起来.CUDA+CuDNN+TensorFlow部分参考了博文,感谢博主让我少走了很多弯路.Torch部分尝试了多种方法未果,最后凭借经验完成了torch1 ...

  7. win10+NVIDIA geforce gtx 960M+cuda9.0+cudnn7.1+pytorch_1.1.0+torchvision_0.3.0---已解决

    今天折腾了一天,终于是把它折腾出来了,可能真的是自己太菜了,废话不多说,简单记录一下. 配置 系统 :win10 python版本 :3.7.3 显卡 :NVIDIA geforce gtx 960M ...

  8. NVIDIA GeForce GTX 1060 驱动安装--------TensorFlow系列学习笔记(一)

    NVIDIA GeForce GTX 1060 驱动安装 1. 英伟达官网下载驱动程序 2. 禁用 nouveau 第三方驱动 3. 安装 NVIDIA GeForce GTX 1060 驱动 NVI ...

  9. 【cuda安装教程】GTX1050Ti+win10+cuda9.0+cudnn7.4.1安装过程记录

    GTX1050ti+win10+cuda9.0安装实录 其实之前已经安装过很多次cuda了,但是每次需要用其他功能的时候,总是会忘了一些安装过程中的一些参数设置,所以记录下来提醒自己也可以让大家参考一 ...

  10. 64位Windows10+Code::Blocks+CUDA安装教程

    在做毕设的时候用到了,但在网上没有找到完整而且全面的教程.根据找到的一部分资料.导师的指导还有我自己试出来的解决方案,总结出了如下详细教程.一共包括四个部分:Code::Blocks软件下载,Visu ...

最新文章

  1. 团队项目技术规格说明书---客户端
  2. tf.name_scope()与tf.variable_scope()
  3. 创建应用服务器连接客户端
  4. Git - 回滚到指定版本
  5. 脚本解决.NET MVC按钮重复提交问题
  6. C语言代码规范(六)浮点型变量逻辑比较
  7. Transposed Convolution 反卷积
  8. unity3d点击屏幕选中物体
  9. EasyPR转qt5-vs2013
  10. 鸿蒙跟海思是什么,华为到底还有多少麒麟9000?又一款旗舰曝光,出场即是鸿蒙...
  11. Intel开发手册下载地址
  12. 流程图软件lauto_流程图软件(Iauto)
  13. 处理器运算能力单位-TOPS
  14. 数据的加载 - 清洗处理 - 分组分类 - 存储
  15. windbg 脚本命令
  16. 【风控策略】解析闪电贷贷前风控策略
  17. 愿的真心人,白首不相离
  18. 文字环绕图片效果实现
  19. 计算机用户如何退出系统,四种方法教你退出Windows10账户
  20. bootstrap 后端模板_bootstrap 后台框架主题下载

热门文章

  1. 导出指定layer或指定区域layout的GDS
  2. 安徽大学计算机学院张静,安徽大学2011年国家励志奖学金获奖学生名单
  3. 搜狐Q3由盈转亏:预计全年收入下滑12%,张朝阳归因于不确定性
  4. CSDN:2021博客之星年度总评选大赛投票
  5. goldendict for linux,GoldenDict(for Linux)配置无道词典
  6. 图片像素大小怎么调整,批量调整图片像素
  7. 各平台安装OpenCV
  8. JavaScript 透明背景色
  9. 张桂梅PK清华副教授:不要站在高楼上,傲慢地指着大山
  10. iosbanner_ios图片的局部拉伸-------App首页banner图的iPhone X适配