了解cuda和显卡等基本概念
1.如何运行
make run
2.显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn到底是什么?
关于显卡驱动与cuda驱动的版本匹配
- Table 1. CUDA 11.6 Update 1 Component Versions
- 结论:尽量将显卡驱动升级到新的,因为显卡驱动向下兼容cuda驱动
- 简单了解显卡相关概念
- 显卡:GPU
- 显卡驱动:驱动软件,类比声卡驱动,摄像头驱动
- GPU架构:gpu架构指的是硬件的设计方式,例如是否有L1 or L2缓存
- CUDA: 其中一种理解是它是一种编程语言(像c++,python等,只不过它是专门用来操控GPU的)
- cudnn: 这个其实就是一个专门为深度学习计算设计的软件库,里面提供了很多专门的计算函数
- CUDAToolkit:这是我们真正需要首先安装的工具包,所谓的装cuda首先指的是它
- 它里面包含了许多库,例如:cudart, cublas等
- 其他涉及到的知识有nvcc与nvidia-smi, 多个 cuda 版本之间进行切换, cuda的安装等
- 详细请参考: https://zhuanlan.zhihu.com/p/91334380
3.cuda-driver-api 与 cuda-runtime-api
- CUDA Driver与CUDA Runtime相比更偏底层,就意味着Driver API有着更灵活的控制,也伴随着更复杂的编程
- 因此CUDA driver需要做显式的初始化
cuInit(0)
,否则其他API都会返回CUDA_ERROR_NOT_INITIALIZED
- 经过初始化后驱动和显卡的信息可以轻松获取:
- 驱动版本管理 https://docs.nvidia.com/cuda/archive/11.2.0/cuda-driver-api/group__CUDA__VERSION.html#group__CUDA__VERSION
- 设备信息管理 https://docs.nvidia.com/cuda/archive/11.2.0/cuda-driver-api/group__CUDA__DEVICE.html
4.写在文末
CUDA的在线文档地址
- https://developer.nvidia.com/cuda-toolkit-archive
- https://docs.nvidia.com/cuda/archive/11.2.0/
报错
- 提示nvcc错误。对于gcc版本大于等于8的不支持,需要修改Makefile中的g++为g++7或者更低
5.C++基础(供C++小白参考) 5.1 编译基础知识
- “c++脚本程序写完之后,并不能直接运行,需要进行编译,转成.o文件,再链接才能运行”
5.1.1 单文件或少文件编译
- 源文件[.c/cpp] -> Object文件[.o]
g++ -c [.c/cpp][.c/cpp]... -o [.o][.o]... -I[.h/hpp]
g++是编译命令 -c,-o,-I是选项 -c接源脚本文件 -o接目标文件 -I接头文件
(-c c++ /-o object/ -I include)
5.1.2 多文件编译(使用Makefile 和 CMake)
cmake比Makefile高级,但是两者的功能都是快速地进行批量的编译(因为当你有很多的c++源文件的时候,一个一个地去用g++去编译是很麻烦的)
makefile详情参考资料
- (1)https://zhuanlan.zhihu.com/p/396448133
了解cuda和显卡等基本概念相关推荐
- NVIDIA支持CUDA的显卡选型简述
** NVIDIA支持CUDA的显卡选型简述 ** 目录 NVIDIA支持CUDA的显卡选型简述 一.概述 1.为什么选这三款 二.对比 1.训练--training CPU与GPU的区别 计算精度 ...
- CUDA 并行计算 机器学习 NVCC CUDNN CUDATOOLKIT CUDA DRIVER 显卡驱动(NVIDIA Driver) 显卡(GPU)
微信公众号: 点击蓝色字体小白图像与视觉进行关注 关于技术.关注yysilence00.有问题或建议,请公众号留言 整理知识,学习笔记 发布日记,杂文,所见所想 CUDA 并行计算 机器学习 NVCC ...
- CUDA并行加速一 -- 名词概念
CUDA并行加速一 ------ 名词概念 在做CUDA并行加速时首先要明确几个概念,什么是显卡,什么是显卡驱动,什么是显卡内存,什么是GPU,什么是CUDA,什么是Cudnn. 显卡 不由分说,显卡 ...
- GPU中与CUDA相关的几个概念
GPU中与CUDA相关的几个概念 标签: cudathread任务编程存储 2012-06-04 12:42 2998人阅读 评论(0) 收藏 举报 分类: GPU(284) 计算机系统(78) 硬件 ...
- Linux 桌面玩家指南:16. 使用 CUDA 发挥显卡的计算性能
Linux 桌面玩家指南:16. 使用 CUDA 发挥显卡的计算性能 原文:Linux 桌面玩家指南:16. 使用 CUDA 发挥显卡的计算性能 特别说明:要在我的随笔后写评论的小伙伴们请注意了,我的 ...
- CUDA计算能力显卡对照表
CUDA计算能力&显卡对照表: 最新信息参考这个: https://developer.nvidia.com/cuda-gpus Tesla Workstation Products GPU ...
- 银河麒麟/Ubuntu安装cuda和显卡驱动、cuDNN
银河麒麟/Ubuntu安装cuda和显卡驱动 银河麒麟介绍 第一步:更换apt软件源(换过的忽略) 安装前的准备 确认安装环境 安装cuda以及显卡驱动 安装CUDNN 退出tty模式,完成安装 银河 ...
- Linux下Matlab+CUDA双显卡环境搭建(核显+独显)
Linux下Matlab+CUDA双显卡环境搭建(核显+独显) 最近在疯狂爱上Matlab,没办法爱折腾.皇天不负有心人,还是被本大神搞出来了,羡慕吧,嫉妒吧,反正我也看不见.(附上战果图) 硬件环境 ...
- 低CUDA算力显卡用上高版本pytorch(ubuntu18.04源码编译特定版本pytorch(v1.10.0))
低CUDA算力显卡用上高版本pytorch(ubuntu18.04源码编译特定版本pytorch(v1.10.0)) 一 电脑配置 二 正常情况下源码编译步骤 三 我的编译过程及出现的问题 首先 安装 ...
最新文章
- Oracle自治事务
- mysql amoeba 配置_Amoeba新版本MYSQL读写分离配置
- Fifth Week:Node.js学习
- 软件配置管理(六)常用配置软件配置工具指令
- idea 读取md文件卡死
- 学习C语言必须掌握的10个经典的C语言小程序
- 使用shell命令文件和lame工具在mac平台批量压缩mp3,可压缩至原来的50%左右。
- STM32F030外部中断配置
- 功率放大器的性能指标
- b、blockquote、base、bdo、big、标签
- 自然语言处理系列十七》中文分词》分词工具实战》Python的Jieba分词
- 计算机科学与技术学校学科评估,计算机科学与技术学科评估具体排名「大学专业排名」...
- 如何购买服务器及域名(阿里)
- view路由传参方法
- oracle各个版本数据库软件下载方法
- c++如何保留两位小数
- 【C语言】求s=1+(1+2)+(1+2+3)+....+(1+2+3+....+n)值
- 刚打印完色3D模型不能完成取下来
- 第1章 持续交付2.0
- 乐华娱乐再度冲刺港股:业务高度依赖王一博 ​9个月经营利润降41%