CUDA编程基础与实践学习笔记（一）

开个坑…
用pytorch太不灵活了，学习一下CUDA编程。
研究生都第二年了，坚持不下去就有点丢人了奥。
书名见标题，樊哲勇老师的著作，清华大学出版社出版。
重点看前面十二章。
初次阅读，如有理解错误恳请大家批评指正~mua

第一章
GPU(graphics processing unit)，显卡。与CPU的区别：CPU有更多晶体管，用于数据缓存和流程控制，只有少数几个逻辑计算单元，适合完成复杂的逻辑计算；GPU有数千个核心，适合大规模矩阵运算。

（GPU的DRAM和CPU的DRAM是通过PCIe总线来通信的~，所以两者在程序中是否能够直接访问对方的存储空间呢？）
异构计算指CPU+GPU两种不同设备的协作计算，CPU为host,GPU为device。书中使用的GPU均为Nvidia GPU，CUDA编程目前仅支持该公司的GPU。有以下几个系列：

雀食，实验室的GPU都是Tesla,自己打游戏的主机是GeForce的。
计算能力表达为X.Y的形式：

前者为主版本号，后者次版本号。但这个并不代表性能，只能为程序运行时判断硬件特征提供依据。版本号越大，GPU架构(architecture)越新。Tesla既是第一代GPU架构的名字，也是科学计算系列GPU的总称，要依据上下文判断。
主版本号一般会绑定一个GPU架构的名字，所以今后看到GPU架构的名字就要大概明白其计算能力如何。而不同的系列(如tesla, quadro, geforce, jetson)针对不同的应用场景。第一代架构Tesla和第二代架构fermi已经不支持最新CUDA。查看GPU架构： developer.nvidia.com/cuda-gpus。

一个疑问：

目前还是对计算能力没什么清晰的概念。Tesla不愧是适合科学计算的GPU啊，双进度浮点计算的峰值是单精度的1/2,1/3，相比之下GeForce却只有1/32，可能盲僧R闪的角度不需要用32为浮点数来计算8hhhhhh
还有个疑问，如果程序超过了GPU显存容量，此时使用统一内存难道程序就能正确运行了？统一内存是啥？

GeForce 2070计算能力强于V100，但后者计算性能更强，也更贵。
GPU编程工具：CUDA,OpenCL(AMD)

CUDA提供了两层API：CUDA driver API(底层，灵活，不好用), cuda runtime API(高级，可读性强)，两者性能无差别。确实，有的时候发现nvidia-smi出来(runtime)的CUDA版本和nvcc -V(driver)出来的CUDA版本不一样，但也可以运行。根据下图这个层级关系，driver的版本应该高于runtime的版本，

CUDA版本是GPU软件开发平台的版本，计算能力对应GPU硬件架构的版本(先暂时将计算能力等同为GPU架构版本号吧，暂时还不知道用什么来衡量这个计算能力)。高架构GPU需要高版本CUDA，CUDA 10.2将CUDA C改为CUDA C++，强调CUDA c++是C++的拓展。
一个疑问：这个有意思了，是不是10.2之前不支持C++的一些操作？

nvidia-smi后，可以发现目前GPU在WDDM模式，只有高端计算型Tesla和渲染型quadro和TITAN支持切换，消费型GeForce不支持。
TCC：该模式下，GPU 完全用于计算，不能作为本地显示输出。

WDDM：该模式下，GPU 既用于计算又用于本地显示输出。

关于TCC模式和WDDM模式：https://dinone.kf5.com/hc/kb/article/1410366/

疑问

CUDA编程基础与实践学习笔记（一）相关推荐

2023年的深度学习入门指南(10) - CUDA编程基础
2023年的深度学习入门指南(10) - CUDA编程基础上一篇我们走马观花地看了下SIMD和GPGPU的编程.不过线条太粗了,在开发大模型时遇到问题了肯定还会晕. 所以我们还是需要深入到CUDA中 ...
AI Studio 飞桨零基础入门深度学习笔记1-深度学习的定义
AI Studio 飞桨零基础入门深度学习-笔记人工智能.机器学习.深度学习的关系机器学习机器学习的实现机器学习的方法论案例:牛顿第二定律确定模型参数模型结构介绍深度学习神经网络的 ...
AI Studio 飞桨零基础入门深度学习笔记4-飞桨开源深度学习平台介绍
AI Studio 飞桨零基础入门深度学习笔记4-飞桨开源深度学习平台介绍深度学习框架深度学习框架优势深度学习框架设计思路飞桨开源深度学习平台飞桨开源深度学习平台全景框架和全流程工具模 ...
NVIDIA可编程推理加速器TensorRT学习笔记（二）——实操
NVIDIA可编程推理加速器TensorRT学习笔记(二)--实操 TensorRT 是 NVIDIA 自家的高性能推理库,其 Getting Started 列出了各资料入口,如下: 本文基于博 ...
AI Studio 飞桨零基础入门深度学习笔记6.3-手写数字识别之数据处理
AI Studio 飞桨零基础入门深度学习笔记6.3-手写数字识别之数据处理) 概述前提条件读入数据并划分数据集扩展阅读:为什么学术界的模型总在不断精进呢? 训练样本乱序.生成批次数据校验数 ...
JAVA基础与高级学习笔记
JAVA基础与高级学习笔记 /记录java基础与高级,除了较简单的内容,没有必要记录的没有记录外,其余的都记录了/ java初学者看这一篇就够了,全文 6万+ 字. JAVA基础 java会出现内存溢 ...
CUDA编程基础知识整理
CUDA编程基础知识整理 CUDA编程和GPU架构基本概念 CUDA核函数调度方式前言:最近在尝试通过CUDA加速Swin Transformer,第一次接触CUDA的相关知识,将这些天学习到的内容 ...
.NET Core 在 K8S 上的开发实践--学习笔记
摘要本主题受众是架构师,开发人员,互联网企业 IT 运维人员.大纲:1. K8S 对应用的要求:2. .NET Core 上 K8S 的优势:3. K8S 下的 .NET Core 配置:4. .N ...
自学python能学成吗-没有任何编程基础可以直接学习python语言吗？学会后能够做什么？...
很明确的说 python非常适合没有任何编程基础的人入门.. 目前应用最多的:全栈开发.数据分析.运维开发,今天我们就以这三个重点的岗位来做一下自学Python的规划,希望你在学之前就能有结果的来走得 ...

CUDA编程基础与实践学习笔记（一）

CUDA编程基础与实践学习笔记（一）相关推荐

最新文章

热门文章

CUDA编程 基础与实践 学习笔记（一）

CUDA编程 基础与实践 学习笔记（一）相关推荐

最新文章

热门文章

CUDA编程基础与实践学习笔记（一）

CUDA编程基础与实践学习笔记（一）相关推荐