CUDNN学习笔记(2)
Tensor描述符:
该cuDNN库描述了数据保存图像,视频和任何其他数据的内容与通用n-D张量定义与以下参数:
- 一个尺寸dim为3到8
- 数据类型(32位浮点,64位浮点,16位浮点...)
- dim整数类型定义每个维度的大小
- dim整数类型定义每个维度的步幅(例如,为了从同一维度到达下一个元素而添加的元素的数量)
前两个维度分别定义批量(batch)大小n和特征图c的数量。 该张量定义允许例如通过使一维的步幅小于下一维的尺寸和步幅的乘积而在相同张量内具有彼此重叠的一些尺寸。 在cuDNN中,除非另有规定,否则所有程序都将支持具有重叠尺寸的张量,以用于正向输入张量,但是输出张量的尺寸不能重叠。 尽管这种张量格式支持负跨度(对于数据镜像可能有用),但除非另有说明,否则cuDNN例程不支持负跨度的张量。
WXYZ张量描述符:
张量描述符格式使用首字母缩略词来标识,每个字母都引用相应的维度。
- 所有的进步都是严格肯定的
- 字母所引用的尺寸按其各自步幅的降序排列
4-D张量描述符:
使用4维张量描述符来定义4个字母的批量2D图像的格式:N,C,H,W分别表示批量大小,特征图的数量,高度和宽度。 这些字母按照步幅的降序排列。 常用的四维张量格式是:
- NCHW
- NHWC
- CHWN
5-D张量描述符:
5-D Tensor描述符用于定义批量3D图像的格式,包含5个字母:N,C,D,H,W分别表示批量大小,特征图的数量,深度,高度和宽度。 这些字母按步伐的递减顺序排序。 常用的5维张量格式称为:
- NCDHW
- NDHWC
- CDHWN
Fully-packed 张量:
张量被定义为XYZ-fully-packed当且仅当:
- 张量维数等于完整填充后缀之前的字母数。
- 第i维的步幅等于(i + 1)维乘以第(i + 1)步的乘积。
- 最后一个维度的步幅是1。
Partially-packed 张量:
部分“XYZ压缩”术语仅适用于用用于定义部分压缩张量的字母超集描述的张量格式的上下文。 WXYZ张量定义为XYZ-packed当且仅当:
- 在-packed后缀中未引用的所有维度的跨度大于或等于下一个跨度的下一个维度的乘积。
- 在位置i的-packed后缀中引用的每个维度的步幅等于(i + 1)-st维度乘以(i + 1)-st步幅的乘积。
- 如果最后张量的维数存在于-packed后缀中,则步幅为1
例如,NHWC张量WC包装意味着c_stride等于1,w_stride等于c_dim x c_stride。 实际上,-packed后缀通常具有张量变化最小的尺寸,但是也可以参考仅N-packed的NCHW张量。
空间填充张量:
空间填充张量定义为空间维度中的部分填充。
例如,空间压缩的4D张量将意味着张量是NCHW HW-packed或CNHW HW-packed。
重叠张量:
如果遍历整个维度范围多次产生相同的地址,则张量定义为重叠。
在实践中,重叠张量对于来自[1,nbDims]区间的一些i,将具有步幅[i-1]
CUDNN学习笔记(2)相关推荐
- cuDNN学习笔记(3)-- 卷积公式
卷积公式 卷积公式的参数 卷积公式 标准的卷积公式 带填充的卷积公式 欠采样的卷积公式 膨胀的卷积公式 使用卷积模式的卷积公式 使用分组卷积模式的卷积公式 小结 cuDNN提供了各种各样的API函数, ...
- 【theano-windows】学习笔记十一——theano中与神经网络相关函数
前言 经过softmax和MLP的学习, 我们发现thenao.tensor中除了之前的博客[theano-windows]学习笔记五--theano中张量部分函数提到的张量的定义和基本运算外, 还有 ...
- AI学习笔记(九)从零开始训练神经网络、深度学习开源框架
AI学习笔记之从零开始训练神经网络.深度学习开源框架 从零开始训练神经网络 构建网络的基本框架 启动训练网络并测试数据 深度学习开源框架 深度学习框架 组件--张量 组件--基于张量的各种操作 组件- ...
- Caffe学习笔记2--Ubuntu 14.04 64bit 安装Caffe(GPU版本)
0.检查配置 1. VMWare上运行的Ubuntu,并不能支持真实的GPU(除了特定版本的VMWare和特定的GPU,要求条件严格,所以我在VMWare上搭建好了Caffe环境后,又重新在Windo ...
- PyTorch学习笔记(一):PyTorch环境安装
往期学习资料推荐: 1.Pytorch实战笔记_GoAI的博客-CSDN博客 2.Pytorch入门教程_GoAI的博客-CSDN博客 本系列目录: PyTorch学习笔记(一):PyTorch环境安 ...
- 【长篇博文】Docker学习笔记与深度学习环境的搭建和部署(二)
长篇博文记录学习流程不容易,请关注.转发.点赞.评论,谢谢! 上一篇文章:Docker学习笔记与深度学习环境的搭建和部署(一) 文章末尾附加nvidia455.23.cuda11.1.cudnn8.0 ...
- 《基于GPU加速的计算机视觉编程》学习笔记
<基于GPU加速的计算机视觉编程>学习笔记(1) 最近打算 准备工作 CUDA开发环境(主要是查看N卡的信息) 在WIN10下安装CUDA工具包 最近打算 在训练模型的时候,感觉电脑非常吃 ...
- PaddlePaddle飞桨论文复现营——3D Residual Networks for Action Recognition学习笔记
PaddlePaddle飞桨论文复现营--3D Residual Networks for Action Recognition学习笔记 1 背景知识 1.1 C3D C3D是一种3D卷积提取视频特征 ...
- 视觉学习笔记6——YOLOv5(v6.2)部署与代码理解
文章目录 前言 一.YOLOv5是什么? 二.环境搭建 1.基本环境 2.特殊环境 三.自定义训练 模型训练 模型测试 四.源码个人理解 1.detect.py文件 2.yolo.py文件 3. tr ...
- 9月6日关键点检测学习笔记——人脸和手部特征点检测
文章目录 前言 一.干扰因素 1.主动因素 2.固有因素 二.特征点检测 1.PFLD 2.LLCV 三.人脸比对 1.人脸 1:1 2.人脸 1:n 3.人脸 1:N 4.人脸 M:N 四.高清分辨 ...
最新文章
- PIE SDK与IDL算法结合说明文档
- opencv 环境变量
- Linq 团队的问题
- 吴恩达 coursera AI 专项四第三课总结+作业答案
- .net Core 3 preview 3试用 WPF,winform桌面开发
- 绿色vmware 安装后看不到虚拟的网卡
- 软件工程学习笔记《一》什么是软件工程
- ArcEngine由点生成TIN
- jzoj4313 电话线铺设(最小生成树+最近公共祖先)
- android qq音乐api使用,QQ音乐API
- python点击按钮弹出新窗口_PyQt5点击button如何弹出新窗口?
- 如何下载vSphere Big Data Extensions 1.0免费试用版
- ibatis中输入/输出各种类型的参数分析及#与$区别 (转)
- 【C语言】案例四十八 综合案例——天生棋局(围棋棋盘)
- 手机wap浏览器的设计
- MySQL:explain结果中Extra:Impossible WHERE noticed after reading const tables
- 12 最长考拉兹序列
- nvivo服务器项目,【NVivo教程】用Nvivo为研究团队设立主项目
- Python学习,用python制作字符版gif图
- 学习笔记整理:Photoshop软件应用-图层混合与样式