dim3 block(BLOCK_X, BLOCK_Y);
dim3 grid((roi.width + block.x - 1) / block.x, (roi.height + block.y - 1) / block.y);int y = blockIdx.y * blockDim.y + threadIdx.y;//索引从0开始
int x = blockIdx.x * blockDim.x + threadIdx.x;if (y >= roi.height || x >= roi.width) {return;
}

block定义它的维数, 每维有多少个thread

grid定义每维有多少个grid

roi是原本的数据, 由于原本数据不一定会刚好是block的整数倍, 所以我们需要把超出边界的thread屏蔽掉

x,y为GPU上每个thread的坐标

如果该坐标超出了原本数据在每维的边界,则直接返回.

CUDA里面GRID, BLOCK 边界检测相关推荐

  1. [原]CUDA中grid、block、thread、warp与SM、SP的关系

    [原]CUDA中grid.block.thread.warp与SM.SP的关系 2015-3-27阅读209 评论0 首先概括一下这几个概念.其中SM(Streaming Multiprocessor ...

  2. CUDA中grid、block、thread、warp与SM、SP的关系

    首先概括一下这几个概念.其中SM(Streaming Multiprocessor)和SP(streaming Processor)是硬件层次的,其中一个SM可以包含多个SP.thread是一个线程, ...

  3. CUDA学习第三天:Kernel+grid+block关系

    1. 理一理前两天学到的概念之间的关系 CUDA && GPU CUDA: NIVID的CPUs上的一个通用并行计算平台和编程模型: GPU: CPU+GPU的异构计算架构,CPU所在 ...

  4. cuda笔记-一个Block多线程求卷积

    最近在学cuda,发现自己数学方面的知识不太够,C语言的知识也有待加强. 这里记录个笔记对矩阵求卷积. 逻辑是这样的: 1. 先CUDA生成一个16*16的矩阵: 2. 将这16*16的矩阵,外面包一 ...

  5. cuda-Block和Grid设定

    CUDA的Threading:Block和Grid设定 硬件基本架构 实际上在 nVidia 的 GPU 里,最基本的处理单元是所谓的 SP(Streaming Processor),而一颗 nVid ...

  6. Cuda学习笔记(一)——sm流处理器簇对blocks的调度策略

    由于GPU目前在各行各业的广泛应用,无论是深度学习.大数据.云计算等都离不开GPU的并行加速,前阵子自学了Cuda-c编程,希望将来的研究工作能够用得上. Cuda系列总共有4篇,这里主要用于记录本人 ...

  7. Pytorch+cpp_cuda extension 课程二

    配套视频 1. GPU 并行概论 可参考:gpu与cuda概论 grid -> block -> thread 2. 算法并行分析 feats:(N,8,F) N表示有N个正方体,8表示8 ...

  8. GPU的硬件结构中与CUDA相关的几个概念:thread block grid warp sp sm

    streaming processor(sp): 最基本的处理单元,streaming processor 最后具体的指令和任务都是在sp上处理的.GPU进行并行计算,也就是很多个sp同时做处理.现在 ...

  9. cuda grid 和block理解(二)

    dim3 grid(3, 2); dim3 block(5, 3); 可以转置一下理解 #include <stdio.h> #include <iostream> using ...

最新文章

  1. 中国电子学会青少年编程能力等级测试图形化四级编程题:排序
  2. Sqlserver 错误日志太大导致硬盘空间不足
  3. 《BI那点儿事》Microsoft 决策树算法——找出三国武将特性分布,献给广大的三国爱好者们...
  4. anaconda镜像
  5. 阿里云、腾讯云、华为云哪个好?迄今最全面的云服务评测报告出炉(转)
  6. 盘一盘新冠病毒下,国内外科技公司提出哪些软件解决方案与技术?
  7. Chrome 为何会成功?
  8. 车辆贷款违约预测 Top1(2021科大讯飞)
  9. Ubuntu20.04安装ros教程(实测有用)
  10. java 变量监听_java main函数里面的变量i怎么获取addActionListener监听里jtf_username.getText()的值?...
  11. 美赛流程以及经验分享
  12. linux lightdm.conf,lightDM(Light Display Manager)简介
  13. GBase xdm产品特点
  14. change在c语言中的用法,change的过去式和用法例句意思及阅读
  15. 蓝桥杯泊松分酒java_蓝桥杯-泊松分酒 - steven_wjg的个人空间 - OSCHINA - 中文开源技术交流社区...
  16. tensorflow 2.0 基础操作 之 不同 dim 对应的具体含义
  17. m35c android 4.4,索尼M35c电信版评测:Android 4.1系统和娱乐体验
  18. module xxx missing dependencies
  19. Zprotect patch KEY 脱壳
  20. Convolutional Networks for Image Semantic Segmentation

热门文章

  1. java 中 class 对象_java中Class对象详解
  2. java 抽象属性_怎样在java中定义一个抽象属性
  3. 互联网产品开发中的“快”字诀
  4. springboot 2.0 Redis command timed out的解决
  5. 《Java从入门到放弃》JavaSE入门篇:面向对象语法二(入门版)
  6. Java父类与子类中静态代码块 实例代码块 静态变量 实例变量 构造函数执行顺序...
  7. 2017 年十大网页设计趋势
  8. 存储过程系列之存储过程返回值总结
  9. 【Ajax技术】解决XHR与中文乱码问题
  10. 实训汇编语言设计——16位数拆分为4组