前言

本文讨论如何使用 CUDA 对代码进行并行优化,并给出不同并行思路对均值滤波的实现。

并行优化的两种思路

思路1: global 函数

在 global 函数中创建出多个块多个线程对矩阵每个元素进行并行计算

请参考:http://www.cnblogs.com/scut-fm/p/3750119.html

思路2: CUDA 库

将遍历矩阵分别对每个元素的操作转化成以矩阵整体为单位的操作

请参考:http://www.cnblogs.com/scut-fm/p/3756242.html

两种思路在均值滤波中的应用

思路1的应用:创建多个线程,每个线程对其负责元素做均值卷积操作。

思路2的应用:

第一步:将矩阵向上平移一个单位得到矩阵副本1

第二步:将矩阵向下平移一个单位得到矩阵副本2

第三步:将矩阵向左平移一个单位得到矩阵副本3

第四步:将矩阵向右平移一个单位得到矩阵副本4

第五步:将矩阵副本1-4相加然后除以 4 得到结果矩阵

第七篇:使用 CUDA 进行计算优化的两种思路相关推荐

  1. 现代密码学3.1--定义计算安全的两种方法

    现代密码学3.1--定义计算安全的两种方法 三种安全性定义 定义计算安全的两种方法 具体方法/concrete approach 渐进方法/asyptotic approach "高效/PP ...

  2. ML之分类预测:分类预测评估指标之AUC计算的的两种函数具体代码案例实现

    ML之分类预测:分类预测评估指标之AUC计算的的两种函数具体代码案例实现 目录 分类预测评估指标之AUC计算的的两种函数代码案例实现 输出结果 实现代码

  3. 今日头条android反编译,今日头条启动优化:MultiDex 优化(两种方案)

    这是第四篇文章了,也是你们最想看的一篇了,想要观看其他文章请持续关注博主, 需要完整文章的可以在评论区留言或者私信博主 2.2.6 MultiDex 优化(两种方案) 知道了MultiDex原理之后, ...

  4. 二叉树节点数目计算的两种思路

    介绍两种思想,虽然根本上都是遍历每个结点,但是在写代码的时候采用的是不同的思想. 遍历思想 先定义一个类变量就是采用二叉树遍历的代码,在经过每个节点的时候类变量++,具体代码如下: public cl ...

  5. 七牛云图床开启HTTPS域名的两种方式

    我的原文:https://hijerry.cn/p/64756.html https下的http图片 因为自己一直用的是七牛云来管理博客图片,发现在chrome下用https访问博客时看不到博客里的图 ...

  6. 蒙特卡洛数值模拟-计算定积分的两种方法

    原理 法1(撒米法)计算积分 1.他的逻辑原理其实很简单,对于函数图像围成的面积,我们总可以用一个矩形覆盖住,然后在上面撒下一把米(随机抽样),然后去数,那些米粒落在了函数图像围成的面积内,将得到的数 ...

  7. RSA算法计算d的两种方法。

    例题: 假设p=5,q=7,e=5,m=2.计算d,公钥,私钥. 方法一: 解: n=p*q=5*7=35 Φ(n)=(p-1)*(q-1)=4*6=24 由公式:e d mod Φ(n)=== 1 ...

  8. SQL根据出生日期计算年龄的两种算法

    --Sql根据出生日期计算年龄 1.  select datediff(year,EMP_BIRTHDAY,getdate()) as '年龄' from  EMPLOYEEUnChangeInfo ...

  9. java 计算π_Java实现计算圆周率π的两种方法 - 博客频道 - CSDN.NET

    网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本. 博主的思路是: 1.首先对服务器发送http请求. 2 ...

最新文章

  1. POJ--2391--Ombrophobic Bovines【分割点+Floyd+Dinic优化+二分法答案】最大网络流量
  2. python空字典添加元素_python遍历删除字典里值为空的元素报错
  3. php 刷新iframe,js刷新iframe
  4. Restore IP Addresses leetcode java
  5. #用construct2做游戏
  6. 两个字符串的删除操作
  7. Bzoj2656 [Zjoi2012]数列(sequence)
  8. java打包维护_java打包详解
  9. linux一些杂项整理
  10. jquery php 登录验证手机号码,jQuery电话号码验证实例
  11. koa2+html模板,Koa2 路由
  12. 架构师:成为架构师可能会面临的问题
  13. MQTT Qos详解(一)
  14. bom实现方块移动_javascript利用键盘控制小方块的移动
  15. 计算机控制面板 关机时间,怎么设置电脑的自动关机时间
  16. excel批量生成批处理语句另存为.bat文件批量改名
  17. Android 適配器的回調
  18. aspose 插入图片的方法
  19. 法兰克服务器电源维修,FANUC电源模块故障维修
  20. 题223.2022寒假天梯赛训练-7-12 清点代码库 (25 分)

热门文章

  1. 谁是最可爱的人--环卫工人
  2. CSS hack:针对IE6,IE7,IE8,IE9,firefox显示不同效果
  3. postman 安装失败_【Postman】14 Postman与Jenkins集成使用
  4. matplotlib中文乱码
  5. C# 常用类-IO-ClassXML
  6. .net平台下C#socket通信(中)
  7. 大二暑假周进度报告(三)
  8. 匿名内部类的简单使用
  9. UVA, 580 Critical Mass
  10. SQL语句调优 - 索引上的数据检索方法