原标题:并行化计算与CUDA编程

近年来,显卡的更新换代也比较快,NVIDIA今年的发布会也宣布了RTX3080TI即将到来。显卡的运算能力也越来越强。

很多人对显卡的了解可能源于游戏,但是你的显卡不止能用来打游戏,还可以利用CUDA编程,对图像处理、机器学习等诸多领域进行大幅度的提速。

如今GPU的发展越来越快,在图像处理和深度学习领域更为突出,很多的计算机开源库,如OpenCV, TensorFlow,pytorch等等都提供了CUDA接口。很多的开源项目也提供了使用GPU的情况,比如yolov3等,可以说GPU由于其高效,使用也越来越普遍。

本课程属于CUDA入门的课程,旨在让学员对GPU的架构以及GPU编程有一个初步的认识,能在实际情况下用CUDA完成一些并行化的加速。了解了CUDA的原理和调用方法,可以在日常中用CUDA解决更多并行化的问题,而不受限于开源库的API接口。

第1课

从零开始,手把手的环境搭建教程:CUDA硬件环境,软件环境介绍,CUDA在WINDOWS和Linux平台上的详细安装步骤,GPU与CPU数据传输简单示例

第2课

快速掌握CUDA编程基础原理:介绍CUDA编程的并行原理,了解线程、线程块、网格等概念,了解CUDA的同步机制,CUDA官方库的使用

第3课

CUDA编程实战:利用CUDA实现几种常见的模型,如映射变换、累计求和、转置与排序,获得大幅度提速

第4课

程序调试,BUG定位,快速修正代码bug的技巧:CUDA的简单调试,对CUDA进行计时找到耗时点,输出CUDA的错误信息,方便修改,CUDA可视化工具的使用

第5课

CUDA提速的高级技巧,CUDA流的应用:CUDASTREAM,CUDA流的使用、同步,用CUDA流完成矩阵运算

第6课

OPENCV介绍,手把手教你安装,配置和使用OPENCV(在后续的课程中需要对图片进行操作,所以这里会简单介绍OPENCV图像开源库)

第7课

实时图片渲染,CUDA+OPENCV的图像处理实战:利用CUDA进行图像处理(灰度变换,直方图增强等)

第8课

CUDA提速的综合示例:用CUDA实现图片的图像色彩分割

课程将于2020年9月12日开课,课程持续时间大约为10周。

叶智铭

毕业于中山大学数学与应用数学专业。参与过医学图像处理、文本比对加速等CUDA项目,有着丰富的CUDA编程经历和实践经验。

Windows(visual stdio)或Linux系统,NVIDIA显卡

课程基础:

对C++有一定基础

涉及语言:

C++,CUDA

对并行计算,CUDA编程感兴趣的同学,不需要有太多的基础知识

具备GPU和CUDA编程能力,能够分清适合用CUDA加速的场景,对实际应用中的场景也能使用CUDA进行加速返回搜狐,查看更多

责任编辑:

linux运行并行计算cuda,并行化计算与CUDA编程相关推荐

  1. 两种GPU计算平台:CUDA 与 OpenCL

    目录 1.硬件层面 2.操作系统 3.软件和社区 4.编程模型 5.CUDA 的优点和局限性 优点 限制 6.OpenCL 的优点和限制 优点 限制 7.补充一点 参考 1.硬件层面 图形加速器的三大 ...

  2. mtensor一个tensor计算库,支持cuda延迟计算

    1 mtensor mtensor是一个tensor计算库, 支持cuda的延迟计算, 项目地址为https://github.com/matazure/mtensor. 2 背景 延迟计算具有避免额 ...

  3. Linux 桌面玩家指南:16. 使用 CUDA 发挥显卡的计算性能

    Linux 桌面玩家指南:16. 使用 CUDA 发挥显卡的计算性能 原文:Linux 桌面玩家指南:16. 使用 CUDA 发挥显卡的计算性能 特别说明:要在我的随笔后写评论的小伙伴们请注意了,我的 ...

  4. CUDA 并行计算 机器学习 NVCC CUDNN CUDATOOLKIT CUDA DRIVER 显卡驱动(NVIDIA Driver) 显卡(GPU)

    微信公众号: 点击蓝色字体小白图像与视觉进行关注 关于技术.关注yysilence00.有问题或建议,请公众号留言 整理知识,学习笔记 发布日记,杂文,所见所想 CUDA 并行计算 机器学习 NVCC ...

  5. Linux 2 的 Windows 子系统上发布 CUDA

    Linux 2 的 Windows 子系统上发布 CUDA 为响应大众需求,微软 宣布 在 2020 年 5 月的 建造 大会上推出了 建造 ( WSL 2 ) – GPU 加速功能.这一特性为许多计 ...

  6. 适用于Linux 2的Windows子系统上的CUDA

    适用于Linux 2的Windows子系统上的CUDA Announcing CUDA on Windows Subsystem for Linux 2 为了响应大众的需求,微软在2020年5月的构建 ...

  7. CUDA编程(一):GPU计算与CUDA编程简介

    CUDA编程(一):GPU计算与CUDA编程简介 GPU计算 GPU硬件资源 GPU软件资源 GPU存储资源 CUDA编程 GPU计算 NVIDIA公司发布的CUDA是建立在GPU上的一个通用并行计算 ...

  8. CUDA加速计算矩阵乘法进阶玩法(共享内存)

    CUDA加速计算矩阵乘法&进阶玩法~共享内存 一.基础版矩阵乘法 二.为什么可以利用共享内存加速矩阵乘法 1.CUDA内存读写速度比较 2.申请共享内存 三.改进版矩阵乘法(利用共享内存) 一 ...

  9. CUDA加速计算的基础C/C++

    本文是Nvidia 90美金的课程笔记 无论是从出色的性能,还是从易用性来看,CUDA计算平台都是加速计算的制胜法宝.CUDA 提供了一种可扩展 C.C++.Python 和 Fortran 等语言的 ...

最新文章

  1. Linux下测试的c++的使用
  2. 马斯克:“星链”卫星已能提供服务
  3. pgsql 运行状态 采集脚本
  4. ADO.net 中数据库连接方式
  5. ThinkPHP下隐藏index.php以及URL伪静态
  6. Flask 第三方组件之 SQLAlchemy
  7. 华为P40系列全家福亮相:DxO冠军宝座已预订
  8. 线性代数的相关计算(numpy)
  9. CSS-行内框、行框、行高
  10. .net core 实践笔记(一)--开篇
  11. 小米路由器mini实现锐捷认证.
  12. 荔枝派Nano 全流程指南
  13. ex10_10MyInteger类
  14. 物联卡中心:物联网卡代理商这么多,我怎么选?
  15. SAP BW顾问如何保持市场竞争力?【转自WKingChen的博客】
  16. java公路赛_为什么Java公路车总被黑?
  17. 30岁以前该做什么,30岁以后该做什么!!很有道理
  18. 信息系统集成-范围管理错题
  19. 拨开字符编码的迷雾--编译器如何处理文件编码
  20. Java小白入门200例56之鸡兔同笼问题

热门文章

  1. 124第十四章—权限的配置
  2. win8笔记本关闭小键盘
  3. VMware vCenter Server Appliance 模板部署
  4. 防御暴力破解SSH攻击
  5. kubernetes资源管理
  6. 收缩sqlserver事务日志
  7. 安卓航班Android开发经典教程大总结1----基础编程及源码推送
  8. Public权限下的列目录
  9. vc通过ADO连接sql server 2000的核心代码
  10. 什么时候用removeUnusedSpriteFrames和removeUnusedTextures