课程名称:使用 CUDA C/C++ 中的 GPU 加速库加速应用程序

学习模式:随时随地在线自学,并在云端GPU服务器上进行实践练习

预备知识:“使用 CUDA C/C++ 加速应用程序” 课程或类似经验

课程时长:2小时

语言: 英文

学习如何使用 CUDA 优化库加速您的 C/C++ 应用程序,从而实现对 NVIDIA GPU 大规模并行能力的利用。您将完成三个练习,包括如何:

  • 使用cuBLAS加速基本矩阵乘法

  • 通过向先前的cuBLAS调用添加一些cuRAND API调用来组合库

  • 使用nvprof分析代码并使用一些CUDA Runtime API调用进行优化

完成本课程后,您将可以在现有的仅支持CPU的 C / C ++程序中,利用一些支持CUDA的库来加速应用程序。

如何开始学习本期课程

用电脑的Chrome或Firefox浏览器访问DLI官网 www.nvidia.cn/dli,选择个人学习栏目下的相应课程,点击课程名称以展开课程介绍,再点击按钮开始学习

DLI培训咨询

如遇到问题,请在微信中添加DLI小助手 (微信号DLIChina)。

“新人有礼”免费体验DLI课程

如果您从来没有添加过DLI小助手(微信号 DLIChina),现在可以添加并发送暗号“NVIDIA 微信 + 姓名 + 单位或学校”来索取一个免费课程学习代码,用于学习DLI“个人学习”中的任意一门2小时课程(课件可长期使用)。

数量有限,先到先得!

关于 NVIDIA 深度学习学院(DLI)

面向开发者、数据科学家和研究人员,DLI 在全球提供深度学习和加速计算的应用实践培训。通过在云端完全配置的 GPU 服务器上训练和部署神经网络,亲自实践完成应用项目开发,掌握深度学习应用开发的策略、方法、资源和端到端流程。参与者完成每一个8小时主题培训后,还可以获得NVIDIA培训证书,助力职业发展。

了解更多或查询全部课程 www.nvidia.cn/dli

点击“阅读原文”,了解NVIDIA深度学习学院更多课程。

chrome 使用gpu 加速_DLI每周一课|用CUDA C的GPU加速库加速应用程序(新人有礼)相关推荐

  1. GPU驱动“后摩尔定律时代” 为HPC和深度学习提供强大加速动力

    中国HPC领域盛会2015年全国高性能计算学术年会(HPC China 2015)今日在无锡开幕.全球视觉计算的行业领袖NVIDIA®(英伟达™)及应用其GPU的众多企业和科研机构,带来近20场报告和 ...

  2. float gpu 加速_(总结篇)使用 MATLAB GPU 加速计算|MATLAB 并行计算与分布式服务器|MATLAB技术论坛...

    本帖最后由 蓝云风翼 于 2013-12-18 17:28 编辑 注: 利用gpu加速有一下工具 1.JACKET 可从帖子中寻找 2.MATLAB a.并行计算工具箱 gpuArray,查看支持gp ...

  3. 【GPU】Nvidia CUDA 编程基础教程——利用基本的 CUDA 内存管理技术来优化加速应用程序

    博主未授权任何人或组织机构转载博主任何原创文章,感谢各位对原创的支持! 博主链接 本人就职于国际知名终端厂商,负责modem芯片研发. 在5G早期负责终端数据业务层.核心网相关的开发工作,目前牵头6G ...

  4. opencv python gpu加速_在Windows上使用OpenCV和Python进行硬件加速解码(MSMT/IntelMFX/FFMPEG/any-backend)...

    我无法在Windows10上使用OpenCV进行硬件加速解码. 有什么提示吗?我已经在最新的opencv4.1.0forwindows中编译并尝试了所有的后端. 我对MSMF解码最有信心,因为它支持D ...

  5. lammps—报错记录—gpu加速—ERROR:unable to initialize —cuda driver error 4 ... ‘geryon/nvd_device.h‘

    在使用lammps的gpu加速的时候遇到了很多问题,这个问题看了很多论坛都没有找到好的解答,把我的情况和解决方案记录在这里,希望对大家有帮助. 一.报错情况 输入命令: haichao@node01: ...

  6. 树莓派 cuda加速_或许是在Jetson上使用GPU加速最简单的方法

    真的,标题没骗大家.这里说的最简单不仅是使用简单,安装配置也很简单.只需Python基础.顺利的话,2小时差不多就能学完了. GPGPU技术已经推广好多年了,但GPU编程对很多人来说还是有不小的门槛和 ...

  7. CUDA刷新:GPU计算生态系统

    CUDA刷新:GPU计算生态系统 CUDA Refresher: The GPU Computing Ecosystem 这是CUDA Refresher系列的第三篇文章,其目标是刷新CUDA中的关键 ...

  8. gpu云服务器运行游戏_在滴滴云 GPU 服务器上使用NVIDIA NGX环境搭建

    1.NGX 简介 NVIDIA NGX是一个新的深度学习技术,将基于AI的加速和增强图像.视频处理的功能直接集成到应用程序中.NVIDIA NGX利用Tensor Core最大限度地提高其运行效率,因 ...

  9. GPU 编程入门到精通(四)之 GPU 程序优化

    版权声明:本文为博主原创文章,未经博主允许不得转载. 目录(?)[+] 博主由于工作当中的需要,开始学习 GPU 上面的编程,主要涉及到的是基于 GPU 的深度学习方面的知识,鉴于之前没有接触过 GP ...

最新文章

  1. python怎么输入代码-python中如何设置代码自动提示
  2. 替换UI--遮挡问题
  3. Integration testing
  4. 关于站库分离渗透思路总结
  5. pytorch机器学习_机器学习— PyTorch
  6. nginx php oracle,第8天 ORACLE安装及NGINX整合PHP环境
  7. How to install Aptana Studio 3 on Ubuntu 12.04 LTS (Precise Pangolin)
  8. activate-power-mode,让你在Python编码中,感受炫酷的书写特效!
  9. go结构体初始化_golang中结构体的初始化方法(new方法)
  10. 2018年6月26日笔记
  11. 项目中遇到的所有ECharts图表集合
  12. Proc恢复数据文件
  13. 强化学习(二)--动态规划寻找最优策略
  14. ACL2021最佳论文出炉,来自字节跳动
  15. 梅特勒托利多xk3124电子秤说明书_梅特勒托利多称重仪表XK3124 B520
  16. [画皮Ⅱ/画皮2][BD-RMVB.720p.国语中字][2012年最新奇幻]
  17. 随手记安全吗?随手科技获选深圳市南山区“绿色通道”企业
  18. 学习模拟集成电路的九个阶段
  19. Web APIs第01天笔记——Web API介绍
  20. 多么痛的领悟 ——我的2013拾遗总结

热门文章

  1. 大白话系列之java_并发系列2-大白话聊聊Java并发面试问题之Java 8如何优化CAS性能?【石杉的架构笔记】...
  2. Spring依赖注入的两种方式(根据实例详解)
  3. oracle11g的tnstimeout,redhat下oracle11g 配置listener.ora
  4. 什么时候出来的_DNF手游官网正版什么时候出来?地下城手游上线日期分享
  5. 2019.8.21页面功能的实现
  6. 北风设计模式课程---享元模式与单例模式区别
  7. 面向对象2(待补充)
  8. Servlet学习笔记(四)之请求转发与重定向(RequestDispatcher与sendRedirect)
  9. Vue.js之使用vue-cli初始化项目
  10. git安装和GitHub使用