GPU上稀疏矩阵的基本线性代数
cuSPARSE库为稀疏矩阵提供了GPU加速的基本线性代数子例程,这些子例程的执行速度明显快于仅CPU替代方法。提供了可用于构建GPU加速求解器的功能。cuSPARSE被从事机器学习,计算流体力学,地震勘探和计算科学等应用的工程师和科学家广泛使用。使用cuSPARSE,应用程序会自动受益于常规性能的改进和新的GPU架构。cuSPARSE库包含在NVIDIA HPC SDK和CUDA Toolkit中。
cuSPARSE性能
cuSPARSE库针对NVIDIA GPU的性能进行了高度优化,其SpMM性能比仅CPU的替代产品快30-150倍。
cuSPARSE的主要功能
• 支持密集,COO,CSR,CSC和Blocked CSR稀疏矩阵格式
• 全套稀疏例程,包括稀疏向量x稠密向量运算,稀疏矩阵x稠密向量运算以及稀疏矩阵x稠密矩阵运算。
• 稀疏矩阵x稀疏矩阵加法和乘法的例程
• 稀疏密集向量乘法(SpVV),稀疏矩阵密集向量乘法(SpMV)和稀疏矩阵密集矩阵乘法(SpMM)的通用高性能API
• ILU0和IC0预调节器

GPU上稀疏矩阵的基本线性代数相关推荐

  1. NVIDIA GPU上的Tensor线性代数

    NVIDIA GPU上的Tensor线性代数 cuTENSOR库是同类中第一个GPU加速的张量线性代数库,提供张量收缩,归约和逐元素运算.cuTENSOR用于加速在深度学习训练和推理,计算机视觉,量子 ...

  2. GPU上的基本线性代数

    GPU上的基本线性代数 cuBLAS库提供了基本线性代数子例程(BLAS)的GPU加速实现.cuBLAS通过针对NVIDIA GPU进行了高度优化的嵌入式行业标准BLAS API来加速AI和HPC应用 ...

  3. GPU上的快速光谱图分区

    GPU上的快速光谱图分区 图形是用于对物理,生物,社会和信息系统中许多类型的关系和过程进行建模的数学结构.用于解决各种高性能计算和数据分析问题.对于网络分析,基因组学,社交网络分析和其他领域,大规模图 ...

  4. 如何在 GPU 上优化卷积

    如何在 GPU 上优化卷积 将演示如何在 TVM 中编写高性能卷积实现.正方形大小的输入张量和过滤器为例,假设卷积的输入具有大batch批量.在这个例子中,使用不同的布局存储数据,实现更好的数据局部性 ...

  5. TVM 优化 ARM GPU 上的移动深度学习

    TVM 优化 ARM GPU 上的移动深度学习 随着深度学习的巨大成功,将深度神经网络部署到移动设备的需求正在迅速增长.与桌面平台上所做的类似,在移动设备中使用 GPU 既有利于推理速度,也有利于能源 ...

  6. TVM在ARM GPU上优化移动深度学习

    TVM在ARM GPU上优化移动深度学习 随着深度学习的巨大成功,将深度神经网络部署到移动设备的需求正在迅速增长.与在台式机平台上所做的类似,在移动设备中使用GPU可以提高推理速度和能源效率.但是,大 ...

  7. GPU上的图像和信号处理

    GPU上的图像和信号处理 NVIDIA Performance Primitives(NPP)库提供GPU加速的图像,视频和信号处理功能,其执行速度比仅CPU实施快30倍.拥有5000多个用于图像和信 ...

  8. NVIDIA GPU上的随机数生成

    NVIDIA GPU上的随机数生成 NVIDIA CUDA随机数生成库(cuRAND)提供高性能的GPU加速的随机数生成(RNG).cuRAND库使用NVIDIA GPU中提供的数百个处理器内核,将质 ...

  9. NVIDIA GPU上的直接线性求解器

    NVIDIA GPU上的直接线性求解器 NVIDIA cuSOLVER库提供了密集且稀疏的直接线性求解器和本征求解器的集合,它们为计算机视觉,CFD,计算化学和线性优化应用程序提供了显着的加速.cuS ...

最新文章

  1. 演示:思科设备基于物理接口帧中继(fame-relay)的配置
  2. 放大器非线性失真研究装置设计报告_我校信息学院学子再次斩获大学生电子设计竞赛大奖...
  3. java课程实战培训,终获offer
  4. 设置自增递增零开始_MySQL中如何设置自动递增id主键重新计数从1开始?
  5. 创建型模式:工厂模式(简单工厂+工厂方法+抽象工厂)
  6. 《逻辑与计算机设计基础(原书第5版)》——3.9 二进制加法器
  7. -js中json数组 以表格形式_为什么js类数组加上splice方法就是数组形式,不加就是对象形式?...
  8. Maven mvn install 本地jar添加到maven仓库中
  9. 苹果春季新品发布会来了:将推iPhone13 Pro系列紫色版
  10. 东半球最全的 postman 使用教程
  11. 使用Builder模式创建复杂可选参数对象
  12. ps太卡怎么办?几步帮您解决问题
  13. C++二进制文件读写,以及数据的拼合与还原
  14. eclipse修改自定义皮肤
  15. 用计算机研究脑电波,超现实主义 用脑电波控制计算机设备
  16. Day16 GUI编程:贪吃蛇
  17. 一座古老与现代和谐共融的城市
  18. matlab输入多项式 教程,MATLAB多项式 - Matlab教程
  19. 基于主成分分析(PCA)的特征降维方法对葡萄酒数据集进行分类
  20. 破解IT公司高管频繁离职的密码

热门文章

  1. Docker入门六部曲——服务
  2. 2022-2028年中国节能建材行业深度调研及投资前景预测报告
  3. 2022-2028年中国聚硫橡胶行业市场研究及前瞻分析报告
  4. 前端Vue学习之路(五)插件的使用
  5. 【数据结构】链表中的 指针,地址
  6. LeetCode简单题之删除一个元素使数组严格递增
  7. 详解Spring中Bean的自动装配~
  8. PyTorch 自动微分示例
  9. 计算机视觉一些项目实战技术(续)
  10. [JAVAEE] Thymeleaf 基本语法: form相关标签