NVIDIA GPU上的随机数生成
NVIDIA CUDA随机数生成库(cuRAND)提供高性能的GPU加速的随机数生成(RNG)。cuRAND库使用NVIDIA GPU中提供的数百个处理器内核,将质量随机数提高了8倍。cuRAND库包含在NVIDIA HPC SDK和CUDA Toolkit中。
cuRAND性能
cuRAND还提供两个灵活的接口,使您可以从CPU上运行的主机代码或GPU上运行的CUDA函数/内核中批量生成随机数。多种RNG算法和分发选项意味着可以根据需要选择最佳解决方案。
cuRAND主要特点
• 灵活的使用模式
o 主机API,用于在GPU上批量生成随机数
o 内联实现允许在GPU函数/内核内部或主机代码中使用
• 四种高质量的RNG算法
o MRG32k3a
o MTGP梅赛因捻线机Merseinne Twister
o XORWOW伪随机生成
o Sobol的准随机数生成器,包括对加扰和64位RNG的支持
• 多种RNG分发选项
o 均匀分布
o 正态分布
o 对数正态分布
o 单精度或双精度
o 泊松分布

cuRAND库中提供的随机数生成器和统计分布已针对包括TestUO1在内的著名统计测试电池进行了测试。请参阅cuRAND文档以获取选定的测试结果。
cuRAND可用性
cuRAND库可作为NVIDIA HPC SDK的一部分免费提供 。它也包含在CUDA工具包中。
有关cuRAND和其他CUDA数学库的更多信息:
• 演示如何使用cuRAND库的源代码示例:
o CUDA C蒙特卡洛:单一亚洲选项
o CUDA C蒙特卡洛(Pi)估计(批次QRNG)
o CUDA C Pi的蒙特卡洛估计(PRNG批次)
o CUDA C Pi的蒙特卡洛估计(批量内联QRNG)
o CUDA C Pi的蒙特卡洛估计(在线PRNG)
• 其他GPU加速库

NVIDIA GPU上的随机数生成相关推荐

  1. NVIDIA GPU上的Tensor线性代数

    NVIDIA GPU上的Tensor线性代数 cuTENSOR库是同类中第一个GPU加速的张量线性代数库,提供张量收缩,归约和逐元素运算.cuTENSOR用于加速在深度学习训练和推理,计算机视觉,量子 ...

  2. NVIDIA GPU上的直接线性求解器

    NVIDIA GPU上的直接线性求解器 NVIDIA cuSOLVER库提供了密集且稀疏的直接线性求解器和本征求解器的集合,它们为计算机视觉,CFD,计算化学和线性优化应用程序提供了显着的加速.cuS ...

  3. gpu填充速率 计算_【经典回顾】Nvidia GPU 上的 CNN 计算速度变迁

    笔者从 2012 年初开始接触 GPU 编程,2014 年上半年开始接触 Caffe,可以毫不谦虚地说是"一天天看着 Nvidia GPU 和 Caffe 长大的". Nvidia ...

  4. 在NVIDIA A100 GPU上利用硬件JPEG解码器和NVIDIA nvJPEG库

    在NVIDIA A100 GPU上利用硬件JPEG解码器和NVIDIA nvJPEG库 根据调查,普通人产生的1.2万亿张图像可以通过电话或数码相机捕获.这样的图像的存储,尤其是以高分辨率的原始格式, ...

  5. Windows 系统上查询 NVIDIA GPU 型号、CUDA 版本和驱动程序版本

    Windows 系统上查询 NVIDIA GPU 型号.CUDA 版本和驱动程序版本 1. NVCUDA.DLL - NVIDIA CUDA 10.1.135 driver - NVIDIA 驱动程序 ...

  6. linux gpu 风扇速度,如何在无头节点上调整NVIDIA GPU风扇速度?

    以下是一种简单的方法,不需要编写脚本,连接假显示器或摆弄,可以通过SSH执行以控制多个NVIDIA GPU的风扇.它已在Arch Linux上进行了测试. 识别卡的PCI ID: 编辑:我现在不确定什 ...

  7. telegraf gpu_在Windows上使用Telegraf监控nvidia gpu

    telegraf gpu Telegraf | 英伟达| 监控| Grafana | InfluxDB (Telegraf | Nvidia | Monitoring | Grafana | Infl ...

  8. gnome桌面 kde_GNOME和KDE在Linux桌面上合作,为Nvidia GPU打开文档,这是一种强大的扫描固件漏洞的新方法,还有更多新闻...

    gnome桌面 kde 在本期开放源代码新闻摘要中,我们介绍了两个新的功能强大的数据可视化工具,Nvidia开源GPU文档,令人兴奋的新工具以保护自动驾驶汽车的固件等! GNOME和KDE在Linux ...

  9. 【分享NVIDIA GTC 23大会干货】在 GPU 上使用 Video Codec SDK,CV-CUDA 和 TensorRT 加速现代云上视频应用 [SE51229]

    在 GPU 上使用 Video Codec SDK,CV-CUDA 和 TensorRT 加速现代云上视频应用 前言 基于现代AI的视频流水线架构与运用场景 NVIDIA 视频处理的工具集 1.视频编 ...

最新文章

  1. 20160203.CCPP体系详解(0013天)
  2. 《预训练周刊》第7期:傅立叶图像变换器解析、阿里达摩院发布最大中文预训练语言模型PLUG
  3. 验证码的三种做法[纯数字][纯汉字][字母\数字\汉字混合]C#
  4. tf.dtypes.cast
  5. DEEPIN 20安装镜像进入LIVE模式
  6. vxworks 实时操作系统
  7. 螺旋图形Linux,Canvas 螺旋线几何图形绘制
  8. 乐高科技系列搭建指南 pdf_近30年十辆乐高科技系列摩托车回顾_积木
  9. Arduino编译bootloader
  10. 页面加载完就执行的设置?
  11. devcpp 的各种快捷键
  12. 不同尺寸SMA头介绍以及之间的区别
  13. urlrewrite 规则报错
  14. 大型公建能耗监管系统
  15. 0基础学SQL-Task02 SQL基础查询与排序(共7节)
  16. 《犹太人想的和你不一样》
  17. 大学英语综合教程二 Unit 3 课文内容英译中 中英翻译
  18. 全球数字高程数据:ASTER GDEM
  19. Hexo接入Google adsense广告
  20. 重庆赛区ACM热身赛 8526. 小埋的烦恼

热门文章

  1. 伍六七带你学算法 进阶篇-排序算法
  2. 2022-2028年中国微型汽车市场投资分析及前景预测报告
  3. 2022-2028年中国丙烯酸酯橡胶行业市场深度分析及投资前景分析报告
  4. 4 用python进行OpenCV实战之图像变换1(平移)
  5. vim中tab键8空格换4空格
  6. 直方图_20210420
  7. TensorRT简介
  8. 矩阵乘以其矩阵转置求导-数学
  9. tf.reduce_sum()函数
  10. 堆栈,数据,文本,heap,bss,text data,stack