英伟达最近发布了一个新的GPUDirect Storage,暂且叫做GPU直连存储,让GPU直接连到NVMe存储设备上。这一方案用到了RDMA设备来把数据从闪存存储转移到GPU本地的内存里,无需经过CPU还有系统内存。

如果这一举措顺利的话,英伟达就能摆脱对于CPU的依赖开辟一片全新的领地,全新的市场,比如数据科学和机器学习市场,这一市场将造就每年200亿到250亿美金的服务器市场,跟HPC和深度学习市场加起来的市场规模差不多一样大。

英伟达在拼命的把要做的事情往GPU里放,去年十月份,英伟达发布了RAPIDS,这是一个开源的工具库,用于帮助人们用GPU做分析和机器学习。RAPIDS可以对Apache Arrow, Spark等数据科学类的工具提供GPU加速,将GPU放入大数据企业应用的生态,这一领域现如今仍旧是以基于CPU的Hadoopp和Mapreduce这种方案。

RAPIDS涵盖了机器学习的所有方面,包括监督式和无监督式的机器学习,还有各种数据处理方面的内容,但是,这一做法也遭到了一些怀疑。

GPU现在越做越大,连接性也越来越好,从应用的角度来看,GPU的通用也很好。与此同时,数据分析越来越负载,机器学习经常会集成到工作流程中,这样一来,对TB级数据进行千万亿次计算的应用程序也会越来越多。

想做好这点必须有很好的可扩展性,通过NVLink和NVSwitch等技术可以连接多个GPU,组成一个巨大的加速器,该技术最初是为DGX架构设计的,这一架构主要也是为了解决规模更大,更复杂的神经网络训练问题。英伟达想把GPU的计算能力用于大数据的想法是说的通的,但唯独就是缺少快速的数据存储路径。

通常,在GPU加速系统当中,所有的IO操作都会先经过主机端,也就是需要经过CPU指令把数据传到主机内存里,然后才会到达GPU,CPU通常会通过“bounce buffer”来实现数据传输,“bounce buffer”是系统内存中的一块区域,数据在传输到GPU之前会在这里保存一个副本。很明显,这种中转会引额外延迟和内存消耗,降低运行在GPU上的应用程序的性能,还会占用CPU资源,这就是GPUDirect Storage要解决的问题。

英伟达方面表示这一技术能提升50%的IO带宽,延迟能降低3.8倍。如果通过NVMeoF技术的话,GPU就能连上PB级别的存储资源池,更厉害的是,英伟达声称数据存取的效率比内存的页面缓存速度还要快。

英伟达表示,如果你的DGX-2系统里有16个GPU,主机端有1.5TB内存的话,GPUDirect Storage的吞吐带宽能提升8倍(跟原来不支持GPUDirect Storage的DGX-2系统相比)。这是因为,DGX-2的吞吐带宽能达到大约200GB/s,而原来依靠主机端内存的话,最多也就50GB/s。

多出来的这150GB/s传输速度对于数据分析型工作负载的提升将非常可观,对于像深度学习这种文件密集型应用程序,对于传统的HPC也将会带来很大改观。

英伟达的这一做法让GPU直连到存储,直接拿到原始数据,意味着GPU也可以对文件进行解压缩和解码操作,解放CPU。目前,GPUDirect Storage支持各种常见的文件格式进行操作。

GPUDirect Storage方案用到了两项高端技术,一个是RDMA,一个是NVMe(NVMe-oF),其中,RDMA被封装在GPUDirect的协议中,依靠各种网络适配器工作(比如Mellanox的NIC),既可以访问远程的存储也可以访问本地的存储设备。

目前,GPUDirect Storage只面向少数合作伙伴提供,预计今年十月份将推出beta版本。

在译者看来,这是英伟达跟英特尔竞争的又一大举措,可以看做是对英特尔再度进军GPU市场的一个回应。

绕开CPU,开辟一片新的生态,这在理论上是可行的,也确实有明显的需求场景,最后能否在市场上推行开来,还得看方案构建的水平,包括方案的易用性,稳定性,场景的优化水平,当然,最重要的还是不要对现有软件架构带来太多变化,控制用户的使用成本和购置成本。

系统英伟达gpu驱动卸载_绕过CPU,英伟达让GPU直连存储设备相关推荐

  1. linux系统英伟达gpu驱动卸载_怎么卸载显卡驱动-手把手教你在 Ubuntu16.04 安装 GPU 驱动 + CUDA9.0 + cuDNN7...

    文章转载自公众号 AI有道 , 作者 红色石头 点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 如果你的电脑安装了 Ubuntu16.04,而 ...

  2. linux系统英伟达gpu驱动卸载_英伟达显卡驱动程序被发现强制捆绑 官方已火速撤回驱动下载链接...

    英伟达本周推出新版本驱动程序为多数游戏带来性能提升,不少玩家看到性能提升就果断选择下载新版进行安装. 不过有些意外的是这个版本的驱动程序强制捆绑各个组件,原本这些组件在用户选择自定义时是可以手动取消的 ...

  3. linux系统英伟达gpu驱动卸载_在Linux系统中卸载手动安装的Nvidia驱动程序

    如何在Linux发行版上卸载Nvidia驱动程序?本文提供方法,在Linux机器上安装Nvidia驱动程序有两种方法,第一种方法是通过操作系统存储库,第二种方法是从Nvidia分发的二进制包安装,参考 ...

  4. windows达梦数据库卸载不完全,重新装达梦数据库现有服务失败/该实例名已被其他实例占用

    windows达梦数据库卸载不完全,重新装达梦数据库现有服务失败–该实例名已被其他实例占用 1:卸载默认不会删除数据库DATA 这是为了保护数据 确定以前的所有数据不要的话才可以删除 2:系统的服务管 ...

  5. linux系统英伟达gpu驱动卸载_ubuntu16.04循环登陆与NVIDIA显卡驱动的卸载/安装

    最近购置了一台自己组装的新台式机,在上面安装了ubuntu和windows双系统,准备在ubuntu上运行CARLA.Ubuntu系统在我刚刚安装好的时候出了挺多问题的,没有网卡驱动,没有显卡驱动.都 ...

  6. linux系统英伟达gpu驱动卸载_Ubuntu 16.04 卸载Nvidia显卡驱动和cuda

    tensorflow不断升级,最新版本的代码需要更高版本的cuda支持.以前一直用cuda8.0和cudnn6.0的组合,tensorflow用1.3.0版本.不过最新下载的models,某些代码执行 ...

  7. 英伟达最大gpu_绕过CPU,英伟达让GPU直连存储设备

    英伟达最近发布了一个新的GPUDirect Storage,暂且叫做GPU直连存储,让GPU直接连到NVMe存储设备上.这一方案用到了RDMA设备来把数据从闪存存储转移到GPU本地的内存里,无需经过C ...

  8. 英特尔的指令集体系结构_对标英特尔的RISC-V大有可为,CPU三分天下格局可期

    据行业媒体报道,挪威物联网(IoT)公司ONiO日前推出了一种基于RISC-V的超低功耗微控制器,能够完全利用采集的能量进行操作,而无需电池.无需超级电容器或任何其他形式的储能. 此款微控制器本身基于 ...

  9. gpu服务器厂家_嵌入式主板厂家告诉你选择GPU服务器的5大标准

    嵌入式主板厂家告诉你选择GPU服务器的5大标准: 做为国产服务器.工控电脑生产厂家,深蓝宇在云结转.互联网大数据.高作用结转.人工智能技术等范围再次开展研发资金投入,并供求平衡全体人员化的解决方法.下 ...

最新文章

  1. java Proxy(代理机制)
  2. 对AI毫无了解?本文带你轻松了解AI
  3. 如何发现 Redis 热点 Key ,解决方案有哪些?
  4. c#如何跳出一个函数_C# mysql 学生信息管理系统
  5. dedecms /plus/feedback.php SQL Injection Vul
  6. composer安装及使用
  7. devtools的ctrl加r_Chrome DevTools调试技巧
  8. Windows Store App 中使用Scrollviewer实现缩放功能
  9. “朝三暮四”与“BPO”
  10. 深入研究ActivityMQ
  11. WZOI.CC基础题库答案向导
  12. linux小企鹅输入法无法使用,助:小企鹅输入法安装成功,但无法使用!!!!先谢谢大家了!!...
  13. 谈谈谈zookeeper
  14. 把AI应用到实体棋盘!费米L6智能国际象棋:告别网络依赖,重归线下下棋
  15. 第三批游戏版号下发 移动安全从业者有话说
  16. 怎么从Apache maven 官网下载旧版本
  17. 基于百度AI实现的语音识别搜索文件
  18. matlab数值微分与数值积分
  19. 作业帮发布新品学习机,首创“AI老师一对一”模式
  20. 什么是整洁代码?大咖程序员们这样说

热门文章

  1. visio科学图形包_科学网—科研必备:几款好用的流程图工具,助力你的论文/科研绘图...
  2. 子集和问题 算法_子集问题 主要是去重算法
  3. html网页制作图案,巧用CSS滤镜做图案文字-网页设计,HTML/CSS
  4. 在running android lint期间发生了内部错误.,Eclipse出现quot;Running Android Lint has encountered a problemquot...
  5. linux 拿shell,linux下备份拿shell[渗透必备]
  6. linux 用户 组区别吗,Linux系统的用户和用户组有什么区别
  7. JavaScript实现继承的方式,不正确的是:
  8. Bash脚本教程之脚本除错
  9. js实现字体和容器宽高随窗口改变
  10. SweetAlert – 替代 Alert 的漂亮的提示效果