用GPUDirect RDMA技术做的代码测试

[复制链接]

   
sisiy

电梯直达

楼主

发表于 2015-7-13 21:06:28|只看该作者

要应用GPUDirect RDMA技术,首先要有足够的硬件支持。包括infiniband的HCA卡(Mellanox ConnectX-3及以后产品),GPU卡(K20及以后产品)。
其次,除了应用GPU必备的Nvidia Driver、Nvidia CUDA toolkit,应用infiniband必备的MLNX_OFED驱动外,还要额外安装一个plug module to enable GPUDirect RMDA组件。
具体可参见附件中Mellanox的manual,内有驱动下载地址以及安装示例。
在此,对一些安装细节做一些说明(以 CentOS 6.5+openMPI为例):
1、 linux系统内核查询指令:        uname –a
2、 CentOS版本号:                        cat /etc/redhat-release
3、 HCA卡型号:                                lspci |grep mellanox –i
4、 现有infiniband驱动:                ofed_info|head -1
5、 Cuda版本:                                nvcc -V
6、 Nvidia_peer包安装:              
先安装rpm-build包----------yum install rpm-build;
下载nvidia_perr_memory安装包并解压;
进入解压后的目录,运行rpmbuild –rebuild nvidia_peer_memory-1.0-0.src.rpm;
cd ~/rpmbuild/RPMS/x86_64;
rpm –ivh nvidia_peer_memory-1.0-0.x86_64.rpm;
运行lsmod |grep nv_peer_mem检查是否安装成功
运行server nv_peer_mem start 开启模块
7、openMPI-1.8.1安装:            
下载并解压openmpi-1.8.1或以后版本;
以如下编译选项安装:
./configure –prefix=要安装的目录
–with-openib –with-cuda=cuda所在目录
–with-cuda-include=cuda所在目录/include
–with-cuda-libpath=cuda所在目录/lib64 –enable-oreerun-prefix-by-default –disable-io-romio –enable-picky
Make;make install
至此,软件安装已完成。软件实例代码以及编译选项见附件。
运行时请使用 mpirun –app appfile 形式。
appfile文件写法如下:
-H 第一台机器的IB_INTERFACE  -np 1 –mca btl openib,self,sm ./b.out
-H 第二台机器的IB_INTERFACE  -np 1 –mca btl openib,self,sm ./b.out
测试结果见附件。测试中第一列是以K为单位的数据量,第二行为RMDA方法的时间,第三行为传统方法的时间。

用GPUDirect RDMA技术做的代码测试相关推荐

  1. Alpha Test 透明通道测试技术做篱笆效果图

    Alpha test是可以通过测试然后丢弃不需要渲染的像素的.顾名思义就是根据他的alpha值与某特定值比较. 这个技术做腐蚀效果,某些电影特技如:可以让一个人慢慢各个部位褪色,最后消失--等,而且不 ...

  2. RDMA技术--华为精华

    面对高性能计算.大数据分析和浪涌型IO高并发.低时延应用,现有TCP/IP软硬件架构和应用高CPU消耗的技术特征根本不能满足应用的需求.这要有体现在处理延时过大,数十微秒:多次内存拷贝.中断处理,上下 ...

  3. RDMA技术详解——RDMA常见概念

    Fabric A local-area RDMA network is usually referred to as a fabric. 所谓Fabric,就是支持RDMA的局域网(LAN). CA( ...

  4. SpringBoot系列三:SpringBoot基本概念(统一父 pom 管理、SpringBoot 代码测试、启动注解分析、配置访问路径、使用内置对象、项目打包发布)...

    声明:本文来源于MLDN培训视频的课堂笔记,写在这里只是为了方便查阅. 1.了解SpringBoot的基本概念 2.具体内容 在之前所建立的 SpringBoot 项目只是根据官方文档实现的一个基础程 ...

  5. idea2020shezhi代码检查级别_ICT技术:阿里巴巴代码缺陷检测探索与实践

    目前PRECFIX技术已经在阿里巴巴集团内部落地并获得好评,关于"PRECFIX"技术的论文被国际软件工程大会(ICSE)收录. 张昕东(别象) 阿里巴巴 云研发事业部 算法工程师 ...

  6. 纯做技术是自娱自乐 抛开技术做技术才是出路

    短短一生不过数十载,对于很多人而言,作IT.作技术只是生命中的某一段,并非所有.而无论是换工作还是换行业,只是一种形式而已,最终我们追求的是成功.是荣誉.是收获.于是在年轻的这几年里,作为技术人员理应 ...

  7. iOS 覆盖率检测原理与增量代码测试覆盖率工具实现

    背景 对苹果开发者而言,由于平台审核周期较长,客户端代码导致的线上问题影响时间往往比较久.如果在开发.测试阶段能够提前暴露问题,就有助于避免线上事故的发生.代码覆盖率检测正是帮助开发.测试同学提前发现 ...

  8. 【华为云技术分享】【测试微课堂】DevOps敏捷测试之道

    本文介绍企业在敏捷和DevOps的逐步转型过程中,测试如何应对挑战,有的放矢进行测试,建立适合产品自身发展阶段.产品特点的敏捷测试能力. 敏捷和DevOps 敏捷和DevOps转型始终是被业务目标和客 ...

  9. Node.js 单元测试:我要写测试 - Mocha - Nodejs开源项目里怎么样写测试、CI和代码测试覆盖率

    -------------------------------------- 单元测试Express/NodeJs 个人理解, 1,如果不是测试http请求的单元测试,用Mocha, Chai等基本够 ...

最新文章

  1. 微信公众号token 验证
  2. 【廖雪峰python入门笔记】tuple_创建
  3. springboot国际化i18n
  4. Mysql中的排序规则utf8_unicode_ci、utf8_general_ci的区别总结
  5. 对接FusionInsight HD 6.5.1
  6. 英语笔记-20151209
  7. 【差分】Tallest Cow(poj 3263/luogu 2879)
  8. 一天测血压的最佳时间_高血压病患者,一天之内在什么时间点测血压最好?
  9. 超强1000个jquery极品插件!(感觉好强大,转载一下)
  10. Delphi 2010 新增功能之: 手势编程[5] - 关于自定义手势
  11. 01-Python简介
  12. FFmpeg Windows版 官网下载与安装
  13. “死神”百草枯:每年超万人中毒 没有解药
  14. 用R语言进行分位数回归
  15. HTML5定稿了 为什么原生App世界将被颠覆
  16. 猫喜欢吃鱼,可猫不会游泳,鱼喜欢吃蚯蚓,可鱼不会上岸;上帝给了你很多诱惑,却不会让你轻易实现!...
  17. 2022 Apache IoTDB 物联网生态大会 | 早鸟超值获票福利第一弹!(限时 3 天)
  18. 【HTML模板】个人简历网站模板CAVANI V1.0 - CV RESUME PORTFOLIO TEMPLATE
  19. 计算机名词解释剪切,剪切力名词解释
  20. python查看bit_[python] bit 操作与易经

热门文章

  1. 【转】正则表达式简介及在C++11中的简单使用教程
  2. Guava之Ordering
  3. Tomcat 服务器server.xml,web.xml的关键参数配置
  4. NodeJs连接Mysql数据库
  5. Java动态绑定机制的内幕
  6. 让程序员不再苦逼的四大神器
  7. OER 7451 in Load Indicator : Error Code = OSD-0450
  8. CCS5连接调试C64X系列DSP核
  9. E-mail 标准 SMTP POP3
  10. hdu 5639(区间dp)