用MPI_Send和MPI_Recv实现简单集群通信函数
本片博客总结自我《并行计算》MPI实验
在这里我用阻塞式消息传递函数MPI_Send、MPI_Recv和非阻塞式消息发送函数MPI_Isend实现了三个简单的集群通信函数:
- MPI_Bcast广播函数
- MPI_Gather收集函数
- MPI_Scatter散播函数
1.MPI_Bcast广播函数
(1)原型简介
void MPI_Bcast(void* address, int count, MPI_Datatype datatype, int root, MPI_Comm comm);
MPI_Bcast实现将root节点的address地址处长度为count的datatype类型的数据发送给其他节点。其他节点接收这块数据的内存空间也是一块以address为起始地址,长度为count * MPI_Type_size(datatype)的内存区域。
(2)实现
实现逻辑为:
若节点为root则接收来自所有其他除root以外的节点的消息,否则向root节点发送一条消息。
广播比较简单,直接看代码:
void My_Bcast(void* sendAddress, int count, MPI_Datatype datatype, int root, MPI_Comm comm) {int rank, size, i;MPI_Status status;int tag = 100;MPI_Comm_rank(MPI_COMM_WORLD, &rank);MPI_Comm_size(MPI_COMM_WORLD, &size);if (rank == root) {for (i = 0; i < size; i++) {if (i != root) {MPI_Send(sendAddress, count, datatype, i, tag, comm);}}} else {MPI_Recv(sendAddress, count, datatype, root, tag, comm, &status);}
}
2.MPI_Gather收集函数
(1)原型简介
void MPI_Gather(void* sendAddress, int sendCount, MPI_Datatype sendDatatype, void* recvAddress, int recvCount, MPI_Datatype recvDatatype, int root, MPI_Comm comm);
MPI_Gather实现将所有节点的sendAddress为起始地址、长度为sendCount的sendDatatype类型数据,发送到root节点以recvAddress为起始地址、长度为MPI_Comm_size * recvCount * MPI_Type_size(recvDatatype)的内存区域。并且。是按照进程序号rank依次排列所有节点发送的数据,即序号为i的节点发送给root节点的数据接收内存的起始地址是recvAddress + i * recvCount * MPI_Type_size(recvDatatype)。
因为这次是初学并行计算第一次用MPI编程,这里有个疑问:为什么不强制要求recvDatatype == sendDatatype && recvCount == sendCount?如果不统一不会造成内存泄漏?我测试recvCount != sendCount虽然没有Segment Fault,但结果全乱了
(2)实现
我下面的实现没有考虑datatype和count不一致的问题,均默认相同!
实现逻辑为:
当前节点向root节点发送一条消息,如果当前节点是root节点则枚举接收来自所有节点的消息。
注意:这时root节点需要向它自己发送一条消息,如果用标准通信模式(MPI管理消息缓存的通信模式,MPI_Send和MPI_Recv均属于这种模式,详见陈国良老师《并行计算》P418页通信模式介绍或Google),由于MPI_Send和MPI_Recv是阻塞式通信且它们共用同一缓冲区,那么同一节点即调用MPI_Send又调用MPI_Recv将会由于缓冲区资源冲突造成死锁!
解决方法是用非阻塞的发送函数MPI_Isend
代码如下:
void My_Gather(void* sendAddress, int sendCount, MPI_Datatype sendDatatype, void* recvAddress, int recvCount, MPI_Datatype recvDatatype, int root, MPI_Comm comm) {int rank, size, i;int tag = 101;MPI_Status status;MPI_Request request;MPI_Comm_rank(MPI_COMM_WORLD, &rank);MPI_Comm_size(MPI_COMM_WORLD, &size);MPI_Isend(sendAddress, sendCount, sendDatatype, root, tag, comm, &request);if (rank == root) {int tsize;MPI_Type_size(recvDatatype, &tsize);for (i = 0; i < size; i++) {MPI_Recv(recvAddress + i * recvCount * tsize, recvCount, recvDatatype, i, tag, comm, &status);}}
}
代码中需要注意的是root节点每次MPI_Recv起始地址的计算公式,需要调用MPI_Type_size(recvDatatype, &tsize)获取datatype类型的字节长度。
3.MPI_Scatter散播函数
(1)原型简介
void MPI_Scatter(void* sendAddress, int sendCount, MPI_Datatype sendDatatype, void* recvAddress, int recvCount, MPI_Datatype recvDatatype, int root, MPI_Comm comm);
MPI_Scatter和MPI_Gather互为逆向函数,MPI_Gather搜集所有节点的数据依次拼接存放在root节点中一块类似于数组的连续区域当中,而MPI_Scatter相当于把root节点中一块类似于数组的连续区域分割成size块依次分发给所有节点。其参数列表和MPI_Gather相同,不再解释。
(2)实现
我下面的实现没有考虑datatype和count不一致的问题,均默认相同!
实现逻辑为:
判断该节点是否是root节点,若是则向所有节点发送一条消息(非阻塞MPI_Isend)。然后该节点接收一条来自于root的消息。
和之前的一样,涉及到同一节点之间的消息传递,需要用非阻塞通信。我尝试过先非阻塞Recv再阻塞Send,运行结果不对,后来思考确实有问题:root节点非阻塞Recv若先于其他几诶但阻塞Send执行,这个Recv什么消息也接收不到就结束了(非阻塞Recv查看一次缓冲区不管有没有消息均结束,有则返回消息没有则返回空消息,详见其定义)。
代码如下,仍需注意root节点发送数据的起始地址:
void My_Scatter(void* sendAddress, int sendCount, MPI_Datatype sendDatatype, void* recvAddress, int recvCount, MPI_Datatype recvDatatype, int root, MPI_Comm comm) {int rank, size, i;int tag = 102;MPI_Request request;MPI_Status status;MPI_Comm_rank(MPI_COMM_WORLD, &rank);MPI_Comm_size(MPI_COMM_WORLD, &size);if (rank == root) {int tsize;MPI_Type_size(sendDatatype, &tsize);for (i = 0; i < size; i++) {MPI_Isend(sendAddress + i * sendCount * tsize, sendCount, sendDatatype, i, tag, comm, &request);}}MPI_Recv(recvAddress, recvCount, recvDatatype, root, tag, comm, &status);
}
用MPI_Send和MPI_Recv实现简单集群通信函数相关推荐
- Linux下安装Weblogic10.3.6并创建简单集群测试
Linux下安装Weblogic10.3.6并创建简单集群进行测试 一.卸载随系统安装的openjdk 1.先查看安装的jdk信息,常用命令有rpm -qa | grep java, rpm -qa ...
- Redis的安装配置及简单集群部署
最近针对中铁一局项目,跟事业部讨论之后需要我们的KF平台能够接入一些开源的数据库,于是这两天研究了一下Redis的原理. 1. Redis的数据存储原理及简述 1.1Redis简述 Redis是一个基 ...
- Hadoop简单集群搭建,三台虚拟机运行wordcount
Hadoop简单分布式集群搭建,利用三台虚拟机 注:本文用到的hadoop版本是 hadoop-2.5.2,虚拟机是CentOS-6.10,虚拟机安装软件是VMware,java环境是 jdk1.8. ...
- k8s简单集群搭建和应用(包括虚拟机的开启)①
1.三台虚拟机搭建 开三台虚拟机.使用Centos7 系统,网络模式使用NAT模式(校园网应该是用不了桥接模式) 在虚拟机里设置主机名 #依次设置主机名 hostnamectl set-hostnam ...
- Redis~集群(分布理论、一致性哈希分区、虚拟槽分区、节点握手、集群通信、集群伸缩、请求路由、故障转移、集群维护)
文章目录 分布理论 集群的分布式存储 简单哈希 一致性哈希分区 虚拟槽分区 Redis集群功能限制 节点握手 分配槽 集群通信 Gossip消息 集群伸缩 集群扩容 集群收缩 请求路由 MOVED重定 ...
- 云计算、集群通信、和分布式系统的关系
云计算 云计算(cloud computing)是分布式计算的一种,指的是通过网络"云"将巨大的数据计算处理程序分解成无数个小程序,然后,通过多部服务器组成的系统进行处理和分析这些 ...
- 无人机集群通信网络拓扑重构
文章目录 前言 一,网络关键节点判定技术 二,网络故障诊断技术 三,网络连通性恢复技术 总结 前言 1,通信网络拓扑重构关键技术分析 基于节点移动的网络拓扑重构方法是最适合无人机集群通信网络的.但目前 ...
- Nginx+Tomcat简单集群配置
2019独角兽企业重金招聘Python工程师标准>>> 1.软件准备 下载Nginx和Tomcat Nginx:http://nginx.org/en/download.html 这 ...
- Nginx+Tomcat windows环境下简单集群搭建
通俗点将,负载均衡就是因为访问流量太大,导致项目访问不流畅.甚至宕掉,所以通过一种分流的方式来缓解这种情况. 一. 工具 nginx-1.8.0 apache-tomcat-6.0.33 ...
最新文章
- matlab常遇小问题汇总
- MariaDB/MySQL从数据库中选择随机的行
- 支持比特币支付的商家中有90%接受了BCH
- 厉害了,淘宝千万并发,14 次架构演进…
- mysql的my.cnf
- 写出下列的中文意思 HTML,计算机网络技术考试试题纸B卷
- 建立图片服务器的注意事项
- 使用脚本删除ios工程中未使用图片
- matlab 识别调试,有关matlab的人脸识别程序,但调试是不成功
- android 大牛播放组件,大牛直播Android播放端SDK说明
- 基于WordNet的英文同义词、近义词相似度评估及代码实现
- 哼唱搜索软件测试,不知道歌名只哼唱也能识别歌名的音乐APP到底谁更好
- Nginx服务优化与防盗链
- [Linux]在Ubuntu下虚拟机的安装以及在Ubuntu中进行UDP套接口通信
- 苹果设备如何进入恢复模式
- 获取ie窗口的IHTMLDocument2对象
- C语言的美学:斐波那契,你会吗?
- 哔哩哔哩 机器人历险记_机器人历险记谁演的,机器人历险记的扮演者罗德尼资料介绍-易看TV...
- lightroom 闪退_微信QQ一碰就闪退,别人永远看不了你的隐私~
- Muli3D 2 matMatrix44RotationQuaternion 函数 (四元数转矩阵)