【MPI编程】任意节点数的蝶形求和（高性能计算）

简述

对于任意情况下的蝶形求和，本质上和任意的树形求和是一样的。只需要做逻辑上的抽象，假设那些点存在补全就好了，然后再加一个限定条件就ok了

代码

#include<stdio.h>
#include<string.h>
#include<mpi.h>
#pragma warning(disable : 4996)
#define MAX_STRING 100
using namespace std;
#include <fstream>
#include <iostream>int main(void) {int len;double scalar, local_sum = 0;int comm_sz;int my_rank;int divided_len;int last_divided;int begin_i;int oper_N = 2;MPI_Init(NULL, NULL);MPI_Comm_size(MPI_COMM_WORLD, &comm_sz);MPI_Comm_rank(MPI_COMM_WORLD, &my_rank);// 只有一个线程的时候不操作if (comm_sz <= 1) {MPI_Finalize();return 0;}ifstream cin("D:\\C++\\VS\\repo\\MPI-DEMO\\MPI-DEMO\\input.txt");cin >> len; // 输入数据长度divided_len = len / comm_sz;last_divided = len % comm_sz;if (my_rank < last_divided) {divided_len++;begin_i = my_rank * divided_len;}else {begin_i = (my_rank - last_divided) * divided_len + ((divided_len + 1)* last_divided);}// 局部和for (int i = 0; i < len; ++i) {cin >> scalar;if (i < begin_i || i >= begin_i + divided_len) continue;else {local_sum += scalar;}}// 假设comm_sz不一定是2的幂// 蝶形求和while (oper_N <= comm_sz || (oper_N > comm_sz && oper_N / 2 < comm_sz)) {// 往前发if (my_rank % oper_N < oper_N / 2) {if (my_rank + oper_N / 2 < comm_sz){MPI_Send(&local_sum, 1, MPI_DOUBLE, my_rank + oper_N / 2, 0, MPI_COMM_WORLD);MPI_Recv(&scalar, 1, MPI_DOUBLE, my_rank + oper_N / 2, 0, MPI_COMM_WORLD, MPI_STATUSES_IGNORE);local_sum += scalar;}}// 往后发else if (my_rank % oper_N >= oper_N / 2) {MPI_Send(&local_sum, 1, MPI_DOUBLE, my_rank - oper_N / 2, 0, MPI_COMM_WORLD);MPI_Recv(&scalar, 1, MPI_DOUBLE, my_rank - oper_N / 2, 0, MPI_COMM_WORLD, MPI_STATUSES_IGNORE);local_sum += scalar;}oper_N *= 2;}if (my_rank == 0) {cout << local_sum << endl;}MPI_Finalize();return 0;
}

【MPI编程】任意节点数的蝶形求和（高性能计算）相关推荐

【MPI编程】矩阵向量乘法--解法二（高性能计算）
简述有留心过的朋友可能会发现,其实我没写过解法一. 因为解法一就是大家最直观的感受的一种解法. 将矩阵按照行划分,之后,再每个线程都用整个向量跟这个块做内积.之后,传回来一个数值. 这里的方法二, ...
【MPI编程】矩阵向量乘法--解法三（子矩阵块分解）【高性能计算】
简述子矩阵分解,就是说,将原来的矩阵给分解为更小的矩阵块. 让所有的线程都共享有向量(但不共享矩阵) 为了试验简单,这里做了几个简单的假设矩阵为方阵(n*n) comm_sz(线程数量)和n满足下 ...
【MPI编程】任意数节点的树形求和（高性能计算）
简述之前写过一个只能在2幂次数的节点环境下使用的树形结构求和 [MPI编程]2幂节点的树形求和(高性能计算) 稍微修改了一下对应代码,就可以使用了.其实就是在逻辑上扩充一下为2的幂数.也就是说接受节 ...
任意二叉树节点数、度数与叶子数的关系
二叉树的性质--节点数.度数.叶子节点数的关系对于任意一棵二叉树,如果2度的节点数有n2个,则叶子数n0必定为n2+1(n0=n2+1) (1) 我们假设有二叉树的枝有B个,如果从下往上思考,可以看 ...
MPI编程及性能优化
第1节 MPI简介 1.1 MPI及其历史与OpenMP相似,消息传递接口(Message Passing Interface,简称MPI)是一种编程接口标准,而不是一种具体的编程语言.该标准是由消 ...
计算神经网络隐藏层节点数极小值
神经网络的隐藏层的节点数越少网络的速度越快,那么神经网络的隐藏层的节点数是否有一个可以保证性能的极小值,本文用mnist数据集做了实验. 首先制作一个784*n*2的神经网络,用于测试0-9中的任意两 ...
java质因数的分解_Java实现分解任意输入数的质因数算法示例
本文实例讲述了Java实现分解任意输入数的质因数算法.分享给大家供大家参考,具体如下: 分解任意输入数的质因数: 质因数概念:任何一个合数都可以写成几个质数相乘的形式.其中每个质数都是这个合数的因数, ...
高性能MPI编程实验
文章目录一.实验目的二.实验要求三.华为云平台的功能特性和实践关键步骤四.高性能MPI编程开发关键过程五.WordCount算法的MPI实现关键点六.MPI编程与MapReduce的比较分 ...
分布式系统中一些主要的副本更新策略——Dynamo/Cassandra/Riak同时采取了主从式更新的同步+异步类型，以及任意节点更新的策略。...
分布式系统中一些主要的副本更新策略. 1.同时更新类型A:没有任何协议,可能出现多个节点执行顺序交叉导致数据不一致情况. 类型B:通过一致性协议唯一确定不同更新操作的执行顺序,从而保证数据一致性 2 ...

【MPI编程】任意节点数的蝶形求和（高性能计算）

简述

代码

【MPI编程】任意节点数的蝶形求和（高性能计算）相关推荐

最新文章

热门文章