一、参数解释

合适的HPL.dat参数设置才能够正常运行以及达到较好的性能。

HPLinpack benchmark input file
Innovative Computing Laboratory, University of Tennessee
HPL.out      output file name (if any)
8            device out (6=stdout,7=stderr,file)
1            # of problems sizes (N)
80000       Ns
1            # of NBs
1024         NBs
0            PMAP process mapping (0=Row-,1=Column-major)
1           # of process grids (P x Q)
1           Ps
1           Qs
16.0         threshold
1            # of panel fact
1        PFACTs (0=left, 1=Crout, 2=Right)
1            # of recursive stopping criterium
4          NBMINs (>= 1)
1            # of panels in recursion
2            NDIVs
1            # of recursive panel fact.
1        RFACTs (0=left, 1=Crout, 2=Right)
1            # of broadcast
0            BCASTs (0=1rg,1=1rM,2=2rg,3=2rM,4=Lng,5=LnM)
1            # of lookahead depth
2            DEPTHs (>=0)
2            SWAP (0=bin-exch,1=long,2=mix)
64           swapping threshold
0            L1 in (0=transposed,1=no-transposed) form
0            U  in (0=transposed,1=no-transposed) form
1            Equilibration (0=no,1=yes)
8            memory alignment in double (> 0)

1、第1、2行为注释说明行,不需要作修改

2、第3行说明如果输出文件的话,文件的名字

3、第4行说明输出结果文件的形式,为“6”时,测试结果输出至标准输出(stdout),为“7”时,测试结果输出至标准错误输出(stderr),为其它值时,测试结果输出至第3行所指定的文件中

4、第5行说明求解问题(矩阵)的个数,也就是第6行要设置的参数的个数

5、第6行要设置矩阵的阶,参数值要与第5行的数值相等。网上大多数都说N的值为N×N×8=系统总内存×80%最优

6、第7行说明求解问题(矩阵)时采用的分块方式的种数,也就是第8行要设置的参数的个数

7、第8行说明每一种分块的大小。为提高数据的局部性,从而提高整体性能,HPL采用分块矩阵的算法。NB值的选择主要是通过实际测试得到最优值。

8、第9行是选择处理器阵列是按列的排列方式还是按行的排列方式。

9、第10-12行说明二维处理器网格(P×Q)。二维处理器网格(P×Q)的要遵循以下几个要求:P×Q=进程数。这是HPL的硬性规定。

10、其他值采取默认即可。

二、单个节点上执行

命令:

./xhpl

结果:

================================================================================
HPLinpack 2.3  --  High-Performance Linpack benchmark  --   December 2, 2018
Written by A. Petitet and R. Clint Whaley,  Innovative Computing Laboratory, UTK
Modified by Piotr Luszczek, Innovative Computing Laboratory, UTK
Modified by Julien Langou, University of Colorado Denver
================================================================================An explanation of the input/output parameters follows:
T/V    : Wall time / encoded variant.
N      : The order of the coefficient matrix A.
NB     : The partitioning blocking factor.
P      : The number of process rows.
Q      : The number of process columns.
Time   : Time in seconds to solve the linear system.
Gflops : Rate of execution for solving the linear system.The following parameter values will be used:N      :   80000
NB     :    1024
PMAP   : Row-major process mapping
P      :       1
Q      :       1
PFACT  :   Crout
NBMIN  :       4
NDIV   :       2
RFACT  :   Crout
BCAST  :   1ring
DEPTH  :       2
SWAP   : Mix (threshold = 64)
L1     : transposed form
U      : transposed form
EQUIL  : yes
ALIGN  : 8 double precision words--------------------------------------------------------------------------------- The matrix A is randomly generated for each test.
- The following scaled residual check will be computed:||Ax-b||_oo / ( eps * ( || x ||_oo * || A ||_oo + || b ||_oo ) * N )
- The relative machine precision (eps) is taken to be               1.110223e-16
- Computational tests pass if scaled residuals are less than                16.0================================================================================
T/V                N    NB     P     Q               Time                 Gflops
--------------------------------------------------------------------------------
WR20C2C4       80000  1024     1     1             729.77             4.6774e+02
HPL_pdgesv() start time Fri Jul 17 09:24:43 2020HPL_pdgesv() end time   Fri Jul 17 09:36:53 2020--------------------------------------------------------------------------------
||Ax-b||_oo/(eps*(||A||_oo*||x||_oo+||b||_oo)*N)=   2.16389188e-03 ...... PASSED
================================================================================Finished      1 tests with the following results:1 tests completed and passed residual checks,0 tests completed and failed residual checks,0 tests skipped because of illegal input values.
--------------------------------------------------------------------------------End of Tests.
================================================================================

三、多个节点执行

命令:

第一种方式:
mpirun -np N xhpl  N为进程数第二种方式:
mpirun -p4pg <p4file> xhpl  需要自己编写配置文件,p4file指定每个进程在哪个节点运行

Linux下Linpack测试CPU性能的相关参数配置以及执行命令相关推荐

  1. Linux下Linpack测试CPU性能的相关库、环境搭建部署

    1.简介: Linpack是线性系统软件包(Linear system package) 的缩写,是国际上使用最广泛的测试高性能计算机系统浮点性能的基准测试. 2.相关条件: 编译器:支持C和Fort ...

  2. Linux下快速查看CPU使用情况的相关命令

    Linux下快速查看CPU使用情况比较常用的命令是free.top.ps.这篇文章来看下如何在Linux下检查服务器的CPU使用情况.我的Linux是Linux-Ubuntu-server-15.04 ...

  3. linux下如何获取cpu的利用率

    "proc文件系统是一个伪文件系统,它只存在内存当中,而不占用外存空间.它以文件系统的方式为访问系统内核数据的操作提供接口.用户和应用程序可以通过proc得到系统的信息,并可以改变内核的某些 ...

  4. win7系统稳定测试软件,win7系统电脑测试cpu性能的方法(图文)

    一般情况,购买电脑都比较注重cpu性能,cpu是一台计算机的运算核心和控制核心,所以是非常重要的.很多用户遇到win7系统电脑开机CPU就达到80多度,并且会自动关机或重启,非常麻烦,怎么回事呢?这种 ...

  5. SpecCPU2017 测试cpu性能

    [转载] SpecCPU介绍见: https://blog.csdn.net/qq_36287943/article/details/103601539 官网:https://spec.org/ 1. ...

  6. linux下如何查看cpu信息

    linux的cpu信息可以从文件中cpuinfo读取. 执行命令: [root@liuli ~]# cat /proc/cpuinfo processor : 0 #逻辑核,它的计数是从0开始的,例如 ...

  7. 20线程测试cpu性能软件,CPU常用跑分软件 你知道那些?

    跑分测试是检测硬件性能的重要手段,但毕竟需要专业测试软件,很多小伙伴对于测试软件一头雾水,不知道有哪些测试软件,本次笔者就给大家科普一下CPU测试中常用的测试软件,帮助大家更好的了解自己电脑的性能. ...

  8. linux 下取进程占用 cpu/内存 最高的前10个进程

    1. linux 下 取进程占用 cpu 最高的前10个进程 ps aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head ps auxw|head -1 ...

  9. 查看linux的用户 7.2,linux下查看用户登入系统相关命令及编写脚本(七)

    linux下查看用户登入系统相关命令及编写脚本(七) 查看用户登入系统日志 1.w 显示谁登入并正在做什么事 2.who 显示谁登入 -r:显示系统运行级别 3.sleep 睡眠命令(sleep 5 ...

  10. Linux下区分物理CPU、逻辑CPU和CPU核数

    Linux下区分物理CPU.逻辑CPU和CPU核数 ㈠ 概念 ① 物理CPU 实际Server中插槽上的CPU个数物理cpu数量,可以数不重复的 physical id 有几个 ② 逻辑CPU Lin ...

最新文章

  1. 悲催的跨平台文献管理能力
  2. 全球及中国甲苯二异氰酸酯预聚物行业投资状况与前景建议研究报告2022版
  3. 如何在CentOS 7上安装Redis服务器
  4. VC控件 Progress Control
  5. TPYBoard v102 DIY照相机(视频和制作流程)
  6. 机器人统治人类?别逗!现实中的机器人是这样的
  7. 考研C++必刷题(一)
  8. CSS3 box-shadow 属性
  9. 52 -算法 -数据结构类 Leetcode26 删除有序数组中的重复项
  10. 8个jQuery Mobile基础教程
  11. 代数法化简逻辑函数方法集合
  12. 画图工具的认识及应用计算机,认知画图软件教学设计
  13. sql语句中count(*),count(1),count(id)区别详解
  14. 路由器上DNS的设置
  15. 都2022年了 究竟什么叫旗舰手机?
  16. 李宏毅机器学习(一)
  17. AutoCAD2008绿色版用法
  18. Linux工具:grep精确匹配
  19. Android R版本 MtkSettings和Telephony进程通信aidl
  20. 《微服务》八特性--标注性考究

热门文章

  1. 双显卡(Intel+Nvidia)笔记本配置cuda开发环境
  2. oracle的12012,Oracle 18.3 ORA-12012 ORA-20001
  3. discuz自定义接口开发——一键发帖,自动发帖,站外发帖(主题)
  4. k8s设计-多容器pod设计模式
  5. 百度快照劫持代码的更新
  6. 手机android怎么开机画面,Android使用BroadcastReceiver实现手机开机之后显示画面的功能...
  7. 2020.7-8月份暑假培训总结
  8. 13.SpringBoot学习(十三)——JDBC之 Spring Boot Jpa多数据源
  9. php eclipse aptana,Eclipse安装Aptana插件(注意对应版本问题)
  10. 2021年安全生产模拟考试(建筑起重信号司索工模拟考试题库)安考星