Slepc计算矩阵特征值时间测试

注:

(1)GPU集群介绍:

该集群有一个登录节点(ustcgpu)和100个计算节点(node1~node100)。各计算节点配置2 颗4核的IntelE5520 CPU,16GB内存,通过20GbsInfiniBand互联。

(2)测试采用Krylov-Schur算法

  1. 计算速度

这里采用Slepc计算稀疏度约为1%矩阵的一半特征值。

下面的表格表示的是计算1000×1000、2000×2000、5000×5000、10000×10000矩阵各自一半的特征值,所需要的时间。

时间(s)

1000

2000

5000

10000

Write_time

0

1

30

449

Compute_time

24

91

650

3184

Total_time

24

92

680

3633

Write_time/Compute_time

0

0.01

0.04

0.14

根据上图进行二次曲线拟合(蓝线表示),预测10W规模稀疏矩阵的特征值求解时间,4.6109e+005s,约为128小时。

  1. 结论:

  1. Slepc计算少量特征值的时间很快,与矩阵规模的关系不大。如果计算大量的特征值(至少一半),则计算时间呈指数增加。而TB程序需要的特征值对至少是一半,因此,Slepc中的算法针对大规模矩阵的多特征值对的求解,需要进行改进。

  1. 如果在GPU集群上,若Slepc能够让求解速度加快,则效果会比较理想。现在Slepc已经有单GPU版本,需要更多的测试。

GPU上大规模稀疏矩阵特征值计算高效算法之三——SLEPc测试相关推荐

  1. 5种小型设备上深度学习推理的高效算法

    [导读]文中为AI实践者和研究者们介绍了5种高效模型推断算法,希望这篇文章能够帮助大家更清楚地认识到,在我们所使用的深度学习库的背后,有多少优化正在被应用,从而在像移动电话等小型边缘设备上实现越来越多 ...

  2. 取模、乘法和除法运算在CPU和GPU上的效率

    问题: 将整数n分解为i和j,满足下面关系: n  =  j * idim + i 其中idim为常量. 以下为三种算法实现:     1) i = n % idim,j = (n - i) / id ...

  3. 取模 乘法和除法运算在CPU和GPU上的效率

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 问题: ...

  4. 实现大规模图计算的算法思路

    分享嘉宾:徐潇然 Hulu 研究员 编辑整理:莫高鼎 出品平台:DataFunTalk 导读:2017年我以深度学习研究员的身份加入Hulu,研究领域包括了图神经网络及NLP中的知识图谱推理,其中我们 ...

  5. GPU上稀疏矩阵的基本线性代数

    GPU上稀疏矩阵的基本线性代数 cuSPARSE库为稀疏矩阵提供了GPU加速的基本线性代数子例程,这些子例程的执行速度明显快于仅CPU替代方法.提供了可用于构建GPU加速求解器的功能.cuSPARSE ...

  6. 【GNN】谷歌、阿里、腾讯等在大规模图神经网络上必用的GNN加速算法

    点击上方,选择星标或置顶,每天给你送上干货 作者 | 对白 出品 | 对白的算法屋 今天我们来聊一聊在大规模图神经网络上必用的GNN加速算法.GNN在图结构的任务上取得了很好的结果,但由于需要将图加载 ...

  7. gpu填充速率 计算_【经典回顾】Nvidia GPU 上的 CNN 计算速度变迁

    笔者从 2012 年初开始接触 GPU 编程,2014 年上半年开始接触 Caffe,可以毫不谦虚地说是"一天天看着 Nvidia GPU 和 Caffe 长大的". Nvidia ...

  8. 上海内推 | 商汤科技招聘计算视觉算法实习生

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 商汤科技 商汤科技是一家行业领先的人工智能软件公司,以"坚持原创 ...

  9. GPU上的快速光谱图分区

    GPU上的快速光谱图分区 图形是用于对物理,生物,社会和信息系统中许多类型的关系和过程进行建模的数学结构.用于解决各种高性能计算和数据分析问题.对于网络分析,基因组学,社交网络分析和其他领域,大规模图 ...

最新文章

  1. lists,tuples and sets of Python
  2. Mysql 小数点后最多保留两位数
  3. 赫夫曼树(哈夫曼树)
  4. 《深入浅出Google Android》即将隆重上市!
  5. SQLite中的内连接简化技巧
  6. offer from university of edinburgh
  7. 【iCore1S 双核心板_ARM】例程十六:USB_MSC实验——虚拟U盘
  8. Vue3.js 全局组价案例入门
  9. 如何用管程实现生产者消费者问题?
  10. Python变量:声明,连接,全局和本地
  11. 田逸:坎坷IT路 从机修工到系统管理高手『英雄故事』
  12. 解决依赖包引入后重复问题Duplicate zip entry
  13. 微软苏州STCA SWE Intern 面试过经
  14. heartbeat和keepalive
  15. 怎么把淘宝宝贝分享到微信朋友圈
  16. 大学概率论终极复习攻略
  17. 黑马程序员————第三天
  18. python中的正则表达式re模块_Python中的re模块--正则表达式
  19. 一张图让你了解五险一金
  20. BLDC无刷电机6步换向步骤简述

热门文章

  1. html判断按键状态,javascript判断鼠标按键和键盘按键的方法
  2. 单身程序猿如何充实过好情人节
  3. Android程序设置为系统自启动应用
  4. 计算机更改有什么好处,电脑ip更改有什么用,影响是什么?
  5. 浅谈RPA虚拟机器人对现代企业管理的组织变革思考
  6. 今天吃什么?我直接用Python制作随机食物生成器
  7. oracle数据泵导出多表,oracle 数据泵导出表
  8. IP获取方法一:网页JS获取当前地理位置(省市区)
  9. python编写会计凭证金蝶_怎么在金蝶财务软件中录入会计凭证
  10. 国产数字源表在三极管性能测试上面的应用