Abaqus CPU并行计算 加速计算信息汇总

下面是网络上https://www.eng-tips.com/viewthread.cfm?qid=445089的答疑:

In Abaqus CAE, what does it mean Use multiple processors? Does that mean number of processors or number of cores? Meaning if I have a computer with 8 processors and each of them several cores; should I put the number of processors or total number of cores to use? 在Abaqus CAE中,使用多处理器是什么意思?这是指处理器的数量还是核心的数量?这意味着如果我有一台有8个处理器的计算机,每个处理器有多个内核;我应该输入要使用的处理器数量还是内核总数?

答复:Multiple processors in the context of Abaqus usually mean cpu threads.

Lets say you have two physical CPUs with 8 cores each (Intel) with hyperthreading (2 threads per CPU core). That will give you access to 32 threads. It is recommended to disable hyperthreading in BIOS which will give you access to 2 physical CPUs with 8 physical cores and 8 threads = 16 threads. In Abaqus you then set the "cpus" to 16.

I remember reading about hyperthreading when I got my Intel 2600k for my personal PC back in 2012. If you run an application which scales great (Cinebench) then you got (at that time) about 15% increase in rendering performance.

When it comes to implicit analysis, scaling is not perfect. I guess that going from 1 to 2 threads would scale quite good (and 4 to 8 in your case). Double the cores and almost double the performance. Scaling problems are more visible for a higher number of cores. I've heard explicit solution methods scale better.

Another thing which is a big one is the number of license tokens you need to run the job. That increases too with hyperthreading and then your collegues can't run their jobs (license pool). If you pay by the hour for your tokens, it quickly makes financial sense (imo) to get a CPU with enough "real" cores to get the most out of your money in the long run.

Abaqus环境中的多处理器通常意味着cpu线程。假设您有两个物理CPU,每个CPU 8核(Intel),带有超线程(每个CPU核2个线程)。这将允许您访问32个线程。建议在BIOS中禁用超线程,这样可以访问2个物理CPU,其中包含8个物理内核,8个线程=16个线程。在Abaqus中,然后将“CPU”设置为16。(编者注:实际就是逻辑处理器数量。)

我记得我在2012年为我的个人电脑购买了Intel 2600k时读到了有关超线程的内容。如果您运行的应用程序具有很好的可伸缩性(Cinebench),那么您(当时)的渲染性能将提高约15%。

对于隐式分析,缩放并不完美。我想从1到2个线程可以很好地扩展(在您的情况下是4到8)。核心数翻倍,性能几乎翻倍。对于更多的核,缩放问题更为明显。我听说显式解决方案的规模更大。

另一件大事是运行作业所需的许可证令牌的数量。这也会随着超读而增加,然后你的同事就无法运行他们的作业(许可证池)。如果你按小时付费购买代币,那么从长远来看,获得一个具有足够“真实”内核的CPU很快就会有经济意义(imo)。


Similar thing for Use of GPGPU acceleration; If I have only one GPU that I want to use at 100%, with 780 cores, should I put a 1 or 780? GPGPU加速类似;如果我只有一个GPU,我想100%使用780流处理器,我应该写1还是780?

答复:If you have a compatible GPU and the license for it, then its called by the GPU parameter. 1 gpu with 780 cores is called as "gpus=1".如果您有一个兼容的GPU及其许可证,那么它将由GPU参数调用。1个具有780核的gpu称为“gpu=1”。


  1. Which Multiprocessing mode would you reccommend for a non linear static analysis? 对于非线性静态分析,您建议采用哪种多重处理模式?

答复:"For both an Abaqus/Standard and an Abaqus/Explicit analysis, you can choose whether the multiprocessing mode should be Default, Threads, or MPI (Message Passing Interface). The default multiprocessing mode is dependent on the platform on which the analysis product executes." 对于Abaqus/标准和Abaqus/显式分析,您可以选择多处理模式是默认、线程还是MPI(消息传递接口)。默认多处理模式取决于分析产品执行的平台


  1. In the precision tab, which Nodal output precision do you use? What is the difference between Full and single? 在“精度”选项卡中,您使用哪个节点输出精度?完全和单精度的区别是什么?

答复:"Use the Precision tabbed page to specify either single or double precision for Abaqus/Explicit analyses. You can also choose the precision of nodal output that is written to the output database during the analysis."The precision, I guess, is dependent on your needs. “使用精度选项卡页为Abaqus/显式分析指定单精度或双精度。您还可以选择在分析期间写入输出数据库的节点输出精度。”我想,精度取决于你的需要。


  1. Have any of you experienced a great improvement regarding computational time for models of 3-5 Million elements? I have not founf a lot on the internet of people actually achieving a great improvement. 对于300-500万个元素的模型,你们中是否有人在计算时间方面有很大的改进?我在互联网上没有发现人们取得了很大的进步。

答复:Great improvement in solving time by using GPUs? I have not tried to use it.使用GPU在解决时间上有很大的改进?我没有试着使用它。


Is parallelization giving better results in Linux than in Windows? 并行化在Linux中的效果是否比在Windows中更好?

答复:Linux? I haven't compared it to windows when it comes to Abaqus.Linux?谈到Abaqus,我还没有将它与windows进行比较。


Can all the GPUs be used for parallelization (provided they are dedicated GPUs? 所有GPU是否都可以用于并行化(前提是它们是专用GPU)

答复:All GPUs can be used. 可以使用所有GPU。


I've never heard of any difference between Linux and Windows in performance of the solver.

For large models (static analysis in A/Std) it might be worth trying the iterative solver. Especially if the parts are blocky. But there are limitations when features with lagrange multipliers are defined. This cannot be handled in the iterative solver.

For only slightly nonlinear analysis you can activate the quasi-newton method, so the tangent stiffness gets not updated every iteration.

For frequency analysis use the AMS solver.我从来没有听说过Linux和Windows在解算器性能上有什么不同。

对于大型模型(A/Std中的静态分析),可能值得尝试迭代解算器。尤其是如果零件是块状的。但是,定义具有拉格朗日乘子的特征时存在局限性。这无法在迭代解算器中处理。

对于轻微的非线性分析,可以激活拟牛顿法,因此切线刚度不会在每次迭代时更新。

对于频率分析,请使用AMS解算器。


https://appleasks.com/edu/182592.html

透過利用多處理器和GPGPU實現平行計算也是ABAQUS中可以直接設定的加速技巧。對於GPGPU的加速原理則主要是利用了其比CPU強大得多的平行計算能力,配合CPU的邏輯處理能力以達到速度最大化。需要注意的是,ABAQUS中GPGPU只能用於隱式計算,而不能用於顯式。


Abaqus命令行计算及批量计算技巧

https://geomatlab.com/abaqus-job-command/


据说cpu并行对standard的意义不大

https://www.zhihu.com/question/284103461/answer/435364329


Abaqus CPU并行计算 加速计算信息汇总相关推荐

  1. matlab CPU并行计算,加速限制了改组。 GPU(Tesla K40m),MATLAB中的CPU并行计算

    我的代码: h1> close all clear all clc % open parpool skip error if it was opened try parpool(24); end ...

  2. abaqus如何并行计算_ABAQUS加速计算的小技巧

    本文结合查阅的资料(例如文末附上的参考文献[1].[2]),以及自己的实践经验,总结了一些ABAQUS计算中加快计算速度的小技巧,希望对初学者有所帮助. 1. 减少输出变量,增大输出步长 首先对输出的 ...

  3. mobilenet cpu 加速_AI降成本利器!阿里云弹性加速计算实例来了,最高节省50%推理成本...

    简介:近日,阿里云推出了弹性加速计算实例(EAIS)家族及产品弹性加速推理实例(简称EAIS.EI),首次实现了GPU与CPU/内存的解耦,可在提升AI推理效率的同时大幅降低成本. 人工智能推理场景下 ...

  4. MATLAB上的GPU加速计算

    概述 怎样在MATLAB上做GPU计算呢?主要分为三个步骤:数据的初始化.对GPU数据进行操作.把GPU上的数据回传给CPU 一.数据的初始化 首先要进行数据的初始化.有两种方法可以进行初始化:一是先 ...

  5. CUDA加速计算矩阵乘法进阶玩法(共享内存)

    CUDA加速计算矩阵乘法&进阶玩法~共享内存 一.基础版矩阵乘法 二.为什么可以利用共享内存加速矩阵乘法 1.CUDA内存读写速度比较 2.申请共享内存 三.改进版矩阵乘法(利用共享内存) 一 ...

  6. gpu处理信号_GPU显卡不仅用来打游戏那么简单,它还可以用于通用加速计算

    如今,显卡不仅在工作站.个人PC中变得非常重要,而且在数据中心也处于举足轻重的地位.CPU负责通用计算.GPU负责加速计算已经成为绝大数数据中心一种常态.用于加速计算的GPU专用处理器,它将计算密集型 ...

  7. 如何利用多核CPU来加速你的Linux命令

    如何利用多核CPU来加速你的Linux命令 原文出处: rankfocus   译文出处: 外刊IT评论 你是否曾经有过要计算一个非常大的数据(几百GB)的需求?或在里面搜索,或其它操作--一些无法并 ...

  8. CUDA加速计算的基础C/C++

    本文是Nvidia 90美金的课程笔记 无论是从出色的性能,还是从易用性来看,CUDA计算平台都是加速计算的制胜法宝.CUDA 提供了一种可扩展 C.C++.Python 和 Fortran 等语言的 ...

  9. tensorflow的GPU加速计算

    参考    tensorflow的GPU加速计算 - 云+社区 - 腾讯云 一.概述 tensorflow程序可以通过tf.device函数来指定运行每一个操作的设备,这个设备可以是本地的CPU或者G ...

最新文章

  1. 【jdbc】兴唐第三十一节课之修改数据和查询数据(使用自己写的DBUtil)
  2. 卷学历、卷加班……程序员拥有什么能力才能破局内卷?
  3. BS-XX-007基于JSP实现户籍管理系统
  4. 尝鲜党:Nexus5、6刷安卓M教程
  5. javascript array sort()
  6. 由于供不应求 部分新款Apple Watch机型推迟至11月交付
  7. dynamic结合匿名类型 匿名对象传参
  8. jQuery 基本知识详解
  9. [前端随笔][Javascript][物理引擎] 给元素添加简单的物理属性
  10. 【转--- 数据挖掘的心得学习】
  11. jquery 插件zClip实现复制到剪贴板功能
  12. Qt QJson遍历
  13. 适合python组态软件_组态软件哪个好
  14. 2022工具钳工(高级)考试题模拟考试平台操作
  15. 解析dex2oat的实现
  16. fedora 11 配置 thinkpad trackpoint 中键
  17. 快速原型软件开发模式
  18. UEFI与BIOS GPT与MBR 科普
  19. addClass(““).delay().removeClass(““);没有效果的解决方式
  20. [Mac] OSX 快捷键组合 (完整版)

热门文章

  1. 013-Vue:前端知识结构概述、基本语法、声明周期
  2. 如何使用sql语句算两经纬度的距离
  3. Ubuntu查看USB串口号【简单、好记、好看】
  4. 2018 6 11 没有触角的蚂蚁
  5. STM32初学者KILE5软件的使用
  6. Java 基础 第3阶段:高级应用——尚硅谷学习笔记(含面试题) 2023年
  7. java 静态抽象类_java--抽象类实例(包含静态内部抽象类)
  8. ChatGLM-6B 安装试用
  9. 深入理解Linux 条件变量3:条件变量为什么要配合着锁使用?
  10. Outlook无法打开 .ost文件损坏,卸载重装也恢复不了