参考

Lammps实现GPU加速,博客界面很好看。

显卡驱动安装(本文默认为英伟达)

- 检查自己的驱动是否安装成功

nvidia-smi

如果安装成功会有如下输出:

如果未安装会有如下结果:

nvidia-smi command not found

- 安装驱动

ubuntu-drivers devices            # 查询所有ubuntu推荐的驱动
sudo ubuntu-drivers autoinstall

手动安装可以部分参考我的另一篇博客:报错解决:Before you can run VMware, several modules must be compiled and …(更換內核)

禁用nouveau driver

nouveau开源驱动,性能很差,基本都禁用它,之前安装Ubuntu系统时,引导文件里就进行了禁用:

sudo vi /etc/modprobe.d/blacklist.conf

最后添加:

blacklist nouveau
options nouveau modeset=0

保存退出后,终端输入:

sudo update-initramfs -u
sudo reboot

reboot之后输入:

lsmod | grep nouveau

无输出代表禁用成功

CUDA Toolkit 安装

上NVIDIA官网进行下载:CUDA Toolkit 10.2 Download,安装流程很详细,但是网速很感人,建议大家翻墙…

安装完cuda之后添加环境变量:

vi .bashrc
export PATH=$PATH:/usr/local/cuda-10.2/bin

之后输入:nvcc -V,就会以下信息:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Wed_Oct_23_19:24:38_PDT_2019
Cuda compilation tools, release 10.2, V10.2.89

Generic Linux Makefile for CUDA文件配置

进入gpu目录,修改Makefile.linux

cd lammps-3Mar20/lib/gpu
vim Makefile.linux

修改以下信息,符合自己的机子和计算要求即可:

CUDA_HOME = /usr/local/cuda-10.2            #注意版本
# Turing hardware
CUDA_ARCH = -arch=sm_75
CUDA_PRECISION = -D_SINGLE_DOUBLE       #我选的计算过程中的精度

hardware参数可以见维基的介绍CUDA,我的gtx 1660ti对应的Micro-architecture和Compute capability (version)分别为Turing,7.5,所以应该选择sm_75。

之后进行make:

make -f Makefile.linux

如果之后更改Makefile.linux 中的内容之后需要重新编译需要先 make clean 一下:

make -f Makefile.linux clean

Lammps GPU package

cd lammps-3Mar20/src
make package-status             #查阅自己的package安装信息
make yes-gpu                    #添加gpu包
make mpi                        #编译mpi

如果编译过mpi文件,则可以先clean一波:make clean-all,如果还是有问题,可以考虑万能的sudo

测试

官网的例子,还是shear:

cd lammps/lammps-3Mar20/examples/shear

12线程无GPU:

mpirun -np 12 lmp_mpi < in.shear

12线程1GPU:

mpirun -np 12 lmp_mpi -sf gpu -pk gpu 1 -in in.friction

由于是小体系的example,GPU加速效果不是很明显,甚至慢很多,但是跑自己的程序,原子数目一多,GPU加速特别明显!!!!!!!!!!!!大概是五倍以上的速度!!!!

一万多原子,4000步摩擦,12线程无GPU花了3:28s,12线程1GPU只花了37s,真的太香了。

每10秒输出一次显卡状态:

watch -n 10 nvidia-smi

Ubuntu下的lammps GPU加速(真的香)相关推荐

  1. 记录一下折腾Ubuntu 20.04部署lammps GPU加速 2*AMD 7742 1*NVIDIA 3090

    本人技术小白,目前已经安装好Ubuntu 20.04,nvidia驱动版本470.86 安装cuda CUDA Toolkit 11.5 Downloads | NVIDIA Developer 登录 ...

  2. Caffe2-windows下caffe的gpu加速

    摘要:本篇日志承载上篇内容,在上篇基础上进行优化和添加.主要说明在正确cpu的caffe框架下如何添加gpu加速的过程. 正文: 上篇说明了如何安装cpu版本的caffe框架,其中我提到过,只有cpu ...

  3. Windows10下Tensorflow启用GPU加速,显卡GTX1060,踩坑记录

    因为需要用到tensorflow学习深度学习,所以有N卡就想开启GPU加速,结果各种坑 1.安装VS和Python环境  (不用VS的可以不安装,使用其他工具也是一样的) 这里使用VS2019作为开发 ...

  4. Linux下JavaCv使用GPU加速(Nvidia显卡)

    1.环境配置,安装显卡驱动,cuda,cudnn ​​​​​​linux上安装NVIDIA显卡驱动以及深度学习需要的cudn.cudnn.pytorch_宜城有少年的博客-CSDN博客_linux安装 ...

  5. ubuntu16.04下安装TensorFlow(GPU加速)----详细图文教程【转】

    本文转载自:https://blog.csdn.net/zhaoyu106/article/details/52793183 le/details/52793183 写在前面 一些废话 接触深度学习已 ...

  6. ubuntu16.04下安装TensorFlow(GPU加速)----详细图文教程

    文章来源:http://www.datacups.com/post/1 软件: ubuntu16.04+cuda8.0+cudnn v5+tensorflow 0.11 1. 下载 1.1 系统镜像 ...

  7. ubuntu下docker使用GPU

    达到以下条件即可: 1 docker内部和宿主机的显卡驱动要一致 说白了就是你的cuda.cudnn基于那个显卡驱动,你就要用哪个,内外都要部署 我测试过内部不部署,运行会失败 2 内部虽然装了显卡驱 ...

  8. Ubuntu下如何查看GPU版本和使用信息?

    nvidia-smi是用来查看GPU版本信息,GPU使用信息查询: nvidia-smi   第一栏的Fan:N/A是风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风 ...

  9. Windows环境下tensorflow使用GPU加速运算(详细解释)

    自己在使用时从无到有的过程 一.使用以下代码进行相应的检查 1.查看tensorflow的版本: import tensorflow as tfprint(tf.__version__) # 查看Te ...

最新文章

  1. 分析PHP中单双引号的误区和双引号小隐患
  2. 归纳+记忆:让机器像人一样从小样本中学习
  3. 保证一致性吗_RabbitMQ消息一致性:重要消息,请设置持久化
  4. 使用dbca创建oracle实例
  5. 1)Linux学习笔记:crontab命令
  6. C++---智能指针原理讲解
  7. 接口测试实战总结,绝对值得收藏
  8. 触目惊心,北邮计算机学院女神居然每天看这些公众号
  9. 精选|2018年12月R新包推荐
  10. VS2019配置opencv教程【推荐】
  11. 《数据挖掘导论》绪论
  12. c语言头随机数文件库,C语言随机数使用方法
  13. 计算机网络设计——企业网络规划与搭建
  14. c语言gps经纬度转换程序,GPS经纬度坐标的转换
  15. 大数据、人工智能带来的危机:科技巨头会毁掉我们的生活吗?
  16. Flink学习:WaterMark
  17. 数字化推动后市场产业变革,开启汽车后市场新篇章
  18. 知乎高赞:Java和嵌入式,选哪个?
  19. 使用VISA编程入门教程
  20. java 合并和拆分单元格_如何在Microsoft Word中合并和拆分表和单元格

热门文章

  1. 信息系统项目管理师知识点(第 1 章)-信息系统基础知识
  2. js以excel为模板的打印
  3. 三角形的缩放动画,不会做的看过来!
  4. Docker compose 部署habor
  5. 8. python str( )函数
  6. 被互联网租房套路割韭菜的年轻人
  7. AHRS系统的基本构成
  8. 镜像站(整理各个镜像站资源)
  9. 冯·诺依曼结构:现代计算机的诞生
  10. 三菱fx5u modbus tcp fb块用法_FX5U强势来袭