最近由于需要重新使用DeepMD,实验室服务器又崩了,/opt /home阵列全完蛋了,只能在自己的机器上进行重新安装。
DeepMD是由Wang等人开发的机器学习MD工具包,其github地址如下:

https://github.com/deepmodeling/deepmd-kit/

我使用了DeepMD官方推荐的conda方法安装,不得不说conda真是神器,安装早期版本的时候跳了一万次坑。

此处选用GPU版本,推荐conda虚拟环境,所有需要GPU的包都强烈建议使用虚拟环境运行,一面出现差错。此处我使用的anaconda版本为4.6.11,新版本可能出现错误。

conda create -n dpmd python=3.6 #建立虚拟环境
source activate dpmd #激活虚拟环境 对于新版本conda 使用 conda activate dpmd
conda install deepmd-kit=*=*gpu lammps-dp=*=*gpu -c deepmodeling

安装过程十分顺利,但在运行example时出现报错

tensorflow.python.framework.errors_impl.InternalError: cudaGetDevice() failed. Status: CUDA driver version is insufficient for CUDA runtime version

发现是由于其依赖的CUDA版本过新,而我自己的机器上显卡驱动比较古老,导致Tensorflow运行时报错。搜索后发现果然是CUDA版本与驱动版本不匹配,按照官网的说法CUDA 10.1需要418以上的驱动版本。

Table 1. CUDA Toolkit and Compatible Driver Versions

CUDA Toolkit Linux x86_64 Driver Version Windows x86_64 Driver Version
CUDA 10.2.89 >= 440.33 >= 441.22
CUDA 10.1 (10.1.105 general release, and updates) >= 418.39 >= 418.96
CUDA 10.0.130 >= 410.48 >= 411.31
CUDA 9.2 (9.2.148 Update 1) >= 396.37 >= 398.26
CUDA 9.2 (9.2.88) >= 396.26 >= 397.44
CUDA 9.1 (9.1.85) >= 390.46 >= 391.29
CUDA 9.0 (9.0.76) >= 384.81 >= 385.54
CUDA 8.0 (8.0.61 GA2) >= 375.26 >= 376.51
CUDA 8.0 (8.0.44) >= 367.48 >= 369.30
CUDA 7.5 (7.5.16) >= 352.31 >= 353.66
CUDA 7.0 (7.0.28) >= 346.46 >= 347.62

于是从Nvidia官网查找最新的匹配驱动,我的显卡是Nvidia Quardo P4000。

https://www.nvidia.cn/Download/index.aspx?lang=cn

我选择了使用二进制run文件而不是PPA方法进行安装。
首先需要进入按Ctrl+Alt+F2进入tty2,然后关闭X server服务,对于lightdm桌面系统,关闭服务并检查服务状态:

sudo /etc/init.d/lightdm stop
sudo /etc/init.d/lightdm status

卸载旧版本的显卡驱动

sudo apt-get purge nvidia*

给run文件添加可执行权限并且运行

chmod +x NVIDIA-Linux-x86_64-450.57.run
sudo ./NVIDIA-Linux-x86_64-450.57.run #注意安装驱动需要root权限

基本所有的选项都选yes,安装完成后使用reboot重启。

nvidia-smi # 检查显卡驱动是否安装成功
cat /proc/driver/nvidia/version #检查版本

发现已经驱动更新至450.57版本。此时再次运行DeepMD中的example,成功。此处example中所需的json文件及data文件均可从其github下载,完整的数据集可以从其官网 http://www.deepmd.org/database/deeppot-se-data/ 中得到。

另外一点需要注意的是在结束神经网络训练后,冻结模型导入Lammps中进行MD时有可能出现核心转储错误。

terminate called after throwing an instance of 'std::runtime_error'what():  invalid mesh tensor

这是由于在训练例子中提供了多个训练json文件,选择*_se_a或*_se_ar则不会出现此类问题。

DeepMD安装及Unbuntu下Nvidia显卡升级(防跳坑)相关推荐

  1. linux显卡驱动卸载和安装,Linux下Nvidia显卡驱动卸载和卸载后的问题

    Linux下Nvidia显卡驱动卸载和卸载后的问题 由于在Ubuntu下安装了Nvidia显卡驱动后开机一直处于循环登录界面,密码输入正确也是进不去,然后就决定卸载Nvidia显卡驱动. 首先是在能使 ...

  2. Ubuntu16.04下NVIDIA显卡驱动安装(华硕飞行堡垒7代,1660ti)

    Ubuntu下NVIDIA显卡驱动安装 我的电脑配置,华硕飞行堡垒7代,1660ti 亲测有效,我的系统重装5次! 1.首先进行安装,可以参考一下链接 安装 2.安装完毕后可能会出现这样的情况 按住C ...

  3. linux 显卡驱动无法安装程序,我就纳闷了,Linux下Nvidia显卡驱动一直安装失败

    我就纳闷了,Linux下Nvidia显卡驱动一直安装失败 发布时间:2009-12-21 15:19:22来源:红联作者:zhanghui625 今天 刚计划着把Linux的知识复习一下, 结果就出问 ...

  4. 超详细教程——Ubuntu20.04 安装英伟达NVIDIA显卡驱动、CUDA、Cmake以及不同版本的CUDA切换

    在windows和linux双系统下,为ubuntu安装nvidia.cuda.cmake等程序是一个可能会难到各个计算机小白的问题,本文将一步步地带您学会安装以上内容. 一.安装英伟达NVIDIA显 ...

  5. 修复Linux下NVidia显卡画面撕裂的问题

    修复Linux下NVidia显卡画面撕裂的问题 为什么会出现画面撕裂 如何解决 修改配置文件 Modprobe.d 为什么会出现画面撕裂 基于我目前的认知,画面撕裂主要是因为没有开启等待垂直同步.于是 ...

  6. Xubuntu 16.04下安装gtx 960m的NVidia显卡驱动----2017.03.19

    Xubuntu 16.04下安装nvidia显卡驱动 最关键的:两行代码 + 更改BIOS,搞定! 两行代码 sudo ubuntu-drivers devices 找到被 recommanded 的 ...

  7. linux nvidia是否安装程序,Linux 为 Nvidia 显卡安装闭源驱动

    **2018/06/30更新:如果你只想用独显,不需要安装Bumblebee进行双显卡切换,请移步此文[Install Nvidia driver, CUDA 9.1 and Tensorflow 1 ...

  8. Linux 系统下 NVIDIA 显卡驱动,GNOME 桌面环境不兼容

    NVIDIA 显卡驱动在 Windows 系统下的安装非常方便,大部分第三方软件都能直接自动检测型号,并从 NVIDIA 官网上下载驱动安装.但是在 Linux 操作系统下,NVIDIA 显卡的驱动需 ...

  9. centos卸载nvidia驱动_Linux下Nvidia显卡驱动卸载和卸载后的问题

    由于在Ubuntu下安装了Nvidia显卡驱动后开机一直处于循环登录界面,密码输入正确也是进不去,然后就决定卸载Nvidia显卡驱动. 首先是在能使用tty1登录的情况下,使用 $ sudo apt- ...

  10. ThinkPad X1E安装Ubuntu18.04及nvidia显卡驱动

    ThinkPad X1 Extreme安装Ubuntu18.04 LTS以及nvidia GTX1050ti显卡驱动 之前一直使用虚拟机ubuntu进行开发学习工作,这样无法发挥显卡的全部性能,系统性 ...

最新文章

  1. 互联网产品发布之灰度发布
  2. 【集合论】二元关系 ( A 上二元关系 | A 上二元关系示例 )
  3. size_t和ssie_t的区别
  4. 一些Java面试题深入分析
  5. poj1741 Tree 点分治
  6. url模糊匹配优化_企业必备的网站SEO优化解决方案
  7. Facebook在欧洲推出网络极端内容与仇恨言论打压行动
  8. ueditor上传图片尺寸过大导致显示难看的解决办法
  9. 决策树Decision Tree+ID3+C4.5算法实战
  10. 工具的使用——windows操作系统的使用(创建宽带连接)
  11. c语言纵行输入大写字母图形,GitHub - xswei/SVG_Essentials: 《SVG精髓》 阅读笔记
  12. word 引文 角标_如何自动向Microsoft Word添加引文和书目
  13. 1068 万绿丛中一点红 (20 分)
  14. django 注册登录邮箱验证功能
  15. 机器学习基础(五)最大似然估计
  16. 中奖人js滚动效果_jQuery实现中奖播报功能(让文本滚动起来) 简单设置数值即可...
  17. 沧海一粟小组(第三次作业)
  18. 营销内卷浪潮下,集团如何拓展边界?
  19. 如何用python破解热点_Python程序员:没有我蹭不成功的网。教你如何愉快的蹭到WIFI?...
  20. 人工智能教育进入中小学课堂,要怎么学?怎么教?

热门文章

  1. 如何使用 Serverless 做架构和项目管理—— 三年全栈经验总结
  2. 皮影机器人ppt_机器人皮影戏装置的制作方法
  3. Java动态代理的理解
  4. 微信绑定会员卡服务器出错,微信会员卡跳转到微信小程序出现如下错误?
  5. 京东联盟CPS API调用:我不想吐槽京东的接口。。。。
  6. 心电信号质量评估——ecg_qc工具包介绍(二)
  7. Labelme对图像标注、json转化png格式
  8. Flash player 必要的系统组件未能正常运行,请修复Adobe Flash Player
  9. xxxx-xx-xx系统应用(周)巡检报告模版
  10. no jdk specified