ESXI 6.7 环境 16.04虚拟机安装tesla k80 一切正常,但虚拟机重装了centos7.6后,驱动一直安装失败,报错如下:

换了多个驱动版本,问题依然存在。安装时指定 --no-kernel-module-source选项,仍然找不到显卡,不能和显卡通信。

后来解决方法如下      :

按常规设置新建虚拟机,添加PCI设备,如下图

坑1:无法打开虚拟机 CentOS 7 K80 的电源。内存设置无效: 内存预留 (sched.mem.min) 应该等于内存大小 (16384)。 单击此处了解更多详细信息。

解决方法:打勾☑️ 预留所有客户机内存(全部锁定)即可


坑2:无法打开虚拟机 CentOS 7 K80 的电源。模块“DevicePowerOn”打开电源失败。 单击此处了解更多详细信息。

这个问题折腾了我一阵子,有几个地方要改:

1、物理机 (Dell R710) BIOS 中启用大于4G的内存映射 (Memory Mapped IO >4GB),这里就不弄图了,搜一下吧!
    2、 编辑虚拟机 - 虚拟机选项 - 引导选项 - 固件 - EFI (默认为 BIOS),此处一定注意!!
    3、编辑虚拟机 - 虚拟机选项 - 高级 - 配置参数 - 编辑配置... -- 点2次左上角的 [添加参数],此时会在列表的尾部会出现 2 条显示为 “单击以编辑键” 条目,如图:

   4、 配置hypervisor.cpuid.v0健值为 FALSE
   5、 配置 pciPassthru.use64bitMMIO 健值为 TRUE
   6、配置 pciPassthru.64bitMMIOSizeGB 键值为 48 ,这里的数值需要用GPU内存进行计算,我大致理解为 直通GPU的内存乘以四,我的卡为 双路12G ,映射一路,12*4 = 48,所以这里我写了48,如果理解有误,请大家联系我更正。
   7、 以上配置参考来源于 https://octo.vmware.com/enable-compute-accelerators-vsphere-6-5-machine-learning-hpc-workloads/
   8、 配好后像这样

经过以上配置,成功配置Nvidia Tesla K80 的直通

下面开始安装 显卡驱动。

安装依赖库

    yum -y install gccyum -y install epel-releaseyum -y install --enablerepo=epel dkms

安装kernel-devel

    yum install kernel-develyum install kernel-headers

系统名

uname -r

对应版本

yum list | grep kernel-devel

检查nouveau驱动

lsmod | grep nouveau

禁用nouveau驱动

修改/usr/lib/modprobe.d/dist-blacklist.conf文件,加入一行并保存

    #nvidia driverblacklist nouveauoptions nouveau modeset=0

备份\重建原来的镜像文件

    mv     /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bakdracut /boot/initramfs-$(uname -r).img $(uname -r)

重启

安装NVIDIA驱动

    ./NVIDIA-Linux-x86_64-440.82.run --no-opengl-files --kernel-source-path=/usr/src/kernels/3.10.0-1160.2.2.el7.x86_64
  • 检查驱动情况
nvidia-smi

一切正常 !!!

安装cuda10.1
sudo ./cuda_10.1.105_418.39_linux.run
不要安装driver
打开主目录下的 .bashrc文件添加如下路径
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.1/lib64
export PATH=$PATH:/usr/local/cuda-10.1/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.1
source ~/.bashrc

安装cudnn7.6.5
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ 
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ 
sudo chmod a+r /usr/local/cuda/include/cudnn.h 
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
sudo ln -sf /usr/local/cuda-10.1/lib64/libcudnn.so.7.6.5 /usr/local/cuda-10.1/lib64/libcudnn.so.7

ESXI 6.7 环境 centos7.6 虚拟机安装tesla k80 显卡驱动失败问题解决相关推荐

  1. ubuntu14.04下的NVIDIA Tesla K80显卡驱动的安装教程

    搞深度学习如何能够不与浑身是"核"的显卡打交道呢? 人工智能的兴起除了数据量的大量提升,算法的不断改进,计算能力的逐步提高,还离不开软件基础设施的逐步完善.当下的主流的深度学习工具 ...

  2. 英伟达 Tesla K80显卡驱动安装

    文章目录 准备驱动安装文件 安装过程中的问题 安装成功 准备驱动安装文件 到英伟达官网下载驱动文件,根据自己显卡型号进行选择,下载文件名为 *.run的文件. 更改驱动安装文件的属性 chmod +x ...

  3. centos7安装1080显卡驱动常见问题解决方法

    centos7安装1080显卡驱动常见问题解决方法 1.安装显卡时,出现以下错误 ERROR: The Nouveau kernel driver is currently in use by you ...

  4. 银河麒麟/Ubuntu安装cuda和显卡驱动、cuDNN

    银河麒麟/Ubuntu安装cuda和显卡驱动 银河麒麟介绍 第一步:更换apt软件源(换过的忽略) 安装前的准备 确认安装环境 安装cuda以及显卡驱动 安装CUDNN 退出tty模式,完成安装 银河 ...

  5. Linux安装Ubuntu18.04/显卡驱动/CUDA11.4/cuDNN8.2

    Linux安装Ubuntu18.04/显卡驱动/CUDA11.4/cuDNN8.2踩坑记录: [准备工作] 在Ubuntu官网或者清华源软件镜像下载Unbuntu18.04的镜像文件:[为方便小伙伴们 ...

  6. 1080 linux驱动下载,CentOS 7安装NVIDIA GTX1080显卡驱动

    再 CentOS 7安装NVIDIA GTX1080显卡驱动,直接说安装步骤和遇到的问题: 一:首先当然是要把驱动下载下来啦.我的电脑是NVIDIA的,所以自然先要访问其官网:http://www.g ...

  7. win10下安装anaconda + NVIDIA显卡驱动 + pytorch_gpu

    1. anaconda 安装 去官网安装即可. 安装完毕后,我们可以修改 conda 的源: conda config --add channels https://mirrors.tuna.tsin ...

  8. 禁用Nouveau,安装Linux Nvidia 显卡驱动

    https://blog.csdn.net/misiter/article/details/7652731 干掉Nouveau安装Linux Nvidia显卡驱动 首先说明下什么是Nouveau,为什 ...

  9. 安装教程rtx2080ti_Ubuntu18.04.2下安装 RTX2080 Nvidia显卡驱动的方法

    不久前入手了蓝天P870TM1G准系统,配置如下: 1. Z370主板 2. i9-9900k桌面处理器 3. RTX2080移动版 由于显卡太新的缘故,安装Ubuntu16.04时,试了好多版本,只 ...

最新文章

  1. Linux Kernel TCP/IP Stack — L2 Layer — Traffic Control(流量控制)
  2. nested exception is java.lang.IllegalStateException: Context namespace element 'annotation-config' a
  3. Centos7安装go-1.9.2
  4. E: Unable to locate package libjasper-dev的解决办法(亲测可以解决)
  5. 服务器控件生命周期简介
  6. JavaWeb学习之路——SSM框架之Spring(六)
  7. OpenGL之正背面剔除、深度测试与多边形偏移
  8. 工业机器人打磨抛光编程员工资_一种工业机器人打磨抛光工作平台的制作方法...
  9. sql必知必会的数据初始化
  10. javaweb中服务器响应,Java Web服务器响应与JSON
  11. H3C SecPath F100-C 防火墙默认配置
  12. python解压缩tar.gz文件
  13. 研磨设计模式读书笔记
  14. 高效人士的7个好习惯,由内而外全面造就自己
  15. confusing uv
  16. 拒绝垃圾专业化学:选择正确的专业远比多考几分更重要 ——致全国高考考生和家长的一封信
  17. 利用validation对Java接口入参进行基础校验
  18. 正则表达式(二)常用正则表达式——验证身份证号码
  19. 块内拉升lisp_多重插入块的炸开问题? - AutoLISP/Visual LISP 编程技术 - CAD论坛 - 明经CAD社区 - Powered by Discuz!...
  20. QRCode使用(生成二维码)

热门文章

  1. 短语(直接短语、句柄)以及语法树
  2. GAMES101现代计算机图形学入门——几何表示之曲线与曲面
  3. sigmaster解码播放
  4. 手机屏分几种?什么叫水滴屏、刘海屏、瀑布屏、全面屏?
  5. 项目型公司 VS 产品型公司
  6. UVA - 1600 Patrol Robot (巡逻机器人)(bfs)
  7. CSP2022 初赛游记
  8. 2021-2027全球及中国PCR试管行业研究及十四五规划分析报告
  9. 香帅的北大金融学课笔记15 -- 大师投资智慧
  10. 将正确的ADC与应用程序匹配