本地环境:

Dell PowerEdge R720 2680v2 *2 ddr3 1333MHz 32G

ESXi 6.5 U2 Dell定制版

CentOS 7虚拟机 WIn10 虚拟机

K80显卡

同时还插着AMD显卡

安装驱动前的必备操作:

参考博客:

https://blog.51cto.com/5001660/2483307

按照这个设置, 能完成一大半的操作

但是还有些必备操作, 否则虚拟机开机会出问题

以下全部是我遇到的问题

  1. 虚拟机加载到42%, 然后报打开模块DevicePowerOn电源失败, 导致虚拟机无法开机

    解决方法是参考这个:

    VMware 官方kb:

    https://kb.vmware.com/s/article/2142307

    其他博客中也有提到这个方法:

    https://blog.csdn.net/u012149181/article/details/112345831

    这里直接在虚拟机的高级编辑参数里添加, 无需使用ssh连接

  2. 进虚拟机安装驱动卡住, 或无法成功安装驱动

    具体的表现为, win10中安装驱动读条的时候卡住不动, 设备管理器显示没有为该设备安装的驱动, 之后无法关机, 强制关机后无法开机

    Linux系统(ubuntu / CentOS)能安装完成驱动, 但是nvidia-smi无法找到设备, 也就是驱动安装未成功

    问题原因:

    虚拟机系统的引导方式必须是UEFI

    由于ESXi系统默认的虚拟机引导方式是BIOS, 在没有修改系统引导方式的前提下安装系统就是BIOS引导方式

    这个是导致后续新虚拟机无法安装驱动的原因

    之后创建的3个虚拟机(win10 , Ubuntu, CentOS) 均无法安装驱动(驱动安装失败)就是这个原因导致的

    解决方案

    将虚拟机系统的引导方式修改成UEFI, 非重装系统的方法比较复杂, 这里具体操作不细谈了, 我直接重装了win10和CentOS虚拟机

    之后就能正常安装驱动了

  3. 成功安装驱动后的虚拟机在直通显卡后无法开机

    我也不知道之前系统设置有问题的情况下是怎么成功安装驱动的

    具体表现为, 直通显卡后打开虚拟机电源, 连vmware开机画面都不会出现, 虚拟控制台一直在转圈圈

    解决方案

    需要进入主板BIOS打开SR-IOV以及其他相关的虚拟化选项

    详细可参考这里:

    https://communities.vmware.com/t5/ESXi-Discussions/NVIDIA-Tesla-K80-Pass-Through/m-p/2731719

    由于本人使用的是Dell R720服务器, BIOS中并没有找到ASPM选项, 所以仅仅打开了SR-IOV

    打开之后重启系统, 之后已经成功安装驱动的虚拟机就能成功开机了

  4. CentOS安装最后一步报错, 提示:

    Error:Unable to load the 'nvidia-drm' kernel module .
    

    这个是由于系统采用UEFI引导后, 却打开了Security BOOT选项

    这个选项在Win10中是没问题的, 我在打开Security BOOT之后仍能正常安装驱动, 但在CentOS中国遇到了问题

    解决方案

    需要在虚拟机引导方式中将安全引导关闭, 直接进入虚拟机BIOS中是没有这个设置选项的

  5. Unable to determine the device handle for GPU 0000:0B:00.0: Unknown Error

    CentOS中安装驱动完成, 使用nvidia-smi出现这个

    解决方案:

    虚拟机参数中添加老生常谈的hypervisor.cpuid.v0="FALSE"

    不需要进SSH修改vmx文件, 直接在虚拟机高级参数中添加一个这个就行:

    然后注意, 要重启物理机, 单单重启虚拟机无法解决问题

    重启之后, nvidia-smi就能正常显示了

win10安装驱动:

这个相比于上头的疑难杂症, 就简单的很了

直接到官网下载相应的驱动, 安装就对了, 都是图形化界面, 简单易懂

官网驱动下载地址:

https://www.nvidia.cn/Download/index.aspx?lang=cn

CentOS安装驱动:

先准备一个官网下载的驱动:

https://www.nvidia.cn/Download/index.aspx?lang=cn

这玩意的具体操作网上很多, 但有些不完整, 我多方整合汇总了一下

参考博客:

https://blog.csdn.net/tony_vip/article/details/104531383

系统切换到命令行模式:

  1. 查看当前模式:

    systemctl get-default
    

    如果是graphical.targe, 则是图形界面模式

  2. 设置为命令行模式:

    systemctl set-default multi-user.target
    
  3. 设置为图形界面模式:

    systemctl set-default graphical.target
    

设置模式之后需要重启

安装基础依赖环境

yum -y install gcc kernel-devel kernel-headers

查看内核和源码版本是否一致:

查看内核版本:

[root@localhost 10:37:03 src]# ls /boot | grep vmlinu #内核版本
vmlinuz-0-rescue-628d97dc7b994787ae886db591ab8146
vmlinuz-3.10.0-957.el7.x86_64

查看源码包版本

[root@localhost 10:37:41 src]# rpm -aq |grep kernel-devel
kernel-devel-3.10.0-1062.12.1.el7.x86_64

这里我遇到的问题是:

/usr/src/kernels目录为空

参考博客:

https://blog.csdn.net/qq_43479432/article/details/104742566

Linux系统中默认不安装内核源码, 需要的话得手动安装:

运行下头的命令即可:

yum install kernel-devel-内核版本 -y

有几个内核src可选:

安装完成之后在/usr/src/kernels下既有内核src文件了:

屏蔽自带的nouveau驱动:

这里与ubuntu有些许类似:

  1. 查看nouveau是否运行:

    lsmod | grep nouveau
    

    可以看到nouveau正在运行

    安装显卡驱动的时候就需要禁用

  2. /etc/modprobe.d/blacklist.conf 添加:blacklist nouveau

    这一步和ubuntu相似

    vim /usr/lib/modprobe.d/dist-blacklist.conf
    # 或
    vim /lib/modprobe.d/dist-blacklist.conf
    

    在最后加上:

    blacklist nouveau
    options nouveau modeset=0
    
  3. 备份原来的 initramfs nouveau image镜像

    mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r)-nouveau.img
    
  4. 创建新的 initramfs image镜像

    dracut /boot/initramfs-$(uname -r).img  $(uname -r)
    

    此操作会进行压缩, 响应较久

  5. 完成之后重启机器, 再次检测nouveau驱动

    lsmod | grep nouveau
    

    可以看到此时nouveau已经被禁用:

重建 initramfs image 步骤

[root@localhost 10:37:41 src]# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
[root@localhost 10:37:41 src]# dracut /boot/initramfs-$(uname -r).img $(uname -r)

驱动安装:

进入到驱动所在目录, 执行安装命令;

# cd /to/your/directory/ ; 跳转到驱动所在的目录
# ./驱动文件名称 --kernel-source-path=你的内核源代码路径  -k $(uname -r)

例:

# ./NVIDIA-Linux-x86_64-384.81.run --kernel-source-path=/usr/src/kernels/3.10.0-693.5.2.el7.x86_64  -k $(uname -r)

注意, 这里后头带的一大串参数必须要, 其必须制定内核源代码路径, 不然驱动无法正常安装

许可证 -accept



安装 32 位兼容库 -yes

安装速度很快

安装顺利完成

检查驱动安装情况:

直接上:

nvidia-smi

正常情况下会出现显卡信息:

$ nvidia-smi
Tue Apr 27 19:27:37 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.32.03    Driver Version: 460.32.03    CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla K80           Off  | 00000000:04:00.0 Off |                    0 |
| N/A   49C    P0    74W / 149W |      0MiB / 11441MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   1  Tesla K80           Off  | 00000000:1B:00.0 Off |                    0 |
| N/A   66C    P0    61W / 149W |      0MiB / 11441MiB |     98%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

如果没有成功显示, 则可以往上头看看是否和我遇到了相同的报错

其他的报错百度解决方案也挺多, 我就爱莫能助了

ESXi 6.5 虚拟机直通K80显卡并安装NVIDIA显卡驱动:相关推荐

  1. 询问:虚拟机中能不能安装NVIDIA显卡驱动

    这两天尝试了多次在虚拟机中安装NVIDIA显卡都不成,想询问一下各位大神 "虚拟机中能安装NVIDIA显卡吗" "怎么安装"

  2. Linux 桌面玩家指南:11. 在同一个硬盘上安装多个 Linux 发行版以及为 Linux 安装 Nvidia 显卡驱动...

    Linux 桌面玩家指南:11. 在同一个硬盘上安装多个 Linux 发行版以及为 Linux 安装 Nvidia 显卡驱动 原文:Linux 桌面玩家指南:11. 在同一个硬盘上安装多个 Linux ...

  3. linux安装cuda需要先安装NVIDIA显卡驱动

    CentOS7.3安装NVIDIA-1080ti驱动.cuda.cudnn.TensorFlow - 负赑屃 - 博客园 使用这个教程 学习语音之家付费教程踩坑实录 在虚拟机安装NVIDIA显卡驱动失 ...

  4. CentOS7(64位)安装NVIDIA显卡驱动和CUDA8.0

    硬件环境: 显卡驱动下载:http://www.geforce.cn/drivers点击打开链接 CUDA下载:https://developer.nvidia.com/cuda-downloads点 ...

  5. linux18.04安装显卡驱动,详细介绍ubuntu18.04安装NVIDIA显卡驱动(亲测有效!)

    详细介绍ubuntu18.04安装NVIDIA显卡驱动(亲测有效!) 详细介绍ubuntu18.04安装NVIDIA显卡驱动(亲测有效!) 详细介绍ubuntu18.04安装NVIDIA显卡驱动(亲测 ...

  6. Fedora 17安装NVIDIA显卡驱动

    最近自己的笔记本安装了Fedora 17,一直想玩3D桌面,但是3D桌面又要安装显卡驱动,结果就卡在这儿了,从网上找了一篇文章,写的不错!在此分享一下 原文地址:http://www.if-not-t ...

  7. Ubuntu16.04安装NVIDIA显卡(RTX20系列)驱动+CUDA10.0+cudnn+Pytorch1.1.0

    Ubuntu16.04,GPU: Geforce RTX 2070-Super(本博客是显卡驱动和cuda分开安装的教程). 1. Ubuntu16.04安装NVIDIA显卡驱动 1. 下载显卡驱动. ...

  8. Fedora安装Nvidia显卡驱动方法

    初学Fedora,某天在系统设置那里发现有个Desktop Effects,点击打开提示我没有开启3D加速,查查发现原来我没有装Nvidia的驱动,上网查相关资料,发现安装教程的版本有5.6篇,经过1 ...

  9. ubuntu 16.04安装nVidia显卡驱动和cuda/cudnn踩坑过程

    推荐新版安装教程 http://blog.csdn.net/chenhaifeng2016/article/details/78874883 安装深度学习框架需要使用cuda/cudnn(GPU)来加 ...

最新文章

  1. Win7下使用Putty代替超级终端通过COM串口连接开发板方法
  2. ASP.NET Ajax – History Support 續
  3. laydate兼容bootstrap
  4. PMcaff-干货| 产品经理应该了解的服务设计那些事儿
  5. No overload for 'OnStartup' matches delegate 'System.Windows.StartupEventHandler'
  6. web通讯录之登录注册界面
  7. 【Python3网络爬虫开发实战】3.4-抓取猫眼电影排行
  8. laravel 的用户认证
  9. cost of path 的计算
  10. 7台不同配置M1 MacBook Pro真实测试
  11. 可编译的java代码_有没有编译方法可以运行Java代码?
  12. 有一份好看的简历,面试都要加分,推荐好看的简历来这里下载
  13. 计算机文献检索的步骤实例,数据库检索方法与技巧(上)
  14. “霜降”,“农历”,“二十四节气”,英语怎么说?
  15. TCP非持久连接、持久性连接(流水线方式、非流水线方式)例题
  16. android studio连接雷电模拟器
  17. Virtualbox虚拟Ubuntu系统扩展磁盘分区
  18. macbook linux 双系统,MacOS+Ubuntu双系统,原来MacBook安装linux也简单!
  19. 解决 Costmap2DROS transform timeout.问题
  20. 2012网易校园招聘笔试试题

热门文章

  1. 机房PDU如何挑选?
  2. win7 架设网站服务器软件,win7架设服务器软件
  3. Kubernetes 11 (API访问控制、serviceaccount、useraccount、RBAC、PSP安全策略配置)
  4. python操作excel,将每行信息放在字典里,所有信息放在一个列表里
  5. 法律与人工智能调研与展望
  6. 英语知识点整理day20-谚语学习(K字母开头)
  7. Python面向对象—初识面向对象
  8. TCL爱奇艺电视TV+怎么安装第三方软件
  9. Python向文本中添加内容却被覆盖
  10. 采用计算机制作文书的,计算机基础之w音ord案例-制作求职简历【应用文书例稿】.ppt...