文章目录

  • DELL Precision T7920加装显卡
  • 服务器原有配置介绍
  • 选购过程
    • 确认型号
    • 确认PCIE x16插槽
    • 确认电源功率和电源线
  • 安装过程
    • 电源模组线不够多
    • 单装一个3090
      • 显卡尺寸问题
    • 加装上1080Ti
      • 非常重要!官方文档
    • 开机检测(待解决)
  • 软件配置
    • 驱动安装
    • CUDA安装
    • cuDNN
  • 运行环境配置
  • 使用体验
    • 使用时的问题

DELL Precision T7920加装显卡

实验室由于显卡计算能力不够,以及显卡显存不够,请老师花了大价钱购入了两张GeForce 3090显卡。老师赛高!记录一下这次加装显卡过程中学到的一些知识。

服务器原有配置介绍

服务器原有一张1080Ti显卡,一个Xeon CPU。

选购过程

确认型号

其实选购过程非常简单,可以说是整个流程中最简单的一步了。首先确认需求,我们希望购买一张显存大一些的卡。接着,我们选择了一些候选方案,比如GeForce 3090,GeForce 2080Ti,Tesla P40等。查阅了有关资料之后,发现专业卡由于散热问题不适合放在塔式服务器中,所以打算购置GeForce 3090。京东查询价格在两万出头。

确认PCIE x16插槽

另外,需要先拆开机箱查看PCIE x16的槽数是否满足。3090需要占用3个槽位,1080Ti需要占用2个槽位。初步研究符合要求。

确认电源功率和电源线

一定要确认电源功率大于CPU+GPU的总功率!!!!

否则主板就爆炸了,带不起来。

安装过程

安装过程中碰到了非常多的问题。以下一一列举。

电源模组线不够多

1080Ti+3090共需要4根模组线。主板上预留了四个口,但是只有三根原装模组线。在询问了各种淘宝京东商家之后,由于他们都无法辨认DELL品牌机的电源型号,从而购线失败。不得已求问戴尔售后,戴尔售后太墨迹了。和技术售后扯皮了半个多小时,其中有80%的时间都在等待状态。最后,他说,可能有6pin转双8pin的模组线。我们说,可以!有就行了…

为了尽早装上试用3090,我们把另一台同样配置服务器上闲置的模组线先拆到本机器上。

单装一个3090

我们把1080Ti拆了下来,在原位置插上3090,进入系统后发现能够看到该显卡,并且显示正常。

显卡尺寸问题

这里一定要注意显卡的尺寸问题,有可能卡的高度太高,导致盖板盖不上;有可能卡的长度太长,导致无法放入机箱中。

如果不是品牌机,是自己的组装机的话,这个问题没有那么严重,直接不装盖板就完事儿了。

但是DELL如果不装盖板的话会报警,直接断电,无法开机。

在研究了它的报警机制之后,我们发现其报警按钮在上侧。因此,只要盖板上侧插入了机箱,就可以避免报警问题。盖板下侧敞开还能增加一些散热hhh。

加装上1080Ti

我们在机箱另一侧(上图中右侧)的PCIE x16槽中装上了1080Ti,再次开机。结果依然只显示一条。为了确定到底是什么问题,我更换了相邻的插槽,拆除了3090,都无法读取到1080Ti这张卡。因此,我怀疑是机箱另一侧的PCIE x16插槽有问题。

非常重要!官方文档

在这时,我灵机一动想到了之前下载过的本机型DELL用户手册。在戴尔产品支持页面输入机箱上的型号或者服务编号进行查询。在用户手册中,有介绍主板的情况。由于我们的服务器是双通道GPU,在机箱另一侧的两根PCIE x16插槽只有在第二块CPU插入的时候才能使用。

于是我们只能在左侧的几个PCIE x16插槽上做文章。左侧刚好有4个插槽,五个插槽的宽度。但是由于最左侧有两个插头插着,因此放不下1080Ti。也是查阅用户手册后发现,这两个插头一个是前面板USB,一个是光驱,对我们来说都没有什么用处,果断拔掉。这样空出来之后,1080Ti刚刚好就能勉强插入。

开机检测(待解决)

由于拔掉了两个接口,在开机的时候DELL会报错,显示front I/O未接好。思考是否能够通过BIOS设置关闭开机检测,尚未成功。但是由于服务器平时也不会关机,因此开机检测不会造成太大的麻烦。

软件配置

这部分比较简单,也是上次配置服务器的时候做过的,简单描述一下。

驱动安装

前往GeForce驱动下载页面下载驱动。3090和1080Ti可以使用同一版本的驱动。

驱动安装过程参考博客中第二种方法。在安装前执行sudo /usr/bin/nvidia-uninstall来卸载之前版本的驱动。

由于3090显卡过新,通过ubuntu-drivers devices命令无法查询到3090相关信息,无需担忧,直接安装驱动即可。

如果想看3090是否成功接通,可以通过lspci | grep VGA命令来查看系统已有的显卡,其中,3090不会显示版本号,只会显示是Nvidia Corporation

CUDA安装

首先查询CUDA适配版本,官方文档在这里。需要注意的是,CUDA只需要和驱动版本匹配就可以,不是和显卡型号进行匹配。因此,所有的卡都可以用新的CUDA,只要驱动版本支持。

需要注意的是3090由于驱动版本限制,只能安装11.x的CUDA版本。同时,pytorch官方下载显示的最新1.8版本支持CUDA11.1。因此,我们选用了CUDA11.1进行下载安装。

cuDNN

cuDNN需要和CUDA版本匹配,具体安装方法见博客,重点在复制文件部分。

运行环境配置

最后就是conda环境配置了,如上文所述,需要对pytorch等进行更新。

pytorch官方的安装命令是
conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c nvidia

而且官方还有一句NOTE: 'nvidia' channel is required for cudatoolkit 11.1

但是可能由于是我的网络问题,一直连不上nvidia,就下不了cudatoolkit。不过我觉得既然我之前都已经配置过NVIDIA官方CUDA了,应该就不需要最后的-c nvidia了吧。于是果断删掉。也顺利安装成功。

剩下的别的包就都很简单了,不再赘述。

使用体验

原本配置好的环境只能在1080Ti上运行。在3090上运行虽然不会报错,但是实际上会卡住,动不了。

在针对3090配置的环境中,可以在两张卡上同时运行。

在运行程序的时候可能需要指定GPU。

使用时的问题

我们发现nvidia-smi和pytorch中显示的GPU顺序不一样。解决该问题的方法见博客。

不建议使用nvcc -V命令。因为它给出的cuda版本和实际安装的版本不同。

不同conda虚拟环境使用不同cuda版本的方法,见博客。

cuda软链接相关博客。

pytorch指定GPU的方法,见博客。

DELL Precision T7920加装显卡遇到的坑相关推荐

  1. 戴尔Precision M6800加装西部数据NVMESSD-SN52固态硬盘 装4G模块

    戴尔Precision M6800加装西部数据NVMESSD-SN52固态硬盘 装4G模块 戴尔Precision M6800延续了戴尔笔记本主板风格,有2个minipcie,如图,上侧的minipc ...

  2. dell 7559 2548B加装固态硬盘安装完系统进不了OS

    此电脑我与16年3月份购入,出厂时为WIN10 OS.开机进入OS后硬盘占用率为100%,操作响应特别迟钝,需要等待4~5分钟才可以正常使用.无奈想加装一条固态硬盘,该电脑为光驱位,拆机后电脑背部左边 ...

  3. Dell inspiron 5488加装硬盘SSD

    机械盘真心便宜, 当数据盘很合适. ---- 我是装双系统, 希望速度快! 我就装了一个SSD, STAT接口的, 和机械盘盒一样尺寸, 接口都是SATA, 我买的三星860EVO, 500G,519 ...

  4. Dell precision 7720 移动工作站 nvidia 显卡安装说明

    1, 安装centos 7.3 系统,建议全量安装,本安装教程在全量安装版本上进行 2, 下载对应系统版本的英伟达驱动程序 3, 屏蔽系统自带的nouveau 3.1:service gdm stop ...

  5. 服务器怎么增加独立显卡,dellr610服务器增加独立显卡(dell服务器装显卡)

    不知道能不能加独立显卡?恳请各位大侠帮忙. 首先需要确认阵列卡的型号新加的硬盘可以插入现有的空余槽位(但是这时的硬盘是. 安装dell管理软件一种是重启服务器进入阵列卡配置界面我推存后者进入阵列卡配置 ...

  6. Dell precision3530 拆机加装内存条全流程(有图)

    原由 原运行内存8G,运行虚拟机的时候,内存不足:因此准备加装一个8G内存条,使得总运行内存到16G 内存条购置 原机内存条为海力士的DDR4 2666MHz频率款,我在京东也下单了三星的DDR4 2 ...

  7. dell加装固态硬盘_技术丨如何进行笔记本硬盘拆装?

    遇到笔记本存储空间不足或是对读写速度不满时,很多人会选择对硬盘进行升级,尤其是加装固态硬盘后,启动速度会变得更快,使用体验也会获得极大提升. 本期视频将指导大家如何进行笔记本的硬盘拆装操作,一起来看看 ...

  8. dell加装固态硬盘_SSD固态硬盘安装操作系统方法

    一.准备工作 固态硬盘的安装方法和机械硬盘一样,也是分为供电接口和数据接口(现在新电脑都是SATA接口).如果是在笔记本上加装,可以安装在光驱位置.如果是机械硬盘替换可以直接接口对应替换,台式机直接把 ...

  9. 1u服务器支持的显卡体积,1u服务器加独立显卡(1u服务器装显卡)

    你要确定你1U服务器上的主板是否有显卡接口,就算安装了也需要安装驱动的. 问下 自己购买1U机箱自己买配件能装1U服务器吗?服务器需要装显卡吗? 服务器不需要独立显卡的.服务器主要是作为网站存贮数据来 ...

最新文章

  1. Python3.8.5最新版安装教程(含老版本卸载教程)
  2. 如何构建基于移动相机的AR系统
  3. python批量导入MongoDB数据库
  4. GPIO8种方式小总结
  5. Linux操作系统六大优点
  6. Cocos2d-JS项目之UI界面的优化
  7. python每周小测验答案_python第一周小测验答案Centos下更新Python版本
  8. 湖南工程学院+c语言程序设计人事档案管理系统,程序设计人事档案管理系统.doc...
  9. grub shell 错误_各种情况GRUB损坏进不了系统的解决方案
  10. android file isdirectory,android – 为什么我不能在Environment.DIRECTORY_PICTURES中创建一个目录?...
  11. vue在html中写style,vue开发之style(六)(CSS页面布局之样式、背景、文字)
  12. pytorch相关用法
  13. 火山PC表格及Excel的导入导出案例
  14. pcsx2 linux双显卡,PC模拟PS2游戏模拟器PCSX2使用教程
  15. Python 的RS485 串口通讯
  16. html输入框位置控制,JS 控制input 输入框光标位置
  17. 分享 | 智慧水务建设方案
  18. css鼠标经过按钮变色6,像这种鼠标移过去会变色的按钮怎么做的
  19. 计算机的利弊四级作文,2016年6月英语四级作文范文:网络的利弊
  20. Win10更新、重装后 触摸板无法关闭

热门文章

  1. 转:创业公司如何公平分配股权?
  2. VuePress超详细简单教程
  3. 电脑无限重启 服务器,Windows10系统开机提示无法连接到sens服务无限重启如何解决...
  4. 计算机企业人员的职称有哪些,企业IT人员评职称需要什么资质
  5. Python自动化办公:将文本文档内容批量分类导入Excel表格
  6. 深入浅出MySQL JSON数据类型
  7. JSONObject对象常用方法讲解--fromObject和toBean
  8. 文件练习题(c语言)
  9. 埃里克贝里奇_【双语分享】为什么科技需要人文学科?
  10. WLAN用户接入流程(转)