从零开始搭建一台深度学习服务器及环境配置

  • 服务器硬件 2019.12.12
    • 系统安装
    • 环境配置--现有最新版本

服务器硬件 2019.12.12

实验室需求,我找的配置,反正不用我花钱独享一台服务器
受到货后不太满意的是超微主板

CPU E5-2678 v3
主板 超微X10DAI
GPU 耕升RTX2080Ti
内存 32G
硬盘 4T
SSD 256G
电源 850W

系统安装

windows10 ,由于是实验室项目的服务器,有共用需求所以选择了双系统

  1. 我先安装了windows再安装ubuntu
    windows的安装很简单
    /home目录要足够大,用于存放用户数据
    ubuntu18.04LTS ,有以下几点注意事项
  2. 深度学习数据量比较大,会占用很大的空间
    /根目录必须要大,各种环境安装的空间占用会消耗大量空间
    /home目录要足够大,用于存放用户数据
    我不做很多的分区处理,只分出四个主要分区,这样其他分区系统可以自己根据需求调整
    之前我在自己电脑交换空间和根目录不够用还要后期扩容搞得很麻烦。
根目录(相当于windows的C盘) 128G
efi分区 500M
swap交换空间 32G
edi分区 500M
/home分区 3T

环境配置–现有最新版本

  • 确定自己的硬件型号:
  • 系统:ubuntu18.04LTS
    GPU:RTX2080ti

一. 安装NVIDIA驱动

  1. 禁用nouveau,安装NVIDIA需要把系统自带的驱动禁用:
  • 打开文件sudo gedit /etc/modprobe.d/blacklist.conf
  • 在末尾添加
    blacklist nouveau
    option nouveau modeset=0
  • 保存文件并关闭
  • 执行生效命令:sudo update-initramfs -u
  • 重启电脑:sudo reboot
  • 检查是否禁用成功:
    lsmod | grep nouveau如果没有输出代表禁用成功

2.查看支持的NVIDIA驱动版本

  • sudo ubuntu-drivers devices
    我的显卡硬件是RTX2080ti,可以看到支持的驱动版本为430/435,推荐版本为435
    3.安装NVIDIA驱动
  • 自动安装(推荐版本)这是我比较后最为方便的安装方法
    sudo ubuntu-drivers autoinstall
  • 进度完成后查看是否安装成功
    nvidia-smi出现以下结果表示驱动安装成功

二. 安装cuda