如何给自己搭建一台深度学习工作站?

这个是很多刚准备入门的同学疑问,那么我们今天就来讲解下如何搭建。

有多种典型配置,一个 GPU 的机器、两个或四个 GPU的机器。如果您需要更多GPU,请考虑配置两台具有四个GPU的计算机。

如果您想要一台同时具有6~8个GPU的机器,您需要联系特殊供应商进行配置,并拥有专业的计算机房来存储。

CPU

由于AMD和Intel最近经常更新CPU,因此最好选择新的CPU。

CPU和GPU的关系

CPU瓶颈并不大。通常,GPU对应于2~4个CPU核心。例如,单卡机器购买四核CPU,四卡机器购买10核CPU。

在训练时,只要数据生成器(DataLoader)比GPU快,CPU就不会成为瓶颈,也不会减慢训练速度。

PCI-E支持

除核心数量外,还需要注意PCI-E支持。通用显卡是PCI-E 3.0 x16。例如,i9-9820X的PCI-E通道数为44.如果配置了四个卡,则只能支持1x16 + 3x8 + 1x4。也就是说,单卡全速,三卡半速,一个NVMe固态硬盘。在这种情况下,请考虑选择带有PLX桥接芯片的主板。

AMD的2990WX拥有64个PCI-Es,但仅支持x16 / x8 / x16 / x8四卡配置

看看英特尔的CPU

双卡机选择i9-9900K,四卡机根据预算选择X系列的CPU。

主板需要注意的事项:

CPU接口是否正确,例如LGA2066和SocketTR4?

例如,PCI-E插槽的高度是否足以插入图形卡,PCI-E插孔之间的距离必须至少满足双插槽宽图形卡的高度。

PCI-E还可以支持多张卡同时运行的速度。例如,1x16 + 3x8是常见配置。

了解主板各项参数:

GIGABYTE X299 AORUS MASTER(转1.0)采用4组2槽间距显卡插槽设计,支持1x16,2x16,2x16 + 1x8,1x16 + 3x8四种配置(需要十个以上核心CPU),请参考手册 在这里安装。安装在不同位置的显卡速度不同:

GIGABYTE X299 AORUS MASTER (rev. 1.0)

GIGABYTE X299 AORUS MASTER manual

带有桥接芯片的主板

一些主板,例如WS X299 SAGE,有一个PLX桥接芯片,当CPU没有足够的PCI-E时可以实现四卡x16速度:

WS X299 SAGE

在多卡并行训练的情况下,PCI-E的传输速度决定了梯度同步的速度。如果您正在培训大型模型并想要构建多卡机器,建议选择支持四个PCI-E x16的主板。

显卡

训练需要FP32和FP16的性能,推断INT8的性能。训练大型模型需要注意内存的大小。

考虑购买RTX 2080Ti的成本,您可以为高性能和高成本购买TITAN RTX,为本地客户购买Tesla V100。

RTX 2080内存很小,不推荐使用。GTX1080Ti已经出了很长时间,在线都是用过的卡,不推荐。

涡轮和风扇

购买显卡时,一定要注意涡轮增压版,不要购买两三个风扇版本,除非你打算购买一张显卡。

由于涡轮风扇的热量吹到外壳外面,它可以很好地带走热量,散热效果更好。如果您购买三个风扇的版本,当您插入多卡时,上面的卡会将热量吹到第二张卡,导致第二张卡的温度过高,这将影响性能。

风扇图形卡很可能超过双插槽宽度,第二张卡可能不会插入第二个PCI-E插槽。这也需要注意。

服务器推断卡

除了用于训练,还有一类卡是用于推断的(只预测,不训练),如:

这些卡都没有风扇,但它们也需要消散。它们需要由服务器的强大风扇被动地消散,因此它们只能在专门设计的服务器上运行。有关详细信息,请参阅NVIDIA官方网站的说明。

价格/性能选择应该是特斯拉T4,但是完整性能需要使用TensorRT深度优化,还有很多坑,例如当您的网络使用不受支持的运营商时,您需要自己实施。

NVIDIA仅允许此类卡在服务器上运行,例如GTX 1080Ti和RTX 2080Ti,这些卡无法在数据中心中使用。

硬盘类型

有三种常见的硬盘接口:

SATA3.0,速度600MB / s

SAS,速度1200MB / s

PCIE 3.0 x4(NVMe),速度3.94GB / s

4K随机读写队列深度为32

SATA3机械硬盘没有很好的数据源,因此数据是经验性的

SATA3固态硬盘数据源:三星(SAMSUNG)1TB SSD固态硬盘SATA3.0接口860 EVO

NVMe SSD数据源:英特尔(Intel)1TB SSD固态硬盘M.2接口(NVMe协议)760P系统

面对大量的小文件,使用NVMe硬盘可以在一分钟内扫描1000万个文件。如果您使用普通硬盘,则需要一天时间。为了挽救生命并简化代码,建议为SSD选择NVMe协议。

如果您的主板不够新并且您没有NVMe插槽,则可以使用M.2转接卡将M.2接口转换为PCI-E接口。

M.2 转接卡

内存

内存容量的选择通常大于内存,例如具有16GB内存的单卡和具有64GB内存的四张卡。因为有一个数据生成器(DataLoader),数据不必完全加载到内存中,通常不会成为瓶颈。

电源

首先计算功率之和,如单卡CPU 100W,显卡250W,再加上其他约400W,再购买650W功率。

最好为双卡购买1000W以上的电源。最好为四张卡购买1600W电源。我测量了1500W电源的四卡机器。运行所有卡后,由于电量不足,它会自动关闭。

通常,墙壁插座仅支持220V 10A,即2200W AC。由于电源需要将交流电转换为直流电,因此会有一些损耗,高达1600W。因此,如果您想支持八张卡,最好不要在家中试用。八卡通常是双电源,需要专用PDU插座,并使用16A插孔,如果在家中使用,则不能插入墙上插座。

网卡

通常,主板配有千兆网卡。如果您需要设置多机多卡集群,请联系供应商以获得专业解决方案。

机壳

如果你有单卡,你可以直接购买普通机箱,注意显卡的长度可以放下。

Air 540机箱

显示器

安装系统后,深度学习工作站不需要显示。使用系统时,请使用手边的显示器。

键盘和鼠标

安装系统后,深度学习工作站不需要键盘和鼠标。安装系统时,请使用手边的键盘和鼠标。

以上就是推荐给自己搭建一台深度学习工作站,我们也可以看看其他网友的配置如下图:

一路GPU

两路GPU

四路GPU

希望对大家有所帮助。

更多论文源码关注微信公众号:“图像算法”或者微信搜索账号imalg_cn关注公众号

如何搭建一台深度学习的电脑工作站相关推荐

  1. 从零开始搭建一台深度学习服务器及环境配置

    从零开始搭建一台深度学习服务器及环境配置 服务器硬件 2019.12.12 系统安装 环境配置--现有最新版本 服务器硬件 2019.12.12 实验室需求,我找的配置,反正不用我花钱独享一台服务器 ...

  2. 如何搭建一台深度学习服务器

    在计算机时代的早期,一名极客的满足感很大程度上来源于能DIY一台机器.到了深度学习的时代,前面那句话仍然是对的. 缘起 在2013年,MIT科技评论将深度学习列为当年十大科技突破之首.其原因在于,模型 ...

  3. 本穷鬼攒的一台用于深度学习用电脑

    本人穷困潦倒,屋子小,钱少. 最近在闲鱼上攒了一台深度学习用的电脑.全部二手,一共花了10400. CPU,9700k.  9700我估计应该也没问题. 板子 z390p.  这个板子给i7的cpu超 ...

  4. 学python买什么电脑好用又实惠_用不到1000美元攒一台深度学习用的电脑:一次深度学习和便宜硬件的探奇!...

    编者按:本文来自微信公众号"OReillyData"(ID:OReillyData),作者Lukas Biewald,36氪经授权发布. 是的,你可以在一个39美元的树莓派板子上运 ...

  5. 用不到1000美元攒一台深度学习用的超快的电脑:继续深度学习和便宜硬件的探奇!

    编者注:想了解与此主题相关的更多内容,请查看即将在2017年3月13-16日在圣何塞举行的Strata+Hadoop世界大会上的深度学习主题日程. 是的,你可以在一个39美元的树莓派板子上运行Tens ...

  6. 用不到1000美元攒一台深度学习用的超快的电脑:继续深度学习和便宜硬件的探奇!...

    是的,你可以在一个39美元的树莓派板子上运行TensorFlow,你也可以在用一个装配了GPU的亚马逊EC2的节点上跑TensorFlow,价格是每小时1美元.是的,这些选择可能比你自己攒一台机器要更 ...

  7. 如何配置一台深度学习主机?

    作为一个深度学习的初学者,你可能会遇到这样的问题:"我该如何训练我自己或者别人的Model?""我该如何配置一台合适的主机?""目前有哪几种训练模型的 ...

  8. 自行装配适合深度学习的电脑

    原文链接:https://www.oreilly.com.cn/ideas/?p=903 是的,你可以在一个39美元的树莓派板子上运行TensorFlow,你也可以在用一个装配了GPU的亚马逊EC2的 ...

  9. 在Win10游戏本中搭建MindSpore-GPU的深度学习环境

    在Win10游戏本中搭建MindSpore-GPU的深度学习环境 背景 一."金字塔"项目目标 二.系统环境 三.避大坑 四.安装过程 1.加入Windows Insider计划 ...

最新文章

  1. IT项目管理总结:第十章 项目沟通管理
  2. boost::type_index模块constexpr相关的测试程序
  3. 对于scanf的使用一点体会心得
  4. 生成word_用Word生成员工信息表,单独生成独立文件,还能自动命名
  5. 安装VMware时,出现 安装程序无法继续 Microsoft Runtime DLL 安装程序未能完成安装 您无权输入许可证密钥,请使用系统管理员账户重试 VMware15.5.x 安装问题处理
  6. 简易鼠标模拟器 python
  7. 嵌入式面试—项目篇(二)全国大学生智能汽车竞赛(团队项目)
  8. 古风排版 分数 20作者 陈越单位 浙江大学
  9. access里面的表达式运用_表达式的示例
  10. diskpart(diskpart转换GPT)
  11. 四色定理已利用计算机证明,地图四色定理的非计算机证明.pdf
  12. 一回生,二回熟,三回巧
  13. 极客日报:小米计划3年内成为全球第一;谷歌计划在韩国开放第三方支付;Firefox 94发布
  14. [重构]1.关于提炼方法,变量,类
  15. 区别:秒s、毫秒ms、微秒μs、纳秒ns、皮秒ps、飞秒fs每两级之间的换算以及之间的关系
  16. AIR2 Betal版可以下载了flash player10.1可以下载了
  17. Linux查hudi服务的进程,Linux查看非root运行的进程
  18. 模仿qq空间评论以及回复
  19. 使用AWS 管理控制台和 AWS CLI创建EKS集群
  20. ubuntu下如何控制风扇速度?

热门文章

  1. WineBottler:让苹果Mac OS照样用IE浏览器
  2. 377. 组合总和 Ⅳ(JavaScript,动规)
  3. 微信浏览器 MP4播放失败,安卓下微信浏览器不能播放MP4问题的解决,gzip捣的鬼
  4. 原生js实现无缝滚动
  5. java学籍管理信息系统模板_java学籍管理系统051
  6. 荣耀magic3会用鸿蒙,荣耀magic3怎么样-荣耀magic3配置分析
  7. springboot整合阿里云对象存储oss
  8. 拒绝访问html,IE拒绝访问如何解决?IE拒绝访问的原因及解决方法
  9. Raspberry PI 编译WLan驱动模块, 并配置登录WIFI
  10. VxWorks操作系统shell命令与调试方法总结