由于UCSB是季度制,9月下旬才开学,于是不久前我决定亲自上阵给实验室的同学们配一台多显卡的深度学习服务器。​第一次配4块Titan X Pascal的台式机器,也没什么太多经验,结合网友们和朋友们的建议,我实验性的装了一下,最后也算一切顺利。不少同学找我要配置,我不是搞硬件的,只不过中间有些经验教训,跟大家分享一下。

我的配置:

GPU: 4 x Titan X Pascal GPU。之所以不选择1080是因为只有8GB的内存,可能深度学习在处理大数据集的时候有可能会遇到点瓶颈。之前Titan X Pascal一直断货,几周前官网开始偶尔有货,我请系里的秘书帮忙刷了一周,总算买了几块(一天只能买两块)。http://www.geforce.com/hardware/10series/titan-x-pascal

主板:Asus X99-e WS。这个是workstation版本的Asus X99,支持四块显卡,USB 3.1,很多的硬盘接口。支持Intel 59xx和6字头的i7处理器。不喜欢这块板子的也可以试试rampage v edition 10,或者rampage v extreme。可能也有便宜的板子支持4 GPU,不过你要特别关注PCIe 3.0插槽的数量和布局:一块显卡通常会占据2个口的位置。

CPU: 通常来说CPU在多核GPU的深度学习系统里还是比较重要的,因为要并行处理参数。我这次选用了网友推荐的i7 5930K,一共6核12线程,性价比还算凑合,跑起来也没什么太大问题。

内存:这个基本要看CPU能支持多少了,5930K貌似只可以支持64G,我就卖了两条Kington valueRAM DDR4 32G。当然省钱的做法是买8条8G的用。

存储:SSD还是比HDD快了不少,所以在这种情况下,我选择了2块Samsung 850 EVO 1TB的SSD内存。如果数据集太大,也可以考虑搞个4TB的HDD来存一下(10TB和8TB的还是有点贵)。

CPU冷却:我选了Corsair H60水冷。注意装的时候有两套4个螺丝钉,要选短的螺钉,短的装在板子上,另一端长的接在风冷上。H60自带涂层,不过要注意水冷必须安装特别紧,一点点空气缝隙也不能留,不然估计深度学习压力测试你的CPU会到80度。不放心的可以上H100i。

电源:电源还是很重要的基本2个选择 Corsair 1500W或者EVGA 1600W,因为一个GPU可能到250W。当然实际运行的时候一般到不了那么高。我之前选了一个 Corsair 1200W,居然self-test风扇不转,只要连主板就会reboot loop,明显是次品,赶紧趁机RMA换了1600W。

机箱:不少人推荐Corsair Carbide Air 540,这是一个中塔机箱。我最后选择了一个全塔机箱Corsair 900D,通风好,但是特别重(配上所有东西超过50多斤重。。。保险箱的节奏)。大机箱可以放很多硬盘,如果你需要的话。

最后用USB 3.1启动机器,几分钟就装好了Ubuntu 16.04。注意最好UEFI BIOS配置取消Secure Boot功能,不然你装Titan X驱动和CUDA 8.0 RC会有问题。装TensorFlow也没什么问题,就是要是找不到CUDA库的错误,可以用sudo ldconfig /usr/local/cuda/lib64和LD_LIBRARY_PATH / LIBRARY_PATH来解决。

我测试了4块Titan X Pascal跑TF的CIFAR多GPU训练,训练几天时间一切都很正常,GPU的温度最高70度(设计80 C温度范围内,其他几块会低),GPU风扇也不会到50%速度。目前我也在测Supermicro的superserver多显卡配置,可能成本会更低。

如何配置一部4块Titan X GPU的深度学习机器相关推荐

  1. 深度 | 从硬件配置到软件安装,一台深度学习机器的配备指南

    本文作者 Roelof Pieters 是瑞典皇家理工学院 Institute of Technology & Consultant for Graph-Technologies 研究深度学习 ...

  2. GPU 选择 深度学习 图像识别

    GPU 选择 深度学习 图像识别 1.显卡 1.1.Nvidia显卡分类 1.1.1 Geforce系列 1.1.2 Quadro系列 1.1.3 Tesla系列 1.2 GPU几个比较重要的参数 G ...

  3. 独家|让你的GPU为深度学习做好准备(附代码)

    作者:Saurabh Bodhe 翻译:陈振东 校对:车前子 本文约1000字,建议阅读5分钟. 本文讲述了使用NVIDIA官方工具搭建基于GPU的TensorFlow平台的教程. <在谷歌云平 ...

  4. GPU与深度学习和药物开发

    最新一期的<Nature Machine Intelligence>发表了评论文章讨论GPU计算在深度学习以及药物研发中的变革作用. 深度学习几乎颠覆了每一项研究领域,包括对药物发现有直接 ...

  5. mxnet:结合R与GPU加速深度学习

    转载于统计之都,http://cos.name/tag/dmlc/,作者陈天奇 ------------------------------------------------------------ ...

  6. mxnet:结合R与GPU加速深度学习(转)

    mxnet:结合R与GPU加速深度学习(转) 近年来,深度学习可谓是机器学习方向的明星概念,不同的模型分别在图像处理与自然语言处理等任务中取得了前所未有的好成绩.在实际的应用中,大家除了关心模型的准确 ...

  7. 深度学习(12)——利用GPU做深度学习

    前言 前文所谈都是基于CPU搭建深度学习的模型,利用CPU来优化模型,数据处理,实际上CPU在运算速度运算能力上不及GPU,随着现如今游戏的发展,挖矿的需求,GPU变得越来越强,GPU可以实现并行计算 ...

  8. 深度学习机器配置 装机指南:从GPU到显示器,全套硬件推荐

    1.GPU 显卡(GPU)是深度学习的重要部件,甚至比CPU更重要.做深度学习不用GPU只用CPU显然是不明智的,慢的如乌龟,跑个模型等几天,难熬,但适合摸鱼 使用16bit的RTX 2070或者RT ...

  9. 利用多 GPU 加速深度学习模型训练

    01 - 前言 深度学习模型通常使用 GPU 训练,因为 GPU 具有相比 CPU 更高的计算能力,以 Tesla V100 为例,使用 Tensor Core 加速的半精度浮点计算能力达到 125 ...

最新文章

  1. 3.2 神经网络概述-机器学习笔记-斯坦福吴恩达教授
  2. vba怎么安装_VBA还要学吗?怎么入门Excel VBA?
  3. Python Demo 04-蒙特卡罗猜测与计时
  4. 生成configDataContextRefres失败:Error creating bean with name ‘configDataContextRefresher‘
  5. selenium 示例_Selenium测试中所需的功能和示例
  6. php5 mysql 源_CentOS 7.4使用yum源安装MySQL5.7
  7. 【扩展欧几里得】Bzoj 1477:青蛙的约会
  8. sha1原型 c语言,SHA1算法实现(C语言)
  9. linux操作系统命令及流程图,计算机操作系统与简单命令
  10. php中的date()函数d y m l等字母的表示方法
  11. 第五届电气学院比赛之XXX——数码管显示模块
  12. JDK中的BitMap实现之BitSet源码分析
  13. cmd命令打开文本文档_win7定时关机命令 【处置技巧】
  14. c语言买100只鸡,C语言经典问题--百钱买百鸡问题
  15. Python爬虫-关于HTPP请求方法有哪些
  16. 首款搭载HarmonyOS,分布式“智慧眼”!华为智选首款搭载HarmonyOS的智能摄像头正式发布...
  17. 被中国家长摧残的十种优秀儿童品质(转)
  18. 华硕天选3和联想拯救者r9000p哪个好
  19. 物联网为什么需要5G?
  20. excel使用教程_汉字资料如何进行数据分析?Excel中医学汉字资料转化为数字资料视频教程——If/Iserror/Find函数的结合使用...

热门文章

  1. A*:python实现A星寻路算法可视化
  2. 随手写个node爬虫
  3. 【一生一芯】Chap.1 “一生一芯”实验环境配置| VMware安装Ubuntu20.04 | PA工程配置 | 解决llvm版本问题
  4. 华三交换机检查命令行
  5. opengl碗状_一种基于OPENGL的车载环视多视角全景生成方法专利_专利查询 - 天眼查...
  6. 微软原版Windows XP Pro With SP3 VOL MSDN原版镜像
  7. 【万字长文】 游戏的内容生态发展简史
  8. 杰理蓝牙芯片AC6950的使用-按键功能设置
  9. Nginx --高阶
  10. 【初级web前端工程师】2020年工作总结PPT