NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021
本方案中,推荐配置报价更新日期:2021/03/06
变更原因:
1)近期唯利是图的厂家将RTX显卡大部分卖给挖矿的,造成断货、暴涨
2)RTX A6000上市、增加新GPU配置方案
3)GX630M保证6块GPU卡全部在Pcie 16X(6个 16x)带宽,而不是市场其他品牌机型是4个16x+2个8x
nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工作站最多支持1~2块,市场上是否有支持更多RTX3090的硬件配置?
西安坤隆公司的UltraLAB GX630M深度学习工作站可支持到最大6块RTX3090卡或7块RTX3070,用于深度学习训练和推理,该配置的深度学习工作站的张量计算单元(Tensor Core)FP16性能理论达到1.7PTflops
(一)UltraLAB深度学习工作站支持RTX30情况
No |
机型 |
关键配置 |
备注 |
1 |
GX380i /GX390i |
intel第9/10代高频 (8核@5Ghz-10核5.2GHz) 最大2块RTX30系列, 内存最大128GB 静音级 |
2块RTX3090性能超4块Titan RTX, 2块RTX3080性能超4块RTX2080ti |
2 |
GT410P |
intel第10代至尊处理器 (10核4.6GHz-18核4.2GHz), 内存最大256GB 最大5块RTX30系列, 20个硬盘位 静音级 |
4块RTX3080性能超7块Titan RTX和8块2080Ti |
3 |
GX630M |
2颗Xeon(最大56核) 最大6-7块RTX30系列 20个硬盘位 静音级 |
是目前具有最高GPU算力的工作站 |
UltraLAB深度学习工作站-GPU配备规格
下表是UltraLAB深度学习机型可供配置组合(按最高性能指标降序)
No |
型号 |
卡数 |
CUDA核数 |
FP32 (单位Tflops) |
张量计算FP16(单位Tflops) |
显存带宽GBs |
显存合计GB |
应用推荐 |
1 |
A6000 |
7块 |
75264 |
280 |
2184 |
768 |
336 |
CNN+RNN |
2 |
RTX3090 |
7块 |
73472 |
249 |
1995 |
936 |
168 |
CNN+RNN |
3 |
A6000 |
6块 |
64512 |
240 |
1872 |
768 |
288 |
CNN+RNN |
4 |
RTX3080 |
8块 |
69632 |
238 |
1904 |
760 |
80 |
CNN |
5 |
Tesla V100 |
16块 |
81920 |
238 |
1760 |
653 |
192 |
CNN+RNN |
6 |
RTX3090 |
6块 |
62976 |
213 |
1710 |
936 |
144 |
CNN+RNN |
7 |
RTX3080 |
6块 |
52224 |
179 |
1428 |
760 |
60 |
CNN |
8 |
RTX3090 |
5块 |
52480 |
178 |
1425 |
936 |
120 |
CNN+RNN |
9 |
A6000 |
4块 |
83968 |
160 |
1248 |
768 |
192 |
CNN+RNN |
10 |
RTX3080 |
5块 |
43520 |
149 |
1190 |
760 |
50 |
CNN |
11 |
RTX3090 |
4块 |
41984 |
142 |
1140 |
936 |
96 |
CNN+RNN |
12 |
RTX3070 |
7块 |
41216 |
142 |
1141 |
448 |
56 |
CNN |
13 |
RTX2080Ti |
9块 |
39168 |
121 |
990 |
616 |
99 |
CNN |
14 |
RTX3070 |
6块 |
35328 |
122 |
978 |
448 |
48 |
CNN |
15 |
RTX3080 |
4块 |
34816 |
119 |
952 |
760 |
40 |
CNN |
16 |
Titan RTX |
7块 |
32256 |
114 |
910 |
672 |
168 |
CNN+RNN |
17 |
RTX2080Ti |
8块 |
34816 |
108 |
880 |
616 |
88 |
CNN |
18 |
RTX3090 |
3块 |
41984 |
107 |
855 |
936 |
72 |
CNN+RNN |
19 |
RTX3070 |
5块 |
29440 |
102 |
815 |
448 |
40 |
CNN |
20 |
RTX3080 |
3块 |
34816 |
89 |
714 |
760 |
40 |
CNN |
21 |
RTX3070 |
4块 |
23552 |
81 |
652 |
448 |
32 |
CNN |
22 |
A6000 |
2块 |
21504 |
80 |
624 |
768 |
96 |
CNN+RNN |
23 |
RTX3090 |
2块 |
20992 |
71 |
570 |
936 |
48 |
CNN+RNN |
24 |
Titan RTX |
4块 |
18432 |
65 |
520 |
672 |
96 |
CNN+RNN |
25 |
RTX3070 |
3块 |
23552 |
61 |
489 |
448 |
24 |
CNN |
26 |
RTX3080 |
2块 |
17408 |
60 |
476 |
760 |
20 |
CNN |
27 |
RTX2080Ti |
4块 |
17408 |
54 |
440 |
616 |
44 |
CNN |
28 |
RTX2080s |
4 |
12288 |
44 |
252 |
496 |
32 |
CNN |
29 |
RTX3070 |
2块 |
11776 |
41 |
326 |
448 |
16 |
CNN |
30 |
A6000 |
1块 |
10752 |
40 |
312 |
768 |
48 |
CNN+RNN |
31 |
RTX3090 |
1块 |
10496 |
36 |
285 |
936 |
24 |
CNN+RNN |
32 |
Titan RTX |
2块 |
9216 |
32 |
260 |
672 |
48 |
CNN+RNN |
33 |
RTX3080 |
1块 |
8704 |
30 |
238 |
760 |
10 |
CNN |
34 |
RTX2080Ti |
2块 |
8704 |
28 |
220 |
616 |
22 |
CNN |
35 |
RTX2080s |
2块 |
3072 |
22 |
126 |
496 |
16 |
CNN |
36 |
RTX3070 |
1块 |
5888 |
20 |
163 |
448 |
8 |
CNN |
37 |
Titan RTX |
1块 |
4608 |
16 |
130 |
672 |
24 |
CNN+RNN |
38 |
TITAN V |
1 |
5120 |
14.90 |
110 |
652.80 |
12 |
|
39 |
RTX2080Ti |
1块 |
4352 |
13 |
110 |
616 |
11 |
CNN |
从上述表格看:
(1) 6块RTX3090(6个全pcie 16x)已经接近nvidia DGX-2性能
(2) 4块RTX3090性能超9块RTX2080Ti或7块Titan RTX
(3)2块RTX3080性能超4块Titan RTX
(二)UltraLAB 深度学习工作站配置方案2020v4
2.1 图灵超算工作站GX380i配置方案-科研型
No |
产品型号 |
主要配置 |
显存 |
CUDA处理器FP16性能指标 单位:Tflops |
张量处理器FP16性能指标 单位:Tflops |
理想算法 |
价格 |
1.1 |
UltraLAB GX380i 14932-SAX |
intel第9代处理器(6核@4.9Ghz) /32GB DDR4/RTX3080 10GB/960GB SSD /4TB SATA/双塔式(2000w) /23"图显 |
10GB |
30 |
238 |
CNN+ RNN |
¥35,500 |
1.2 |
UltraLAB GX380i 14932-SBT |
intel第9代处理器(8核@4.9Ghz) /32GB DDR4/ RTX3090 24GB/1.9TB SSD /8TB SATA/双塔式(2000w) /23"图显 |
24GB |
36 |
285 |
CNN+ RNN |
¥49,990 |
1.3 |
UltraLAB GX380i 14932-SA2X |
intel第9代处理器(8核@4.9Ghz ) /32GB DDR4 /2*RTX3070/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显 |
16GB |
41 |
326 |
CNN |
¥49,990 |
1.4 |
UltraLAB GX390i 15064-SB2X |
intel第10代处理器(10核@5.0Ghz) /64GB DDR4 /2*RTX3080/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显 |
20GB |
60 |
476 |
CNN |
¥62,600 |
1.5 |
UltraLAB GX390i 15096-SC2T |
intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*RTX3090/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显 |
48GB |
71 |
570 |
CNN+ RNN |
¥79,990 |
1.6 | UltraLAB GX390i 15096-SC2E |
intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*A6000/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显 |
96GB | 80 | 624 |
CNN+ RNN |
¥145,000 |
2.2 图灵超算工作站(GT410P)配置推荐-高性能型
No |
产品型号 |
主要配置 |
显存 |
CUDA处理器FP16性能指标 单位:Tflops |
张量处理器FP16性能指标 单位:Tflops |
理想算法 |
价格 |
2.1 |
UltraLAB GT410P 14664-MB4X |
intel第10代至尊处理器 (10核4.6Ghz )、64GB DDR4 /4*RTX3070/2TB SSD M2.SSD +6TB SATA/双塔式(双2000w) /27"-4K图显 |
32GB |
81 |
652 |
CNN |
¥94,500 |
2.2 |
UltraLAB GT410P 14596-MB5X |
intel第10代至尊处理器 (12核4.5Ghz )、96GB DDR4 /5*RTX3070/2TB SSD M2.SSD +8TB SATA/双塔式(双2000w) /27"-4K图显 |
40GB |
102 |
815 |
CNN |
¥110,000 |
2.3 |
UltraLAB GT410P 145128-PC3T |
intel第10代至尊处理器 (12核4.5Ghz )、128GB DDR4 /3*RTX3090/ 4TB Pci-SSD+ 10TB SATA/ 双塔式(双2000w)/27"-4K图显 |
72GB |
107 |
855 |
CNN+ RNN |
¥135,000 |
2.4 |
UltraLAB GT410P 14596-PC4X |
intel第10代至尊处理器 (12核4.5Ghz )、96GB DDR4 /4*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显 |
40GB |
119 |
952 |
CNN |
¥119,000 |
2.5 |
UltraLAB GT410P 144192-PC4T |
intel第10代至尊处理器 (14核4.4Ghz )、192GB DDR4 /4*RTX3090/ 4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显 |
96GB |
142 |
1140 |
CNN+ RNN |
¥159,990 |
2.6 |
UltraLAB GT410P 144128-PC5X |
intel第10代至尊处理器 (14核4.4Ghz )、128GB DDR4 /5*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显 |
50GB |
149 |
1190 |
CNN |
¥139,990 |
2.7 |
UltraLAB GT410P 144256-PD5T |
intel第10代至尊处理器 (14核4.4Ghz)、256GB DDR4 /5*RTX3090/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显 |
120GB |
178 |
1425 |
CNN+ RNN |
¥185,000 |
2.8 | UltraLAB GT410P 144256-PD5E |
intel第10代至尊处理器 (14核4.4Ghz)、256GB DDR4 /5*A6000/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显 |
240GB | 200 | 1560 |
CNN+ RNN |
¥335,000 |
2.3 图灵超算工作站(GX630M)配置推荐-极致型
No |
产品型号 |
主要配置 |
显存 |
CUDA处理器FP16性能指标 单位:Tflops |
张量处理器FP16性能指标 单位:Tflops |
理想算法 |
价格 |
3.1 |
UltraLAB GX630M 243192-MB6X |
2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /6*RTX3070 /1.92TB SSD+2TB M2.SSD/42TB存储/双塔式(双2000w)/27"-4K图显 |
48GB |
122 |
978 |
CNN |
¥199,990 |
3.2 |
UltraLAB GX630M 243256-MB7X |
2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /7*RTX3070 /1.92TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显 |
56GB |
142 |
1141 |
CNN |
¥220,000 |
3.3 |
ltraLAB GX630M 243256-PC5X |
2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/256GB DDR4 /5*RTX3080 /1.92TB SSD+4TB P-SSD/70TB存储/双塔式(双2000w)/27"-4K图显 |
50GB |
149 |
1190 |
CNN |
¥223,000 |
3.4 | UltraLAB GX630M 241384-PC6X |
2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /6*RTX3080 /1.9TB SSD+4TB P-SSD/70TB并行存储/双塔式(双2000w)/27"-4K图显 |
60GB | 179 | 1428 | CNN | ¥248,000 |
3.5 |
UltraLAB GX630M 243192-MB4T |
2*Xeon金6244(16核4.3GHz)/睿频4.3GHz/192GB DDR4 /4*RTX3090 /1.9TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显 |
96GB | 142 | 1140 |
CNN+ RNN |
¥256,000 |
3.6 |
UltraLAB GX630M 241384-PD5T | 2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /5*RTX3090 /1.92TB SSD+4TB P-SSD/90TB并行存储/双塔/27"-4K图 | 120GB | 178 | 1425 |
CNN+ RNN |
¥299,000 |
3.7 |
UltraLAB GX630M 243768-180T6T |
2*Xeon金6256(24核4.3GHz)/ 睿频4.5GHz /768GB DDR4 /6*RTX3090(三槽)/3.84TB SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显 |
144GB |
213 |
1710 |
性能近16块Titan V |
¥375,000 |
3.8 | UltraLAB GX630M 243768-180T7T |
2*Xeon金6256(24核4.3GHz)/ 睿频4.5GHz /768GB DDR4 /7*RTX3090(双槽)/4TB P-SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显 |
168GB | 249 | 1990 |
最快最完美,性能超DGX-2 |
¥399,900 |
3.9 | UltraLAB GX630M 243384-150T4E |
2*Xeon金6256(24核4.3GHz)/睿频4.5GHz /384GB DDR4 /4*A6000 /4TB P-SSD+150TB并行存储/双塔式(双2000w)/32"-4K图显 |
192GB | 160 | 1250 |
CNN+ RNN+ 推理 |
¥399,900 |
3.10 |
UltraLAB GX630M 2331T-150T7E |
2*Xeon金6254(36核3.9GHz)/睿频4.0GHz/1TB DDR4 /7*A6000 /双3.84TB SSD+6.4TB-P-SSD/240TB 并行存储/双塔式(双2000w) /32"-4K图显 |
336GB |
280 |
2180 |
最强最完整 |
¥650,000 |
上述配置可以看出:
(1)UltraLAB GX630M大部分配置都已超越9块RTX2080ti/7块Titan RTX性能
(2)UltraLAB GX630M(编号3.7)的配置规格,其性能已经接近nvidia DGX-2,但其价格是DGX-2的1/10价格
欢迎测试验证
NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021相关推荐
- 深度学习 训练吃显卡_最新最全深度学习训练/GPU服务器硬件配置推荐2020
人工智能随着核心算法.计算能力的迅速提升,以及海量联网数据的支持,在本世纪终于迎来了质的飞跃,人工智能将是未来应用最广泛的技术之一,在市场经济领域带来更多的机遇与机会,在医学领域可以大大加快诊断速度和 ...
- 深度学习之GPU环境配置
写下此博客以纪念我这一周的折腾. 刚开始是打算在ubuntu18.04上面直接配置GPU运行环境的,然后遇到了各种问题,首先就是在terminal中输入nvidia-smi命令,出现需要你安装最新驱动 ...
- NVIDIA RTX A6000深度学习训练基准
NVIDIA RTX A6000深度学习训练基准 2021年1月4日 在本文中,我们对RTX A6000的PyTorch和TensorFlow培训性能进行了基准测试.我们将其与Tesla A100,V ...
- 如何配置一台支持6块RTX3090静音级深度学习工作站
nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工 ...
- 基于NVIDIA GPUs的深度学习训练新优化
基于NVIDIA GPUs的深度学习训练新优化 New Optimizations To Accelerate Deep Learning Training on NVIDIA GPUs 不同行业采用 ...
- Ubuntu18 安装nvidia驱动进行深度学习训练
Ubuntu18 安装nvidia驱动进行深度学习训练 安装nvidia驱动 驱动不兼容而造成系统循环登录的解决方案 安装cuda 安装cudnn 下载anacoda3 找不到conda命令的解决方法 ...
- windows10:GTX GeForce 1070+更新nvidia显卡驱动+CUDA+CUDNN+tensorflow_gpu深度学习GPU环境搭建(史上排雷最多版本)
windows10 GTX GeForce 1070+CUDA9.0+CUDNN7.6.4+TensorFlow_GPU1.5 5天星期前开始搭建tensorflow GPU环境,途中屡屡踩雷, 现在 ...
- docker 利用docker拉取Nvidia/cuda官方镜像,部署深度学习环境
利用docker拉取Nvidia/cuda官方镜像,部署深度学习环境 1.拉取Nvidia/cuda官方镜像 2.生成容器 3.在容器内安装深度学习环境 看完这篇博文,可以查看我总结的另一篇博文教程: ...
- 【深度学习】如何选择适合深度学习的GPU?
如何选择适合深度学习的GPU? 为什么GPU比CPU更适合机器学习或者深度学习? 什么是张量处理单元(TPU)? 目前主流的GPU厂商:Nvidia和AMD 选择GPU时需要关注的主要属性 1. GP ...
最新文章
- linux查找技巧: find grep xargs amp;amp; linux系统信息查看大全
- 节省磁盘空间的新一代包管理工具PNPM
- NET MVC3 中的枚举多语言实现,DescriptionPairAttribute
- 2017年第八届蓝桥杯 - 省赛 - C/C++大学A组 - A. 迷宫
- 在SAP Business Application Studio里创建Fiori应用的操作流程
- c位边上还有什么位_【一点资讯】那些有趣而搞笑的GIF动画:为让出c位,站边上拍照还是谦虚礼貌的 www.yidianzixun.com...
- oracle连接工具_扯一扯Tableau软件配置数据源系列之Oracle
- 使用DotNetOpenAuth搭建OAuth2.0授权框架——Demo代码简单说明
- matlab可以用python代替吗_Python 会不会替代 MATLAB
- 中国可用的 BT Tracker 服务器列表,每24小时自动更新,去重,自动检测可用性
- 四川大学计算机学院优秀毕业论文,(完整版)四川大学本科_毕业论文(设计)_有关规定...
- 腾讯云图(TCV)使用指南
- 使用注册表管理桌面新建文件
- Moore型状态机和Mealy型状态机的区别以及各自Verilog的实现细节:为什么Moore型状态机需要多一个状态?怎么选择用哪一种状态机?
- 用户调研---问卷调查
- 关掉微软没用的服务,让你的电脑提速百倍(转)
- 百度之星资格赛1003 度度熊与邪恶大魔王
- Bootstrap3 与Bootstrap4垂直水平居中
- 数据结构实验课_实验四 队列
- JavaScript事件触发