NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021

本方案中，推荐配置报价更新日期：2021/03/06

变更原因：

1）近期唯利是图的厂家将RTX显卡大部分卖给挖矿的，造成断货、暴涨

2）RTX A6000上市、增加新GPU配置方案

3）GX630M保证6块GPU卡全部在Pcie 16X（6个 16x）带宽，而不是市场其他品牌机型是4个16x+2个8x

nvidia的 Ampere架构-RTX 3090上市，该卡是第一个拥有超1万个流处理器的最强算力GPU卡，由于该卡外形尺寸巨大，长度达313mm，厚度3个槽，另外功耗到350w，常规GPU计算机/工作站最多支持1~2块，市场上是否有支持更多RTX3090的硬件配置？
西安坤隆公司的UltraLAB GX630M深度学习工作站可支持到最大6块RTX3090卡或7块RTX3070，用于深度学习训练和推理，该配置的深度学习工作站的张量计算单元（Tensor Core）FP16性能理论达到1.7PTflops

（一）UltraLAB深度学习工作站支持RTX30情况

No	机型	关键配置	备注
1	GX380i /GX390i	intel第9/10代高频 (8核@5Ghz-10核5.2GHz）最大2块RTX30系列，内存最大128GB 静音级	2块RTX3090性能超4块Titan RTX， 2块RTX3080性能超4块RTX2080ti
2	GT410P	intel第10代至尊处理器 (10核4.6GHz-18核4.2GHz），内存最大256GB 最大5块RTX30系列， 20个硬盘位静音级	4块RTX3080性能超7块Titan RTX和8块2080Ti
3	GX630M	2颗Xeon（最大56核）最大6-7块RTX30系列 20个硬盘位静音级	是目前具有最高GPU算力的工作站

UltraLAB深度学习工作站-GPU配备规格

下表是UltraLAB深度学习机型可供配置组合（按最高性能指标降序）

No	型号	卡数	CUDA核数	FP32 (单位Tflops）	张量计算FP16(单位Tflops)	显存带宽GBs	显存合计GB	应用推荐
1	A6000	7块	75264	280	2184	768	336	CNN+RNN
2	RTX3090	7块	73472	249	1995	936	168	CNN+RNN
3	A6000	6块	64512	240	1872	768	288	CNN+RNN
4	RTX3080	8块	69632	238	1904	760	80	CNN
5	Tesla V100	16块	81920	238	1760	653	192	CNN+RNN
6	RTX3090	6块	62976	213	1710	936	144	CNN+RNN
7	RTX3080	6块	52224	179	1428	760	60	CNN
8	RTX3090	5块	52480	178	1425	936	120	CNN+RNN
9	A6000	4块	83968	160	1248	768	192	CNN+RNN
10	RTX3080	5块	43520	149	1190	760	50	CNN
11	RTX3090	4块	41984	142	1140	936	96	CNN+RNN
12	RTX3070	7块	41216	142	1141	448	56	CNN
13	RTX2080Ti	9块	39168	121	990	616	99	CNN
14	RTX3070	6块	35328	122	978	448	48	CNN
15	RTX3080	4块	34816	119	952	760	40	CNN
16	Titan RTX	7块	32256	114	910	672	168	CNN+RNN
17	RTX2080Ti	8块	34816	108	880	616	88	CNN
18	RTX3090	3块	41984	107	855	936	72	CNN+RNN
19	RTX3070	5块	29440	102	815	448	40	CNN
20	RTX3080	3块	34816	89	714	760	40	CNN
21	RTX3070	4块	23552	81	652	448	32	CNN
22	A6000	2块	21504	80	624	768	96	CNN+RNN
23	RTX3090	2块	20992	71	570	936	48	CNN+RNN
24	Titan RTX	4块	18432	65	520	672	96	CNN+RNN
25	RTX3070	3块	23552	61	489	448	24	CNN
26	RTX3080	2块	17408	60	476	760	20	CNN
27	RTX2080Ti	4块	17408	54	440	616	44	CNN
28	RTX2080s	4	12288	44	252	496	32	CNN
29	RTX3070	2块	11776	41	326	448	16	CNN
30	A6000	1块	10752	40	312	768	48	CNN+RNN
31	RTX3090	1块	10496	36	285	936	24	CNN+RNN
32	Titan RTX	2块	9216	32	260	672	48	CNN+RNN
33	RTX3080	1块	8704	30	238	760	10	CNN
34	RTX2080Ti	2块	8704	28	220	616	22	CNN
35	RTX2080s	2块	3072	22	126	496	16	CNN
36	RTX3070	1块	5888	20	163	448	8	CNN
37	Titan RTX	1块	4608	16	130	672	24	CNN+RNN
38	TITAN V	1	5120	14.90	110	652.80	12
39	RTX2080Ti	1块	4352	13	110	616	11	CNN

从上述表格看：

(1) 6块RTX3090(6个全pcie 16x)已经接近nvidia DGX-2性能

(2) 4块RTX3090性能超9块RTX2080Ti或7块Titan RTX

(3）2块RTX3080性能超4块Titan RTX

（二）UltraLAB 深度学习工作站配置方案2020v4

2.1 图灵超算工作站GX380i配置方案-科研型

No	产品型号	主要配置	显存	CUDA处理器FP16性能指标单位：Tflops	张量处理器FP16性能指标单位：Tflops	理想算法	价格
1.1	UltraLAB GX380i 14932-SAX	intel第9代处理器(6核@4.9Ghz) /32GB DDR4/RTX3080 10GB/960GB SSD /4TB SATA/双塔式(2000w) /23"图显	10GB	30	238	CNN+ RNN	¥35,500
1.2	UltraLAB GX380i 14932-SBT	intel第9代处理器(8核@4.9Ghz) /32GB DDR4/ RTX3090 24GB/1.9TB SSD /8TB SATA/双塔式(2000w) /23"图显	24GB	36	285	CNN+ RNN	¥49,990
1.3	UltraLAB GX380i 14932-SA2X	intel第9代处理器(8核@4.9Ghz ) /32GB DDR4 /*2RTX3070**/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显	16GB	41	326	CNN	¥49,990
1.4	UltraLAB GX390i 15064-SB2X	intel第10代处理器(10核@5.0Ghz) /64GB DDR4 /*2RTX3080**/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显	20GB	60	476	CNN	¥62,600
1.5	UltraLAB GX390i 15096-SC2T	intel第10代处理器(10核5.0Ghz) /96GB DDR4 /*2RTX3090**/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显	48GB	71	570	CNN+ RNN	¥79,990
1.6	UltraLAB GX390i 15096-SC2E	intel第10代处理器(10核5.0Ghz) /96GB DDR4 /*2A6000**/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显	96GB	80	624	CNN+ RNN	¥145,000

2.2 图灵超算工作站（GT410P）配置推荐-高性能型

No	产品型号	主要配置	显存	CUDA处理器FP16性能指标单位：Tflops	张量处理器FP16性能指标单位：Tflops	理想算法	价格
2.1	UltraLAB GT410P 14664-MB4X	intel第10代至尊处理器 (10核4.6Ghz )、64GB DDR4 /*4RTX307**0/2TB SSD M2.SSD +6TB SATA/双塔式(双2000w) /27"-4K图显	32GB	81	652	CNN	¥94,500
2.2	UltraLAB GT410P 14596-MB5X	intel第10代至尊处理器 (12核4.5Ghz )、96GB DDR4 /*5RTX3070**/2TB SSD M2.SSD +8TB SATA/双塔式(双2000w) /27"-4K图显	40GB	102	815	CNN	¥110,000
2.3	UltraLAB GT410P 145128-PC3T	intel第10代至尊处理器 (12核4.5Ghz )、128GB DDR4 /*3RTX3090**/ 4TB Pci-SSD+ 10TB SATA/ 双塔式(双2000w)/27"-4K图显	72GB	107	855	CNN+ RNN	¥135,000
2.4	UltraLAB GT410P 14596-PC4X	intel第10代至尊处理器 (12核4.5Ghz )、96GB DDR4 /*4RTX3080**/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显	40GB	119	952	CNN	¥119,000
2.5	UltraLAB GT410P 144192-PC4T	intel第10代至尊处理器 (14核4.4Ghz )、192GB DDR4 /*4RTX3090**/ 4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显	96GB	142	1140	CNN+ RNN	¥159,990
2.6	UltraLAB GT410P 144128-PC5X	intel第10代至尊处理器 (14核4.4Ghz )、128GB DDR4 /*5RTX3080**/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显	50GB	149	1190	CNN	¥139,990
2.7	UltraLAB GT410P 144256-PD5T	intel第10代至尊处理器 (14核4.4Ghz)、256GB DDR4 /*5RTX3090**/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显	120GB	178	1425	CNN+ RNN	¥185,000
2.8	UltraLAB GT410P 144256-PD5E	intel第10代至尊处理器 (14核4.4Ghz)、256GB DDR4 /*5A6000**/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显	240GB	200	1560	CNN+ RNN	¥335,000

2.3 图灵超算工作站(GX630M)配置推荐-极致型

No	产品型号	主要配置	显存	CUDA处理器FP16性能指标单位：Tflops	张量处理器FP16性能指标单位：Tflops	理想算法	价格
3.1	UltraLAB GX630M 243192-MB6X	2Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /6RTX3070 /1.92TB SSD+2TB M2.SSD**/42TB存储/双塔式(双2000w)/27"-4K图显	48GB	122	978	CNN	¥199,990
3.2	UltraLAB GX630M 243256-MB7X	2Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /7RTX3070** /1.92TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显	56GB	142	1141	CNN	¥220,000
3.3	ltraLAB GX630M 243256-PC5X	2Xeon金6244(16核4.3GHz)/睿频4.4GHz/256GB DDR4 /5RTX3080** /1.92TB SSD+4TB P-SSD/70TB存储/双塔式(双2000w)/27"-4K图显	50GB	149	1190	CNN	¥223,000
3.4	UltraLAB GX630M 241384-PC6X	2Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /6RTX3080** /1.9TB SSD+4TB P-SSD/70TB并行存储/双塔式(双2000w)/27"-4K图显	60GB	179	1428	CNN	¥248,000
3.5	UltraLAB GX630M 243192-MB4T	2Xeon金6244(16核4.3GHz)/睿频4.3GHz/192GB DDR4 /4RTX3090** /1.9TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显	96GB	142	1140	CNN+ RNN	¥256,000
3.6	UltraLAB GX630M 241384-PD5T	2Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /5RTX3090** /1.92TB SSD+4TB P-SSD/90TB并行存储/双塔/27"-4K图	120GB	178	1425	CNN+ RNN	¥299,000
3.7	UltraLAB GX630M 243768-180T6T	2Xeon金6256(24核4.3GHz)/ 睿频4.5GHz /768GB DDR4 /6RTX3090（三槽）**/3.84TB SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显	144GB	213	1710	性能近16块Titan V	¥375,000
3.8	UltraLAB GX630M 243768-180T7T	2Xeon金6256(24核4.3GHz)/ 睿频4.5GHz /768GB DDR4 /7RTX3090(双槽)**/4TB P-SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显	168GB	249	1990	最快最完美，性能超DGX-2	¥399,900
3.9	UltraLAB GX630M 243384-150T4E	2Xeon金6256(24核4.3GHz)/睿频4.5GHz /384GB DDR4 /4A6000** /4TB P-SSD+150TB并行存储/双塔式(双2000w)/32"-4K图显	192GB	160	1250	CNN+ RNN+ 推理	¥399,900
3.10	UltraLAB GX630M 2331T-150T7E	2Xeon金6254(36核3.9GHz)/睿频4.0GHz/1TB DDR4 /7A6000** /双3.84TB SSD+6.4TB-P-SSD/240TB 并行存储/双塔式(双2000w) /32"-4K图显	336GB	280	2180	最强最完整	¥650,000

上述配置可以看出：

（1）UltraLAB GX630M大部分配置都已超越9块RTX2080ti/7块Titan RTX性能

（2）UltraLAB GX630M（编号3.7）的配置规格，其性能已经接近nvidia DGX-2，但其价格是DGX-2的1/10价格

欢迎测试验证

NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021相关推荐

深度学习训练吃显卡_最新最全深度学习训练/GPU服务器硬件配置推荐2020
人工智能随着核心算法.计算能力的迅速提升,以及海量联网数据的支持,在本世纪终于迎来了质的飞跃,人工智能将是未来应用最广泛的技术之一,在市场经济领域带来更多的机遇与机会,在医学领域可以大大加快诊断速度和 ...
深度学习之GPU环境配置
写下此博客以纪念我这一周的折腾. 刚开始是打算在ubuntu18.04上面直接配置GPU运行环境的,然后遇到了各种问题,首先就是在terminal中输入nvidia-smi命令,出现需要你安装最新驱动 ...
NVIDIA RTX A6000深度学习训练基准
NVIDIA RTX A6000深度学习训练基准 2021年1月4日在本文中,我们对RTX A6000的PyTorch和TensorFlow培训性能进行了基准测试.我们将其与Tesla A100,V ...
如何配置一台支持6块RTX3090静音级深度学习工作站
nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工 ...
基于NVIDIA GPUs的深度学习训练新优化
基于NVIDIA GPUs的深度学习训练新优化 New Optimizations To Accelerate Deep Learning Training on NVIDIA GPUs 不同行业采用 ...
Ubuntu18 安装nvidia驱动进行深度学习训练
Ubuntu18 安装nvidia驱动进行深度学习训练安装nvidia驱动驱动不兼容而造成系统循环登录的解决方案安装cuda 安装cudnn 下载anacoda3 找不到conda命令的解决方法 ...
windows10：GTX GeForce 1070+更新nvidia显卡驱动+CUDA+CUDNN+tensorflow_gpu深度学习GPU环境搭建（史上排雷最多版本）
windows10 GTX GeForce 1070+CUDA9.0+CUDNN7.6.4+TensorFlow_GPU1.5 5天星期前开始搭建tensorflow GPU环境,途中屡屡踩雷, 现在 ...
docker 利用docker拉取Nvidia/cuda官方镜像，部署深度学习环境
利用docker拉取Nvidia/cuda官方镜像,部署深度学习环境 1.拉取Nvidia/cuda官方镜像 2.生成容器 3.在容器内安装深度学习环境看完这篇博文,可以查看我总结的另一篇博文教程: ...
【深度学习】如何选择适合深度学习的GPU？
如何选择适合深度学习的GPU? 为什么GPU比CPU更适合机器学习或者深度学习? 什么是张量处理单元(TPU)? 目前主流的GPU厂商:Nvidia和AMD 选择GPU时需要关注的主要属性 1. GP ...

NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021

NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021相关推荐

最新文章

热门文章