本方案中,推荐配置报价更新日期:2021/03/06

变更原因:

1)近期唯利是图的厂家将RTX显卡大部分卖给挖矿的,造成断货、暴涨

2)RTX A6000上市、增加新GPU配置方案

3)GX630M保证6块GPU卡全部在Pcie 16X(6个 16x)带宽,而不是市场其他品牌机型是4个16x+2个8x

nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工作站最多支持1~2块,市场上是否有支持更多RTX3090的硬件配置?
西安坤隆公司的UltraLAB GX630M深度学习工作站可支持到最大6块RTX3090卡或7块RTX3070,用于深度学习训练和推理,该配置的深度学习工作站的张量计算单元(Tensor Core)FP16性能理论达到1.7PTflops

(一)UltraLAB深度学习工作站支持RTX30情况

No

机型

关键配置

备注

1

GX380i

/GX390i

intel第9/10代高频

(8核@5Ghz-10核5.2GHz)

最大2块RTX30系列,

内存最大128GB

静音级

2块RTX3090性能超4块Titan RTX,

2块RTX3080性能超4块RTX2080ti

2

GT410P

intel第10代至尊处理器

(10核4.6GHz-18核4.2GHz),

内存最大256GB

最大5块RTX30系列,

20个硬盘位

静音级

4块RTX3080性能超7块Titan RTX和8块2080Ti

3

GX630M

2颗Xeon(最大56核)

最大6-7块RTX30系列

20个硬盘位

静音级

是目前具有最高GPU算力的工作站

UltraLAB深度学习工作站-GPU配备规格

下表是UltraLAB深度学习机型可供配置组合(按最高性能指标降序)

No

型号

卡数

CUDA核数

FP32 (单位Tflops)

张量计算FP16(单位Tflops)

显存带宽GBs

显存合计GB

应用推荐

1

A6000

7块

75264

280

2184

768

336

CNN+RNN

2

RTX3090

7块

73472

249

1995

936

168

CNN+RNN

3

A6000

6块

64512

240

1872

768

288

CNN+RNN

4

RTX3080

8块

69632

238

1904

760

80

CNN

5

Tesla V100

16块

81920

238

1760

653

192

CNN+RNN

6

RTX3090

6块

62976

213

1710

936

144

CNN+RNN

7

RTX3080

6块

52224

179

1428

760

60

CNN

8

RTX3090

5块

52480

178

1425

936

120

CNN+RNN

9

A6000

4块

83968

160

1248

768

192

CNN+RNN

10

RTX3080

5块

43520

149

1190

760

50

CNN

11

RTX3090

4块

41984

142

1140

936

96

CNN+RNN

12

RTX3070

7块

41216

142

1141

448

56

CNN

13

RTX2080Ti

9块

39168

121

990

616

99

CNN

14

RTX3070

6块

35328

122

978

448

48

CNN

15

RTX3080

4块

34816

119

952

760

40

CNN

16

Titan RTX

7块

32256

114

910

672

168

CNN+RNN

17

RTX2080Ti

8块

34816

108

880

616

88

CNN

18

RTX3090

3块

41984

107

855

936

72

CNN+RNN

19

RTX3070

5块

29440

102

815

448

40

CNN

20

RTX3080

3块

34816

89

714

760

40

CNN

21

RTX3070

4块

23552

81

652

448

32

CNN

22

A6000

2块

21504

80

624

768

96

CNN+RNN

23

RTX3090

2块

20992

71

570

936

48

CNN+RNN

24

Titan RTX

4块

18432

65

520

672

96

CNN+RNN

25

RTX3070

3块

23552

61

489

448

24

CNN

26

RTX3080

2块

17408

60

476

760

20

CNN

27

RTX2080Ti

4块

17408

54

440

616

44

CNN

28

RTX2080s

4

12288

44

252

496

32

CNN

29

RTX3070

2块

11776

41

326

448

16

CNN

30

A6000

1块

10752

40

312

768

48

CNN+RNN

31

RTX3090

1块

10496

36

285

936

24

CNN+RNN

32

Titan RTX

2块

9216

32

260

672

48

CNN+RNN

33

RTX3080

1块

8704

30

238

760

10

CNN

34

RTX2080Ti

2块

8704

28

220

616

22

CNN

35

RTX2080s

2块

3072

22

126

496

16

CNN

36

RTX3070

1块

5888

20

163

448

8

CNN

37

Titan RTX

1块

4608

16

130

672

24

CNN+RNN

38

TITAN V

1

5120

14.90

110

652.80

12

 

39

RTX2080Ti

1块

4352

13

110

616

11

CNN

从上述表格看:

(1) 6块RTX3090(6个全pcie 16x)已经接近nvidia DGX-2性能

(2) 4块RTX3090性能超9块RTX2080Ti或7块Titan RTX

(3)2块RTX3080性能超4块Titan RTX

(二)UltraLAB 深度学习工作站配置方案2020v4

2.1 图灵超算工作站GX380i配置方案-科研型

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

1.1

UltraLAB GX380i 14932-SAX

intel第9代处理器(6核@4.9Ghz) /32GB DDR4/RTX3080 10GB/960GB SSD /4TB SATA/双塔式(2000w) /23"图显

10GB

30

238

CNNRNN

¥35,500

1.2

UltraLAB GX380i 14932-SBT

intel第9代处理器(8核@4.9Ghz) /32GB DDR4/

RTX3090 24GB/1.9TB SSD /8TB SATA/双塔式(2000w) /23"图显

24GB

36

285

CNNRNN

¥49,990

1.3

UltraLAB GX380i 14932-SA2X

intel第9代处理器(8核@4.9Ghz ) /32GB DDR4 /2*RTX3070/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显

16GB

41

326

CNN

¥49,990

1.4

UltraLAB GX390i 15064-SB2X

intel第10代处理器(10核@5.0Ghz) /64GB DDR4 /2*RTX3080/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显

20GB

60

476

CNN

¥62,600

1.5

UltraLAB GX390i 15096-SC2T

intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*RTX3090/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显

48GB

71

570

CNNRNN

¥79,990

1.6 UltraLAB GX390i 15096-SC2E

intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*A6000/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显

96GB 80 624

CNNRNN

¥145,000

2.2 图灵超算工作站(GT410P)配置推荐-高性能型

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

2.1

UltraLAB GT410P 14664-MB4X

intel第10代至尊处理器

(10核4.6Ghz )、64GB DDR4 /4*RTX3070/2TB SSD M2.SSD +6TB SATA/双塔式(双2000w) /27"-4K图显

32GB

81

652

CNN

¥94,500

2.2

UltraLAB GT410P 14596-MB5X

intel第10代至尊处理器

(12核4.5Ghz )、96GB DDR4 /5*RTX3070/2TB SSD M2.SSD +8TB SATA/双塔式(双2000w) /27"-4K图显

40GB

102

815

CNN

¥110,000

2.3

UltraLAB GT410P 145128-PC3T

intel第10代至尊处理器

(12核4.5Ghz )、128GB DDR4 /3*RTX3090/ 4TB Pci-SSD+ 10TB SATA/ 双塔式(双2000w)/27"-4K图显

72GB

107

855

CNN+ RNN

¥135,000

2.4

UltraLAB GT410P 14596-PC4X

intel第10代至尊处理器

(12核4.5Ghz )、96GB DDR4 /4*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显

40GB

119

952

CNN

¥119,000

2.5

UltraLAB GT410P 144192-PC4T

intel第10代至尊处理器

(14核4.4Ghz )、192GB DDR4 /4*RTX3090/ 4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

96GB

142

1140

CNN+ RNN

¥159,990

2.6

UltraLAB GT410P 144128-PC5X

intel第10代至尊处理器

(14核4.4Ghz )、128GB DDR4 /5*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显

50GB

149

1190

CNN

¥139,990

2.7

UltraLAB GT410P 144256-PD5T

intel第10代至尊处理器

(14核4.4Ghz)、256GB DDR4 /5*RTX3090/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

120GB

178

1425

CNN+ RNN

¥185,000

2.8 UltraLAB GT410P 144256-PD5E

intel第10代至尊处理器

(14核4.4Ghz)、256GB DDR4 /5*A6000/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

240GB 200 1560

CNN+ RNN

¥335,000

2.3 图灵超算工作站(GX630M)配置推荐-极致型

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

3.1

UltraLAB GX630M 243192-MB6X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /6*RTX3070 /1.92TB SSD+2TB M2.SSD/42TB存储/双塔式(双2000w)/27"-4K图显

48GB

122

978

CNN

¥199,990

3.2

UltraLAB GX630M 243256-MB7X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /7*RTX3070 /1.92TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显

56GB

142

1141

CNN

¥220,000

3.3

ltraLAB GX630M 243256-PC5X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/256GB DDR4 /5*RTX3080 /1.92TB SSD+4TB P-SSD/70TB存储/双塔式(双2000w)/27"-4K图显

50GB

149

1190

CNN

¥223,000

3.4 UltraLAB GX630M 241384-PC6X

2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /6*RTX3080 /1.9TB SSD+4TB P-SSD/70TB并行存储/双塔式(双2000w)/27"-4K图显

60GB 179 1428 CNN ¥248,000

3.5

UltraLAB GX630M 243192-MB4T

2*Xeon金6244(16核4.3GHz)/睿频4.3GHz/192GB DDR4 /4*RTX3090 /1.9TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显

96GB 142 1140

CNNRNN

¥256,000

3.6

UltraLAB GX630M 241384-PD5T 2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /5*RTX3090 /1.92TB SSD+4TB P-SSD/90TB并行存储/双塔/27"-4K图 120GB 178 1425

CNNRNN

¥299,000

3.7

UltraLAB GX630M 243768-180T6T

2*Xeon金6256(24核4.3GHz)/   睿频4.5GHz /768GB DDR4 /6*RTX3090(三槽)/3.84TB SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显

144GB

213

1710

性能近16块Titan V

¥375,000

 3.8 UltraLAB GX630M 243768-180T7T

2*Xeon金6256(24核4.3GHz)/   睿频4.5GHz /768GB DDR4 /7*RTX3090(双槽)/4TB P-SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显

168GB 249 1990

最快最完美,性能超DGX-2

 ¥399,900
 3.9 UltraLAB GX630M 243384-150T4E

2*Xeon金6256(24核4.3GHz)/睿频4.5GHz /384GB DDR4 /4*A6000  /4TB P-SSD+150TB并行存储/双塔式(双2000w)/32"-4K图显

192GB 160 1250

CNN+  RNN+  推理

 ¥399,900

3.10

UltraLAB GX630M 2331T-150T7E

2*Xeon金6254(36核3.9GHz)/睿频4.0GHz/1TB DDR4 /7*A6000 /双3.84TB SSD+6.4TB-P-SSD/240TB 并行存储/双塔式(双2000w) /32"-4K图显

336GB

280

2180

最强最完整

¥650,000

上述配置可以看出:

(1)UltraLAB GX630M大部分配置都已超越9块RTX2080ti/7块Titan RTX性能

(2)UltraLAB GX630M(编号3.7)的配置规格,其性能已经接近nvidia DGX-2,但其价格是DGX-2的1/10价格

欢迎测试验证

NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021相关推荐

  1. 深度学习 训练吃显卡_最新最全深度学习训练/GPU服务器硬件配置推荐2020

    人工智能随着核心算法.计算能力的迅速提升,以及海量联网数据的支持,在本世纪终于迎来了质的飞跃,人工智能将是未来应用最广泛的技术之一,在市场经济领域带来更多的机遇与机会,在医学领域可以大大加快诊断速度和 ...

  2. 深度学习之GPU环境配置

    写下此博客以纪念我这一周的折腾. 刚开始是打算在ubuntu18.04上面直接配置GPU运行环境的,然后遇到了各种问题,首先就是在terminal中输入nvidia-smi命令,出现需要你安装最新驱动 ...

  3. NVIDIA RTX A6000深度学习训练基准

    NVIDIA RTX A6000深度学习训练基准 2021年1月4日 在本文中,我们对RTX A6000的PyTorch和TensorFlow培训性能进行了基准测试.我们将其与Tesla A100,V ...

  4. 如何配置一台支持6块RTX3090静音级深度学习工作站

    nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工 ...

  5. 基于NVIDIA GPUs的深度学习训练新优化

    基于NVIDIA GPUs的深度学习训练新优化 New Optimizations To Accelerate Deep Learning Training on NVIDIA GPUs 不同行业采用 ...

  6. Ubuntu18 安装nvidia驱动进行深度学习训练

    Ubuntu18 安装nvidia驱动进行深度学习训练 安装nvidia驱动 驱动不兼容而造成系统循环登录的解决方案 安装cuda 安装cudnn 下载anacoda3 找不到conda命令的解决方法 ...

  7. windows10:GTX GeForce 1070+更新nvidia显卡驱动+CUDA+CUDNN+tensorflow_gpu深度学习GPU环境搭建(史上排雷最多版本)

    windows10 GTX GeForce 1070+CUDA9.0+CUDNN7.6.4+TensorFlow_GPU1.5 5天星期前开始搭建tensorflow GPU环境,途中屡屡踩雷, 现在 ...

  8. docker 利用docker拉取Nvidia/cuda官方镜像,部署深度学习环境

    利用docker拉取Nvidia/cuda官方镜像,部署深度学习环境 1.拉取Nvidia/cuda官方镜像 2.生成容器 3.在容器内安装深度学习环境 看完这篇博文,可以查看我总结的另一篇博文教程: ...

  9. 【深度学习】如何选择适合深度学习的GPU?

    如何选择适合深度学习的GPU? 为什么GPU比CPU更适合机器学习或者深度学习? 什么是张量处理单元(TPU)? 目前主流的GPU厂商:Nvidia和AMD 选择GPU时需要关注的主要属性 1. GP ...

最新文章

  1. linux查找技巧: find grep xargs amp;amp; linux系统信息查看大全
  2. 节省磁盘空间的新一代包管理工具PNPM
  3. NET MVC3 中的枚举多语言实现,DescriptionPairAttribute
  4. 2017年第八届蓝桥杯 - 省赛 - C/C++大学A组 - A. 迷宫
  5. 在SAP Business Application Studio里创建Fiori应用的操作流程
  6. c位边上还有什么位_【一点资讯】那些有趣而搞笑的GIF动画:为让出c位,站边上拍照还是谦虚礼貌的 www.yidianzixun.com...
  7. oracle连接工具_扯一扯Tableau软件配置数据源系列之Oracle
  8. 使用DotNetOpenAuth搭建OAuth2.0授权框架——Demo代码简单说明
  9. matlab可以用python代替吗_Python 会不会替代 MATLAB
  10. 中国可用的 BT Tracker 服务器列表,每24小时自动更新,去重,自动检测可用性
  11. 四川大学计算机学院优秀毕业论文,(完整版)四川大学本科_毕业论文(设计)_有关规定...
  12. 腾讯云图(TCV)使用指南
  13. 使用注册表管理桌面新建文件
  14. Moore型状态机和Mealy型状态机的区别以及各自Verilog的实现细节:为什么Moore型状态机需要多一个状态?怎么选择用哪一种状态机?
  15. 用户调研---问卷调查
  16. 关掉微软没用的服务,让你的电脑提速百倍(转)
  17. 百度之星资格赛1003 度度熊与邪恶大魔王
  18. Bootstrap3 与Bootstrap4垂直水平居中
  19. 数据结构实验课_实验四 队列
  20. JavaScript事件触发

热门文章

  1. Luminar Neo 教程,如何使用 Luminar Share 导入图像?
  2. 【ActionScript 学习】(一)入门
  3. arch linux配置服务器,如何在Arch Linux服务器上安装ZNC
  4. js中的枚举和不可枚举
  5. iOS 判断机型是否为iphonex
  6. 关注民生民情——华北水利水电大学“情艺”龙湖社区调查(二)
  7. 【QT开发专题-天气预报】11. 新建工程,右键菜单
  8. python中类的介绍
  9. mui如何实现扫码功能
  10. Arrays.asList 解析