点上方计算机视觉联盟获取更多干货

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:机器之心

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

又到了人们喜闻乐见的显卡对决时间。

虽然如今人们用来训练深度学习的 GPU 大多出自英伟达,但它旗下的产品经常会让人在购买时难以抉择。

去年 12 月,英伟达将专业图形加速显卡产品线更新至安培架构,其中最高端的 RTX A6000 是最被人关注的一款。

在基本规格上,A6000 基于完整的 GA102 GPU 核心打造,内建 10752 个 CUDA 核心和第三代 Tensor Core,单精度浮点性能达到了 38.7 TFLOPs。它的显存容量达到 48GB,类型是 GDDR6(16Gbps,GDDR6X 因为单芯片容量低而未使用),支持 ECC 校验。

A6000 采用了传统涡轮直吹风扇设计,可搭建 96GB 显存的双卡系统,PCIe 4.0 x16 插槽,提供 4 个 DP 1.4 接口(没有 HDMI),额定功耗 300W。这款显卡的定价为 5500 美元(约合 3.6 万元)。

而更早推出的旗舰消费级显卡 RTX 3090 无论是从性能还是能效都达到了前代产品的两倍,在开始出售的一段时间因为芯片产能受限等问题而一卡难求。

作为游戏玩家和深度学习从业者眼中目前最强大的显卡,3090 拥有 10496 个 CUDA 核心,FP32 浮点性能为 35.6 TFLOPs。它的显存容量为 24GB,材质也是最贵的 GDDR6X,又因为支持 HDMI 2.1 而可以实现 4k 高刷新率或 8k 游戏,额定功耗 350W。RTX 3090 的售价是 1500 美元(国行公版 11999 元)。

对这两款显卡进行评测的 Lambda 是一家构建深度学习服务器的公司,他们提供专用的 AI 训练计算机,也经常发布深度学习硬件的测评。在这次评测中,人们对这些顶级 GPU 在深度学习框架 PyTorch 上的模型训练速度进行了对比。

A6000 对 3090,这是英伟达两条产品线上最强显卡的对决,身处深度学习实验室的你当然希望知道它们孰优孰劣。不过讲道理,看到这个标题第一反应还是买不起:

听君一席话如同听君一席话,总之还是买不起。

从评测结果上来看,买 RTX A6000 花上三倍的钱并不能让你在深度学习的任务上获得多少优势:

  • 使用 PyTorch 训练图像分类卷积神经网络时,在 32-bit 精确度上,一块 RTX A6000 的速度是 RTX 3090 的 0.92 倍;如果使用混合精度则是 1.01 倍。

  • 使用 PyTorch 训练语言模型 transformer 时,在 32-bit 精确度上,一块 RTX A6000 的速度是 RTX 3090 的 1.34 倍;使用混合精度也是 1.34 倍。

  • 在并联多卡时,使用 PyTorch 训练图像分类卷积神经网络,在 32-bit 精确度上,八块 RTX A6000 的速度是八块 RTX 3090 的 1.13 倍;如果使用混合精度则是 1.14 倍。

  • 使用 PyTorch 框架训练语言模型 transformer,在 32-bit 精确度上,八块 RTX A6000 的速度是八块 RTX 3090 的 1.36 倍;如果使用混合精度则是 1.33 倍。

所以,看来如果想在深度学习任务上展现 A6000 的能力,还需要多买几块 GPU。

3090 和 A6000 在 PyTorch 卷积神经网络训练上的能力对比

如图所示,使用单块 RTX A6000 进行图像模型的 32 位训练时要比使用单块 RTX 3090 稍慢。但由于 GPU 之间的通信速度更快,显卡越多则 A6000 优势越明显。视觉模型的测试成绩是在 SSD、ResNet-50 和 Mask RCNN 上取平均值得出的。

3090 和 A6000 在 PyTorch 框架上训练语言模型的能力对比

与图像模型不同,对于测试的语言模型,RTX A6000 始终比 RTX 3090 快 1.3 倍以上。这可能是由于语言模型对于显存的需求更高了。与 RTX 3090 相比,RTX A6000 的显存速度更慢,但容量更大。语言模型的测试结果是 Transformer-XL base 和 Transformer-XL large 的平均值。

请注意,在这里 GPU 的并联都使用了 NVLink 而不是 SLI。不过根据硬件本身的机制,如果使用 SLI 性能损失会更大,所以并没有理由使用后者。

Lambda 开放了此次测评的代码:https://github.com/lambdal/deeplearning-benchmark

看到这里,你应该能找到自己的 GPU 选择了。未来,这家公司还将计划使用和本次测试同样的内容,研究 3080Ti 的深度学习能力。

参考内容:

https://lambdalabs.com/blog/nvidia-rtx-a6000-vs-rtx-3090-benchmarks/

-------------------

END

--------------------

我是王博Kings,985AI博士,华为云专家、CSDN博客专家(人工智能领域优质作者)。单个AI开源项目现在已经获得了2100+标星。现在在做AI相关内容,欢迎一起交流学习、生活各方面的问题,一起加油进步!

我们微信交流群涵盖以下方向(但并不局限于以下内容):人工智能,计算机视觉,自然语言处理,目标检测,语义分割,自动驾驶,GAN,强化学习,SLAM,人脸检测,最新算法,最新论文,OpenCV,TensorFlow,PyTorch,开源框架,学习方法...

这是我的私人微信,位置有限,一起进步!

王博的公众号,欢迎关注,干货多多

王博Kings的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(上)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(下)

博士笔记 | 周志华《机器学习》手推笔记第九章聚类

博士笔记 | 周志华《机器学习》手推笔记第十章降维与度量学习

博士笔记 | 周志华《机器学习》手推笔记第十一章稀疏学习

博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论

博士笔记 | 周志华《机器学习》手推笔记第十三章半监督学习

博士笔记 | 周志华《机器学习》手推笔记第十四章概率图模型

点分享

点收藏

点点赞

点在看

羡慕的泪水!显卡对决!GPU A6000和RTX 3090 性能对比相关推荐

  1. 目标检测第4步:显卡、GPU、CUDA、cuDNN的介绍及如何在Windows 10下安装cuDNN?

    (请先看置顶博文)本博打开方式!!!请详读!!!请详读!!!请详读!!!_Cat-CSDN博客 目录 (请先看置顶博文)本博打开方式!!!请详读!!!请详读!!!请详读!!!_Cat-CSDN博客 一 ...

  2. 京东宣布全员涨薪两个月! 打工人流下了羡慕的泪水

    京东今天上热搜了,全员涨薪两个月. 7月13日,京东集团宣布,自2021年7月1日开始到2023年7月1日,用两年时间,将员工平均年薪由14薪逐步涨至16薪,在2021年7月1日之前的基础上直接涨薪两 ...

  3. 【机器学习】显卡、GPU、NVIDIA、CUDA、cuDNN

    文章目录 一.显卡和GPU 1. 显卡是什么? 2. GPU是什么? (1)GPU和显卡的关系 (2)GPU的由来与发展 二.CUDA 1. CUDA是什么? 2. 为什么推出CUDA? 三.cuDN ...

  4. 如何获取显卡的GPU占用率和显存占用情况

    在游戏的性能调优过程中,经常会需要获取CPU占用率.IO.显卡GPU占用率等基础性能数据,下面就简述一下获取nvdia显卡GPU占用率的方法. nvdia 显卡在驱动安装后,可以通过nvapi.dll ...

  5. NVIDIA显卡(GPU)性能参数一览表

    本贴列举了NVIDIA29款主流显卡(GPU)的性能参数及价格,供大家在选购时参考.(若有错误,也请指正) NVIDIA 显卡性能参数一览表 英伟达官网原话: 建议消费者认准 NVIDIA 在中国大陆 ...

  6. windows查看nvidia显卡(GPU)的利用率和温度

    windows如何查看nvidia显卡(GPU)的利用率和温度 只要在文件夹C:\Program Files\NVIDIA Corporation\NVSMI里找到文件nvidia-smi.exe,把 ...

  7. windows10下如何查看nvidia显卡(GPU)的利用率和温度(以及显卡正常温度的范围)

    一.如何查看nvidia显卡(GPU)的利用率和温度 步骤: 1.win+R,再输入'CMD'进入命令行模式 2.输入命令(直接复制即可):cd C:\Program Files\NVIDIA Cor ...

  8. windows如何查看nvidia显卡(GPU)的利用率和温度

    windows如何查看nvidia显卡(GPU)的利用率和温度 nvidia-smi 只要在文件夹C:\Program Files\NVIDIA Corporation\NVSMI里找到文件nvidi ...

  9. 显卡、GPU和CUDA简介

    小白真的一直搞不懂什么是 显卡,GPU,CUDA? 互联网的信息共享,真的是造福人类,大牛对世界的解读也总是能造福我们这种对世界知之甚少的小白.从某只大佬那里窃取点信息,以便日后回顾. 什么是显卡? ...

最新文章

  1. 利用WiFi模块实现MicroPython远程开发
  2. 使用redis4.0.1和redis-cluster搭建集群并编写重启shell脚本
  3. 中职学校计算机教学中论文,中职学校计算机教学论文
  4. Windows完成端口的理解
  5. mysql挂载到iscsi_corosync+pacemaker+iscsi磁盘实现mysql高可用
  6. Java SE中的Bootstrap CDI 2.0
  7. Vue(ES6)中的data属性为什么不能是一个对象?
  8. oracle9i使用OMS备份数据
  9. ecshop 支持 php,ecshop支持PHP7的修改方法
  10. Windows下设置Mongodb用户名密码
  11. Fiddler抓取Chrome最新版HTTPS设置
  12. python语言后缀_在Python语言中,可以作为源文件后缀名的是
  13. enum ordinal java_Java Enum ordinal()方法
  14. 【Win10如何给桌面文件夹自定义图标】怎么改应用图标1.回收站,垃圾桶图标改为pop猫+2.如何把icon图标打包成dll然后在修改文件夹图标时在该dll中选择,用Resource Hacker
  15. 股市行情图原来是这样实现的
  16. 【qq音乐歌曲下载转换为mp3格式】
  17. 使用Scikit-learn开启机器学习之旅
  18. vue 报错:Templates should only be responsible for mapping the state to the UI. Avoid placing tags with
  19. 关于逻辑回归中的Enter以及stepwise的区别
  20. 大学物理实验试卷1到8_15_试卷(光学,大学物理实验)_doc_大学课件预览_高等教育资讯网...

热门文章

  1. mcrypt拓展_【PHP】Mcrypt 扩展模块安装及使用
  2. mysql 计算近30天总金额_MySQL数分实战:咖啡店精细化运营
  3. pc显示器分辨率 前端_明基透露索尼PS5可提供1440p分辨率选项
  4. 查看zookeeper二进制日志方式
  5. 专利翻译常用计算机词汇,基于NP树的英文专利文献术语自动翻译技术研究-计算机应用技术专业论文.docx...
  6. pages文件服务器地址,Pages怎么设置目录 Pages如何设置目录
  7. centos mysql无法启动 sock_【零基础学云计算】MYSQL的主从复制、读写分离
  8. php curl 发送post请求带参数
  9. kali 无法使用ifconfig等常用命令
  10. JavaScript循环及练习