2020 年,什么样的 GPU 才是人工智能训练的最佳选择?

我在自己的网站中专门介绍过GPU的一些硬件基础知识:https://lulaoshi.info/gpu/gpu-basic/gpu.html。英伟达为优化深度学习的矩阵运算,在较新的微架构中,专门设计了Tensor Core这样的混合精度核心,因此,人工智能训练最好选择带有Tensor Core的GPU。

我和滴滴云有一些合作,没有GPU的朋友可以前往滴滴云上购买GPU/vGPU/机器学习产品,记得输入AI大师码:1936,可享受9折优惠。GPU产品分时计费,比自己购买硬件更划算,请前往滴滴云官网http://www.didiyun.com购买。

众所周知,当今业界领先(State-of-the-art)的深度学习模型都会占用巨大的显存空间,很多过去性能算得上强劲的 GPU,现在可能稍显内存不足。Lambda实验室2020年2月发布了一篇显卡横向测评文章https://lambdalabs.com/blog/choosing-a-gpu-for-deep-learning/,探讨了哪些GPU可以在不出现内存错误的情况下训练模型,这些显卡更适合个人电脑和小型工作站。该篇文章的核心结论是,显存大小非常重要。是的,显存大小正在制约着很多深度学习模型的训练。

因为深度学习技术的突飞猛进,以前 12G 内存打天下的局面不复存在了。2020 年 2 月,你至少需要花费 2500 美元买上一块英伟达最新款的 Titan RTX 才可以勉强跑通业界性能最好的模型,那到今年年底会是什么样就无法想象了。

消费级

对于个人用户,英伟达消费级的GeForce系列是首选。比较经济的选项有:

  • GeForce RTX 2080 Ti:1200美元,11GB显存,Turing微架构(支持Tensor Core)
  • Titan RTX:2500美元,24GB显存, Turing微架构(支持Tensor Core)

需要注意的是,这些消费级显卡对多卡并行支持不好,默认情况,他们不支持多卡间直接通信,如果我们希望卡1和卡2之间相互通信,那么数据会先从卡1的显存通过PIC-E总线拷贝回主存,再从主存通过PCI-E拷贝到卡2的显存,这样显然非常浪费时间,不利于多卡之间的通信。2080 Ti和Titan RTX对于多卡之间PCI-E通道的P2P(Peer-to-Peer)通信支持并不好,但并不意味着他们不支持NVLink,用户可以通过购买NVLink桥接器来构建多卡之间的通信通道。有人称这个问题是这两款GPU的设计缺陷,也有人认为英伟达有意为之,为的是让有多卡并行计算需求的人去购买Telsa系列GPU。

企业级

数据中心的GPU产品更贵,适合企业级用户,它们的显存更高,也可以更好地支持多卡并行。

  • Quadro RTX 6000:4000美元,24GB显存,Turing微架构(支持Tensor Core)
  • Quadro RTX 8000:5500美元,48GB显存,Turing微架构(支持Tensor Core)
  • Telsa V100:16或32GB显存两个版本,PCI-E和NVLink两个版本,Volta微架构(支持Tensor Core)
  • Telsa V100S:32GB显存,PCI-E总线,Volta微架构(支持Tensor Core)

企业级的GPU一般都必须插到服务器或工作站上,这些服务器和工作站本身也不便宜,尤其是支持Telsa平台的服务器在十万元级别。当然,这里没有考虑机房建设、电费等成本。

2020年5月英伟达GTC 2020上发布了新一代Ampere微架构以及Telsa A100显卡,A100显卡的人工智能训练和推理能力更强,而且单个A100可以被分割成最多7个独立GPU来处理各种计算任务。

有多卡并行训练任务的朋友,建议选择支持NVLink的Telsa系列显卡。

小结

如果进行深度学习研究,GeForce RTX 2080 Ti(11GB)可能是起步标配;Titan RTX(24GB)是个不错的选项,兼顾了价格、显存和计算性能。对于企业级用户,Quadro RTX 8000(48GB)、Telsa V100(32GB)等显卡适合深度学习领域的前沿研究人员。2020年下半年,英伟达新的计算平台即将出货,新产品一方面会带来更强大的性能,另一方面也会使现有产品降价。

在物理硬件昂贵的当下,或许我们应该把目光转向云端GPU。

跑深度模型的显卡_人工智能研究者应该选择哪款显卡?相关推荐

  1. 跑深度模型的显卡_2020年人工智能深度学习 GPU 解决方案推荐

    纵观人类几百年来的科技发展史,几乎所有的新兴学科的发展背后都有两个字--"烧钱"! 作为近年来最火热的行业--人工智能,在烧钱方面同样不遑多让.众所周知,人工智能的训练和推理都需要 ...

  2. 跑深度模型的显卡_近乎白嫖!我的深度学习云GPU平台!便宜、好用、速来!

    PS:金秋十月感恩回馈 1.活动期间使用长租功能(按月.季度),并且不退租,除了享受平台上标示的折扣,官方额外再补贴(5%): 2.邀请一位真实有效GPU用户(比赛用户.研究生优先)奖励4000DBC ...

  3. 跑深度模型的显卡_不止显卡!这些硬件因素也影响着你的深度学习模型性能

    加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...

  4. 跑深度模型的显卡_GPU必知必会 | 哪款显卡配得上我的炼丹炉

    公众号关注 "Python遇见机器学习" 设为"星标",第一时间知晓最新干货~ 本文转载自机器之心 众所周知,深度学习是一个很吃算力的领域,所以,GPU 选得好 ...

  5. 跑深度模型的显卡_A100跑DeepFaceLab,日迭代破百万,像素上800!

    昨天用滴滴云的A100做了下TenorFlow的基准测试,可能略显抽象!今天来跑跑DeepFaceLab,整体来说A100还是挺强! 已经连续看了两天命令行和数字了,头围有所增加! 环境配置: 主角: ...

  6. 判断深度学习模型的稳定性_人工智能干货|一线工程师带你学习深度学习模型量化理论+实践...

    2019年的最后一天,送给自己一份特殊的礼物. 模型量化作为一种能够有效减少模型大小,加速深度学习推理的优化技术,已经得到了学术界和工业界的广泛研究和应用.模型量化有 8/4/2/1 bit等,本文主 ...

  7. bandizip最后一个无广告版本_如果非要选择一款压缩软件的话——Bandizip

    全世界只有不到0.00~1 % 的人关注了我们 得到你的关注是小帮的幸运 压缩解压软件是电脑一个必备软甲,前面的文章介绍了一款开源小巧无广告的压缩解压软件windows工具软件选择之压缩软件--7-Z ...

  8. 用超算平台跑深度学习模型【新用户赠送200元体验金】

    文章目录 前言 一.北鲲云-一站式云超算平台介绍 二.如何领取 总结 前言   最近在训练YOLO模型,奈何自己的笔记本跑不起来,通过朋友介绍,才了解到北鲲云--一站式超算平台,跑深度模型真的很nic ...

  9. 计算机由哪几种显卡,各类显卡大比拼,你会选择哪一款显卡使用?

    对于很多PC端电脑使用者来说,电脑的配置要求是越高越好.现如今,伴随着电脑的功能越做越完善,越来越优秀,相应的对电脑的硬件要求月来越高,很多人电脑的硬件跟不上,这个时候就要更换电脑的硬件来迎合越来越高 ...

  10. 深度学习 训练吃显卡_在深度学习中喂饱GPU

    原标题:在深度学习中喂饱GPU 新智元推荐 来源:知乎专栏 作者:风车车 [新智元导读]深度学习模型训练是不是大力出奇迹,显卡越多越好?非也,没有512张显卡,也可以通过一些小技巧优化模型训练.本文作 ...

最新文章

  1. Android Studio编译好的apk放在哪里?
  2. SAP QM QM11显示Quality Notification List
  3. 史上最全的SpringMVC学习笔记
  4. React 组件 API
  5. 注解动态赋值_Java注解是如何玩转的,面试官和我聊了半个小时
  6. 一种M2M业务的架构及实现M2M业务的方法
  7. 无法远程到2008R2的解决方法
  8. Python列表:list
  9. 【报告分享】2020成人用品报告-京东大数据研究院.pdf(附下载链接)
  10. SQLExpress免费版配置本地数据库实例
  11. 运放失真罪魁祸首之压摆率和增益带宽积
  12. 计算反转录转座子插入时间二:提取成对LTRs序列
  13. 谷歌翻译字数限制_如何始终在Google文档中显示字数统计
  14. 可视化项目管理,项目进度管理必备工具
  15. 【入门案例系列】学英语太难?这款英语单词小游戏教你一键学会。
  16. android 验证邮箱格式,android开发中, 如何验证邮箱的格式 ?
  17. 定时任务(三)动态配置定时任务
  18. 基于SVM算法的股票预测分析
  19. 怎样把软件从计算机移到桌面上,怎么把电脑软件移动到D盘
  20. 【高级UI】【004】MeasureSpec测量模式

热门文章

  1. python 实现抖音视频无水印解析
  2. STM32F103C8T6开发环境的搭建
  3. 400多个JavaScript特效大全
  4. iOS 适配iPhone XR/XS/XS MAX
  5. “移动媒体产品”的三个方向
  6. 计算机的键盘应用,电脑键盘应用小知识
  7. oracle字段名小写改大写,Oracle数据库中如何实现将将表中字段名转换为大写
  8. 核桃油是孕妇的最佳食用油吗?
  9. html5 h5是什么,H5和HTML的区别是什么
  10. 鲁百年创新设计思维学习总结