最近英伟达发布了最新GPU-A100,当我们先后经历了K系列、M系列、P系列、V系列之后,这一次的A系列发布又会带来哪些影响,未来行业的走势如何,新入行的同学究竟选择哪个领域入门比较合适。今天我将从3个方向为大家一一剖析,

  • 计算力变强了,会给行业带来什么影响

  • 计算力变便宜了,会给行业带来什么影响

  • 英伟达的野心在哪里,对行业有什么影响

1 计算力变强的影响

这次新的GPU在算力方面变强的幅度是比较夸张的,根据官方数据显示,在Bert模型的场景下,训练和预测都有大幅度的提升。

同时新的机器搭载了三星的40G的超大HBM2显存。这些信号意味着什么呢?意味着计算框架的算力层面价值在弱化。过去提到TensorFlow、PyTorch,大家比的是哪种框架在分布式场景下更快,因为当模型的训练量大到单机很难在短时间内收敛,因为当模型大小大到单机内存没法承载之后,只能依赖分布式的方案去解决问题。

今天,A100即使在单机情况下也提供了可能过去可能2到5台机器的分布式能力。也就是说,今天单机的能力变强了。在计算框架层面,未来更多地需要从计算力优化的角度转向如何提升用户体验,提供更简单的开发接口。

所以,未来深度学习的开发会变得更简单,得益于框架的向用户体验转型。另外,框架级别的优化工作以及各种模型量化工作,将只在部分超大规模的应用场景下有意义。

如果把AI拆分成三层,最下方是计算力为代表的芯片GPU,中层是计算框架,最上层的是CV、ASR、推荐、NLP等业务算法。对于新入行的同学,更多地关注最上层的业务会比较保险,因为框架层的价值会随着计算力的增强而弱化(在巨头公司不会有这样的情况,这里泛指整个行业)。

2 计算力变便宜的影响

GPU发布会提到了一个观点,就是计算力的发展跟不上目前计算量的发展需求。这句话其实要延伸一下,并不是说之前V100卡不够快,一定要更快的卡才能满足用户的业务,而是V100太贵了,很多客户买不起。

英伟达应该也是意识到了这个问题,所以来了一个Slogan:“The more you buy, the more you save.”「现在,你只需要十分之一的硬件成本,二十分之一电力消耗就能做同样的事。The more you buy, the more you save !」黄仁勋说道。

计算力变便宜了,后续会对行业有什么影响呢?我们看到,虽然总体A100计算力增强了,但是单机8卡的GPU机器貌似比以前贵了,搭载8卡的DGX要卖到19.9万美元,极高的价格。这个价格会让很多腰部以下的互联网厂商放弃自建IDC GPU集群,从而选择上云,因为买几台机器就要小1千万。一家300人左右的互联网公司每年的IT成本也就1千万。所以对于云厂商来讲,关键是如何能让昂贵的单点计算机器的资源更弹性。怎么能满足客户弹性的需求,是云厂商后续要重点关注的,基于K8S的实现如何做到资源的最大限度利用,是关键。

3 英伟达的野心对行业影响

虽然GPU已经在AI的计算力方面几乎形成了垄断,但是2020财年,英伟达的利润总体出现下滑。这就意味着,单纯最底层的芯片级别的技术演进,很难形成高增长,缺少软件附加值。另外,新的A100技术架构,只有50倍左右的算力提升空间。当计算力的提升到了瓶颈,英伟达又将怎么发展。

英伟达最新的举措可以看一些端倪,在框架层面开始做很多文章,比如推出了语音交互框架Jarvis。后续英伟达一定会向上层的应用拓展业务,这样就触碰到了PyTorch、TensorFlow的领地,跟FaceBook和Google展开直接竞争。Google现在也在自己研制TPU芯片用来制衡GPU。后续的竞争可能不再是框架或者计算力的单点竞争,而是生态的竞争。

所以,今天只会TensorFlow或PyTorch都是不保险的,未来可能有新的框架进来。亘古不变的是上层的业务实现方式,了解CV的流程、ASR的流程、推荐的业务流程,这些业务的流程短时间内不会有大的变化,而且会兼容各种引擎和框架的发展,学好这些是安身立命的根本。

PS:本文只是作者自己YY,周末阅读新闻的感想,权当消遣。

独家解析英伟达最新GPU-A100对AI行业带来的影响相关推荐

  1. 下一代英伟达H100 GPU发布时,国产芯片能追上吗?

    撰文|吕坚平 继2020年GTC(GPU技术大会)发布A100 GPU,时隔两年,英伟达如所预期在今年(2022年)上GTC公布了媒体形容为"核弹"GPU的H100. 2020年G ...

  2. gpu超算算法_英伟达推GPU加速Arm服务器参考设计!微软Azure启动GPU超算实例

    芯潮(ID:aichip001)文 | 韦世玮 芯潮11月20日消息,昨天,英伟达在2019国际超级计算大会(SC19)上推出用于构建GPU加速Arm服务器的参考设计,以及用于优化网络和存储数据处理的 ...

  3. StyleGAN3重磅发布!皮肤、毛发不再粘屏幕,还能360度旋转!英伟达最新开源

    转载自:AI科技评论 作者 | 琰琰.青暮 太狂野了! 你永远不知道StyleGAN的想象力可以有多强大. 刚刚英伟达最新推出的升级版StyleGAN 3,因为一组合成艺术作品刷爆Twitter,不少 ...

  4. 英伟达 (Nvidia) GPU 系统管理界面(SMI)

    英伟达 (Nvidia) GPU 系统管理界面(SMI) 公众号文章链接 "通过 Linux 系统查看 Nvidia GPU 的系统管理界面(System Management Interf ...

  5. 英伟达发布 GPU 驱动更新,修复25个漏洞

     聚焦源代码安全,网罗国内外最新资讯! 编译:代码卫士 英伟达发布 Windows 版本的 GPU 显示驱动安全更新,修复了25个漏洞,含7个高危漏洞,其中1个高危漏洞可导致攻击者实现代码执行和权限提 ...

  6. nvidia 英伟达 显卡 GPU 的计算能力

    nvidia 英伟达 显卡 GPU 的计算能力 https://developer.nvidia.com/zh-cn/cuda-gpus

  7. 2080 Ti莫名起火,英伟达承认GPU有缺陷,财报后股价暴跌19%

    岳排槐 安妮 发自 亚龙湾 量子位 出品 | 公众号 QbitAI △ 预购界面 RTX 2080 Ti,英伟达新一代图灵架构GPU,因为独特而鲜明的外观,一直以来被大家戏称为"燃气灶&qu ...

  8. 英伟达凭借GPU与AI笑傲本届CES展会

    英伟达公司联合创始人兼CEO黄仁勋在本周三晚身着大家熟悉的黑色夹克再度亮相消费电子展(简称CES),并致开幕主题演讲. 我们很难想象其它芯片厂商的CEO会像他这样,在全球最大的贸易展会之一上受到与会者 ...

  9. 英伟达登录界面卡住_免费!Google Colab现已支持英伟达T4 GPU

    [新智元导读]Google Colab现在提供免费的T4 GPU.Colab是Google的一项免费云端机器学习服务,T4GPU耗能仅为70瓦,是面向现有数据中心基础设施而设计的,可加速AI训练和推理 ...

最新文章

  1. 命名实体识别训练集汇总(一直更新)
  2. 判断一个数列是不是搜索二叉树后续遍历输出的结果
  3. paip.语义分析--单字词名词表
  4. 定时器Timer和Ticker
  5. 嗯?time命令Linux time // 对比印象中的time()函数
  6. VS2013 MFC基于对话框编程(创建工程)
  7. Linux mint 17中文输入法安装,改动linux mint与windows7双系统启动顺序
  8. STM32之SysTick例程
  9. 构建一个可靠的分布式计数器--memcached之incr/decr操作实战分析
  10. 细说Oracle11g RAC的IP地址
  11. 默认smtp虚拟服务器,轻松架设自己的SMTP服务器
  12. thinkphp实现商城
  13. 应用随机过程张波商豪_应用随机过程张波课后答案
  14. 关于路由器,锐捷破解,mentohust的使用
  15. setoolikt制作钓鱼网站
  16. 电池SOC仿真系列-Battery模块
  17. 计算公民身份号码校验码(C++)
  18. 【python】OpenCV—Brightness and Contrast adjustments
  19. 安科瑞ACX电瓶车智能充电桩,支付方式可选择刷卡、扫码、免费充电使用,设备内部可引出10路出线至专用插座
  20. win10将HTML动态做桌面壁纸,Win10 怎么制作动态界面壁纸

热门文章

  1. PAT甲级1060 Are They Equal:[C++题解]字符串处理、有效数字、代码简洁!!!
  2. 王式安概率论与数理统计基础课手写笔记-第一章概率与事件-第二章随机变量及其分布
  3. 通信网络基础期末复习-第一章和第二章-概论和端到端的传输协议
  4. python和c语言相通吗_python和C语言互相调用的几种方式
  5. java collections.sort 忽略大小写排序_Java Spring Mongo排序忽略大小写问题
  6. python写魔兽世界脚本_用python bat写软件安装脚本 + HM NIS Edit自动生成软件安装脚本...
  7. php常量定义表达式,从表达式创建PHP类常量的最佳解决方法?
  8. php怎么随机显示6个数,PHP里一个12成员的数组,随机挑出6/3/3个成员(不重复),然后重新赋值,有什么简洁的办法实现?...
  9. STM32外设之GPIO的推挽输出和开漏输出模式详解
  10. java将数据封装为树结构_JAVA代码实现多级树结构封装对象