30系显卡买不到?英伟达老黄刚刚又发布一款“空气CPU”

不过就算你抢不到也没关系,因为这款CPU专门为服务器设计,到2023年才能发布。

刚刚,在英伟达举办的GPU技术大会上(其实会场就是老黄家的厨房),黄仁勋发布了全新ARM架构CPU,也是英伟达首款服务器CPU——Grace

这款CPU专为处理大量数据的AI任务而生。老黄说,如果服务器用上这款CPU,那么AI性能将超过x86架构CPU的10倍

去年,老黄就是在这里发布了A100、RTX 30系列GPU。今年,这位皮衣男的头发更长了,也更白了。

除推出首款服务器GPU外,英伟达还要把ARM架构带到笔记本上。

如果用一句话概括这场发布会,那就是老黄想用ARM革x86的命,毕竟英伟达是准备用400亿美元收购ARM的。

PPT级CPU

全新的CPU以女程序员先驱Grace Hopper的名字命名,有趣的是英伟达的GPU是以男性科学家的名字来命名的:图灵、安培……现在英伟达的两条产品线实现了梦幻联动。

RTX 30系显卡是因为买不到而被叫做“空气”,那么Grace CPU被叫做空气的原因是,这款产品实在是“太PPT”了。

正式发布时间在2年后,什么整数浮点运算性能、主频参数统统没有,连制程工艺也语焉不详,如果不出意外,应该是5nm。

英伟达只在发布会上透露,Grace在SPECrate2017_int_base基准测试中超过300分,可以与AMD第二代64核EPYC中的某些CPU相媲美。

再看看这一个月里AMD和Intel发布的服务器GPU那一大串参数,这不就是“空气”吗!

既然什么参数都没有,唯一参数也只和AMD上一代ETPC持平,老黄为何敢拍着胸脯说Grace比其他x86架构强10倍呢?

因为,在数据传输速度这件事上,Grace比AMD和Intel跑得快多了。

这对于AI任务太重要了。英伟达的GPU用于深度学习,而CPU、内存和GPU之间的通信速度往往拖了AI的后腿。

过去,CPU和GPU之间靠PCIe总线进行数据传输,两种不同架构硬件之间的沟通太慢。

而x86架构CPU又不支持英伟达自有的NVLink,所以最好的办法是自己造一个CPU,专门为大量数据的AI任务而生。

Grace和英伟达GPU之间通过NVLink 4进行通信,从GPU到CPU之间的传输速度高达900GB/s,比AMD EPYC 2+NVIDIA A100的搭配快14倍。

 Grace与AMD CPU传输速率对比(图片来自AnandTech)

另外,Grace也有着最高的内存带宽500GB/s,且支持LPDDR5x ECC内存,能效比其他产品高10倍。

这款CPU我们何时才能见到呢?

现在已经有两个大客户了,其中瑞士国家计算中心正在建造全球最快AI超算算力达20EFLOPS;美国洛斯阿拉莫斯国家实验室也将为其研究人员配备搭载Grace的新AI超算。

至于Grace的一个可能用途,是用来训练下一代超过1万亿参数的NLP模型,GPT-4就靠它了。

ARM笔记本也能有独显

取代x86的野心不仅在服务器端,英伟达还要把ARM带到PC平台上。

但英伟达不是自己制造笔记本CPU,而是与联发科合作。

未来英伟达RTX笔记本显卡将支持ARM架构CPU,将光追和AI技术带到ARM平台上。目前双方已经开发了支持Chromium、Linux两种开源系统的SDK参考平台。

联发科CEO表示,GPU加速将对整个Arm生态系统产生巨大的推动作用。

希望Windows能在ARM软件生态上给力,用上ARM架构的独显游戏本也许不是梦了。

自动驾驶芯片

老黄在发布会上表示,将于2022年投产Orin自动驾驶芯片。

虽然我们到明年才可能看到搭载Orin的汽车,但是这不妨碍英伟达发布下一代自动驾驶芯片Atlan

Atlan算力达到1000TOPS,是上一代Orin芯片的4倍,为2025年诞生的汽车设计。

英伟达宣布与沃尔沃深化合作,明年沃尔沃将从新款XC90开始搭载Orin系统,并在2025年款车型中搭载最新的Atlan系统。

更多AI落地

Nvidia发布了用于训练大规模Transformer模型的“威震天”——Megatron Triton推理服务器。

Transformer模型的参数规模正以指数级增长,每两个半月翻一倍。Nvidia预计明年将会出现万亿级参数的模型。

以GPT-3为例,使用双路CPU的服务器进行一次128个单词的查询就要超过一分钟。

Megatron Triton通过多GPU、多节点推理,可以在1秒内同时进行16次这样的查询。

会上还发布了药物研发领域的Clara Discovery产品,包括医学影像、基因组分析、量子化学、寻找新化合物等方面。

CuQuantum,用GPU加速量子电路模拟,适用于张量网络求解和状态向量求解。在测试中,将双CPU需要10天完成的任务缩短到2小时。

除此之外,还有多模态实时对话AI平台Jarvis的1.0公测版,能够实现语音识别、语言理解、翻译,以及在合成语音中表现出情绪。

以及开源推荐系统框架Merlin。在测试中实现10-50倍的ETL加速。

Jarvis和Merlin都已可以在Nvidia NGC中下载。

还要打造虚拟世界

Nvidia还宣布夏季推出元宇宙产品Omniverse企业授权许可,用于让团队在虚拟世界中异地实时协作。

元宇宙(Metaverse),1992年由尼尔·斯蒂芬森于在科幻小说《雪崩》中提出,是一个与现实世界相互影响的虚拟世界,就像《头号玩家》中展示的那样。

NVIDIA Omniverse是一个云原生平台,除了视觉模拟外、还进行高精度的材料和物理学模拟并与NVIDIA AI完全集成。

除了娱乐外,Omniverse可用于机器人训练,通过创造工厂的数字重建,在虚拟环境中训练好的机器人AI可以直接部署到真实环境中。

老黄还展示了与宝马公司合作的项目,通过模拟了31家宝马工厂的生产流程,并在数字环境中进行优化,将生产效率提升了30%。

显卡呢?

说了这么多乱七八糟的,老本行显卡呢?

Nvidia公布了8款为下一代笔记本电脑、台式机和服务器推出八款全新安培架构显卡RTX A系列。

A系列为用于图形设计的专业卡,搭载下一代RTX技术。

其中RTX A5000桌面卡提供24G显存。而A2000-A5000的移动版将搭载第三代MAX-Q技术,在不影响笔记本轻薄属性下提供更高性能。

参考链接:

[1]https://nvidianews.nvidia.com/news/nvidia-announces-cpu-for-giant-ai-and-high-performance-computing-workloads
[2]https://www.anandtech.com/show/16610/nvidia-unveils-grace-a-highperformance-arm-server-cpu-for-use-in-ai-systems
[3]https://www.engadget.com/nvidia-mediatek-arm-pcs-gpus-170021586.html

重磅!DLer-AI顶会交流群已成立!

大家好,这是DLer-AI顶会交流群!首先非常感谢大家的支持和鼓励,欢迎各位加入DLer-AI顶会交流群!本群旨在学习交流人工智能顶会(CVPR/ICCV/ECCV/NIPS/ICML/ICLR/AAAI等)、顶刊(IJCV/TPAMI/TIP等)写作与投稿事宜。包括第一时间发布论文信息和公开演讲视频,以及各大会议的workshop等等。希望能给大家提供一个更精准的研讨交流平台!!!

添加请备注:AI顶会+学校/公司+昵称(如CVPR+上交+小明)

???? 长按识别添加,即可进群!

英伟达颠覆CPU!Arm架构专为AI而生,性能超x86十倍相关推荐

  1. 英伟达发布“空气CPU”,Arm架构专为AI而生,性能超x86十倍,与自家GPU更搭

    梦晨 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 30系显卡买不到?英伟达老黄刚刚又发布一款"空气CPU". 不过就算你抢不到也没关系,因为这款CPU专门为服务器 ...

  2. amd cpu排行_【每日热点】长盈精密成功开发纽扣电池壳体组件;AMD处理器全球份额有望达到20%;英伟达承诺将ARM总部留在英国...

    数据铸造影响力 关注每日行业热点资讯,掌握业界动态趋势,以下是今天的精彩内容:1.长盈精密:成功开发纽扣电池壳体组件 并实现大批量交货2.AMD笔记本电脑处理器全球市场份额今年有望达到20% 3.富临 ...

  3. 英伟达收购,ARM也要变美国公司,国产芯出路几何?

    作者 | 马超 编辑 | 高卫华 出品 | AI科技大本营(ID:rgznai100) 近日,美国图形处理芯片公司英伟达宣布,将以400亿美金的价格收购英国芯片技术公司Arm.如果这笔交易达到,将成为 ...

  4. 官宣!英伟达终止收购ARM,后者开始准备IPO

    NEW 关注Tech逆向思维视频号 最新视频→[揭秘北京冬奥八大比赛场馆] 2月8日消息,当地时间周一,美国芯片巨头英伟达和日本软银集团正式宣布,终止此前有关英国芯片设计公司Arm的收购交易.尽管双方 ...

  5. arm nodejs_英伟达打算收购Arm,或将成有史以来最大半导体收购案

    蓝字关注我们 EETOP EETOP创芯网(易特创芯):国内著名的老牌电子工程师社区及半导体行业门户网站(150万会员) www.eetop.cn bbs.eetop.cn blog.eetop.cn ...

  6. 他来了他来了,英伟达发布全新Hopper架构GPU“H100”4nm制程800亿晶体管

    1616AI开放平台-AI星球原创文章 转载请注明出处 英伟达重磅发布全新Hopper架构 3月22日,在2022 GTC大会上,NVIDIA 重磅推出"核弹级" Hopper 架 ...

  7. AI一分钟 | 英伟达发布最强核弹—无人车AI芯片DRIVE Xavier;百度硅谷首次开放无人车试乘:上车前要先签免责书

    一分钟AI 2018 年国家自然科学基金申请代码出炉,新增人工智能与交叉学科两大领域. 欧洲的无人驾驶汽车软件公司AImotive完成第三轮3800万美元融资,将用于扩大AImotive在全球范围内的 ...

  8. 比英伟达便宜4000元、功耗更低、游戏性能相同,AMD发布RX 6900 XT旗舰显卡

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI AMD全新Radeon RX 6000系列显卡来了! 今天凌晨,苏妈携RX 6800.RX 6800 XT.RX 6900 XT三款新显卡 ...

  9. 英伟达、Google与Adobe陆续推出AI模型,未来还会有多少职业会被取代?

    3月21日晚,关于GPT的热点依然在继续. 在一年一度的GTC大会上,英伟达发布了新显卡H100 NVL,它拥有双GPU NVLink与188GB HBM3内存,专为算力需求巨大的ChatGPT而设计 ...

最新文章

  1. php 尾递归,关于尾递归的使用详解
  2. 揭秘|超乎想象!未来50年将出现的九大黑科技……
  3. 七值逻辑与基本数据类型
  4. HashTable数据类型的增删改查操作0404
  5. 韩顺平php视频笔记69 静态变量与静态方法
  6. 老式计算机显示器是什么类型的,电脑显示器面板类型有哪些,显示器什么面板好?...
  7. win11环境变量如何打开 Windows11查看环境变量的步骤方法
  8. Hive多用户模式搭建
  9. debian:必须有官方源,难道国内镜像都是僵尸源?
  10. kitti2bag将KITTI原始数据转换为rosbag
  11. arm体系结构编程-入门介绍
  12. android绑定两个ip,安卓手机模拟器如何多开切换IP防封号的最新方法介绍
  13. 部落优势服务器,魔兽怀旧服联盟优势服有哪些?怀旧服联盟优势服务器一览
  14. 旺旺号userid转换店铺shopid和评分性别
  15. vim 打开php 回车没了,设置 - VIM在Fi结束时禁用自动换行
  16. 企业员工全面激励训练整体解决方案 (节选)
  17. 李迟2022年5月工作生活总结
  18. python隐藏源码,生成pyd文件并调用的完整过程
  19. 听音乐用什么蓝牙耳机好?听音乐音质好的蓝牙耳机推荐
  20. 曼谷周末游(r5笔记第74天)

热门文章

  1. php学习_第6章_PHP的语言结构
  2. HP-UX下查询函数是否为线程安全的方法
  3. centos 安装java web_centos6.9 安装JAVA-WEB环境
  4. 高中计算机二级考试是考什么时候,浅谈有效实施高中计算机教学的方法_计算机二级考试时间...
  5. java递归实现数组逆序_Java实现数组全排序(递归)
  6. 解吧源码解析重点看withWeight
  7. 2021-06-29快速找出Excel表格中两列数据不同内容的3种方法!
  8. github md文件里显示markdown公式的解决办法
  9. 什么是RDF resource Description framework
  10. 同时用引用和指针 int *a;