编译 | 禾木木

出品 | AI科技大本营(ID:rgznai100)

看到下面这个老黄是不是觉得很Q~

11月9日,GTC 大会再次来了,英伟达创始人兼CEO黄仁勋再次从自己虚拟厨房走出来。

本次 GTC 大会都有哪些亮点呢?

Q 版黄仁勋

英伟达展示过如何使用 Omniverse 来模拟仓库、工厂、物理与生物系统、5G 通信、机器人、自动驾驶汽车,现在最新的技术可以直接生成全功能的虚拟形象了。

这个 Q 版老黄叫 Toy-Me,可以和人进行自然语言交流。

它使用了目前规模最大的预训练自然语言处理模型 Megatron 530B,通过自己的声音、形象和讲话姿势,整个人也带光追特效。

one more thing !这一切都是实时生成的。

黄仁勋表示,“你会看到这个虚拟形象是基于目前训练的最大语言模型的语言处理打造,包括声音也是用我自己的语音进行合成,还可以看到实时基于光线追踪的精美图像。”

黄仁勋演示3个人分别让虚拟形象回答关于气候变化、天文学以及生物蛋白质等问题,都可以对答如流。

可谓是上知天文,下知地理!

Omniverse Avatar 发布

在此次大会上,英伟达宣布推出 NVIDIA Omniverse Avatar,这是一个用于生成交互式 AI 虚拟形象的技术平台。

Omniverse Avatar 是一款基于语言、计算机视觉、自然语言理解、推荐引擎和模拟技术生成的交互式 AI 化身。它具有光线追踪 3D 图形的交互式角色,可以看到、说话、就广泛的主题进行交谈,并理解对话的意图。

Omniverse Avatar 为创建人工智能助手打开了大门,这些助手几乎可以为任何行业轻松定制。这些可以帮助处理数十亿的日常客户服务互动,像是餐厅订单、银行交易、个人约会和预订等等,从而带来更多商机并提高客户满意度。

这个小机器人可以通过语音识别、眼神追踪来推断顾客的意图,并能在2秒左右作出反应,回答顾客提出的问题或要求。

“智能虚拟助手的曙光已经到来,”英伟达创始人兼首席执行官黄仁勋表示。“Omniverse Avatar 结合了英伟达的基础图形、模拟和 AI 技术,创造了一些有史以来最复杂的实时应用程序。协作机器人和虚拟助手的用例令人难以置信且影响深远。”

Omniverse Avatar 技术应用

Omniverse Avatar 的语音识别是基于英伟达 Riva,这是一种软件开发工具包,可识别多种语言的语音。Riva 还用于使用文本到语音功能生成类似人类的语音响应。

Avatar 的自然语言理解是基于 Megatron 530B 大型语言模型,能够识别、理解和生成人类语言。Megatron 530B 是一个预训练模型,它可以在很少或根本没有训练的情况下完成句子,例如:回答大量主题领域的问题,完形填空、阅读理解、常识推理,自然语言推理、翻译成其他语言等,除了这些训练完,还可以处理许多未经专门训练的领域。

Avatar 的推荐引擎由 NVIDIA Merlin 提供,该框架允许企业构建能够处理大量数据的深度学习推荐系统,以提出更明智建议。

Avatar 的感知能力由NVIDIA Metropolis启用,这是一种用于视频分析的计算机视觉框架。

头像动画由 NVIDIA Video2Face 和Audio2Face、2D 和 3D 人工智能驱动的面部动画和渲染技术提供支持。

Omniverse Avatar 将这些技术被组合成一个应用程序,并使用 NVIDIA 统一计算框架进行实时处理。

在 Keynote 中,英伟达还展示了 Omniverse 的一系列新功能,包括 Showroom,负责展示图形、物理、材质和 AI。Farm一个系统层,用于协调跨多系统,工作站、服务器、裸机或虚拟化的批处理作业。Omniverse AR 可以将图形串流到手机和 AR 眼镜上。Omniverse VR 是首款全帧率交互式光线追踪 VR。

NeMo Megatron 框架

在 GTC 大会上,NVIDIA 推出了为训练具有数万亿参数的语言模型而优化的 NVIDIA NeMo Megatron 框架、为新领域和语言进行训练的可定制大型语言模型(LLM)Megatron 530B 以及具有多 GPU、多节点分布式推理功能的 NVIDIA Triton 推理服务器。

这些工具与 NVIDIA DGX 系统相结合,提供了一个可部署到实际生产环境的企业级解决方案,以简化大型语言模型的开发和部署。

“训练大型语言模型需要极大的勇气:耗资上亿美元的系统、持续数月在数 PB 数据上训练万亿参数模型,离不开强大的信念、深厚的专业知识和优化的堆栈”黄仁勋表示。因此,他们创建了一个专门训练拥有数万亿参数的语音、语言模型的框架——NeMo Megatron。

NeMo Megatron 是在 Megatron 的基础上发展起来的开源项目,由 NVIDIA 研究人员主导,研究大型 Transformer 语言模型的高效训练。该框架已经经过优化,可水平扩展至大规模系统并保持很高的计算效率。

该框架使用数据处理库自动处理 LLM 复杂训练,可以获取、管理、组织和清理数据。它使用先进的数据、张量和管道并行化技术,使大型语言模型的训练能够高效地分布在数千个GPU上。

为了解决大模型推理问题,NVIDIA 创建了 Triton 推理服务器。黄仁勋表示,Triton 是世界上第一个分布式推理服务器,可以在多个 GPU 和多个节点之间进行分布式推理。有了 Triton,GPT-3 可以轻松运行在 8-GPU 服务器上;Megatron 530B 可以分布部署在两个 DGX 系统中,推理时间从 1 分钟缩短至半秒。

人工智能驱动软件技术

英伟达还宣布了2项新人工智能驱动软件技术——Nvidia Drive Concierge 和 Drive Chauffeur。

机器人能够在和驾驶员沟通后,调整车辆的行驶模式。最有趣的是 Nvidia Drive Concierge 这个AI助理与 Nvidia Drive AV 自动驾驶技术的集成,可以根据需求提供泊车。

当你说寻找停车位时,可以为你自动停车。

本次GTC大会给大家展示了很多重要的点,你怎么看呢?

参考链接:

https://nvidianews.nvidia.com/news/nvidia-announces-platform-for-creating-ai-avatars

https://www.nvidia.cn/gtc-global/keynote/

Q 版老黄带着硬核技术再登场,有点可爱,很有东西相关推荐

  1. 《小爸爸》Q版海报曝光 揭秘文章专线查询萌爸真相

     由滕华涛监制.文章广州专线导演并主演,马伊琍主演并兼总制片人.朱佳煜.王耀庆.刘欢.徐翠翠.张子萱联合主演的电视剧<小爸爸>日前曝光了首款Q版海报,文章和剧中儿子朱佳煜做着同样可爱的虎口 ...

  2. 【第106期】10本硬核技术书,带你读懂物联网,玩转元宇宙

    导读:元宇宙可能是当前比较火的科技概念,作为元宇宙的技术支撑,5G和物联网将逐步成为新时代的"基础设施".今天为大家推荐10本关于5G.物联网以及边缘计算的硬核技术书. 1 元宇宙 ...

  3. 超无敌搞笑的 Q 版语文 ^_^

    强烈推荐点击下载 ^_^ http://files.cnblogs.com/jackei/Q版语文.zip 先放一段试用版的出来 ^_^ 第1课 三只小猪 从前啊,有一片大森林.森林里住着七个白雪公主 ...

  4. viso 画背景框_3分钟漫画教程 | Q版漫画少女线稿,画完暖暖的

    今天就跟sunny一起来画一幅 看上去就很温暖的超可爱少女吧! 教程选自家的绘画教程 本次教程用到的画材有: 铅笔 勾线笔 01 起稿部分 用简单的几何画出人物动态,用正圆表现人物脑袋,然后用小一点的 ...

  5. q版地图制作软件_Flash动画的图形元件实例-Q版人物侧面行走

    对于刚入门者而言,学会了基本图形的绘制之后,如何应用软件的各种动画补间功能,制作出具有表现力的动画,就需要更进一阶的知识技能了:那么,设计制作一个卡通人物的行走效果,如何从没有头绪的任务到变成有通用公 ...

  6. 华为超大云数据中心落地贵州,这些硬核技术有利支撑“东数西算”

    摘要:在贵州建设的数据中心又该如何最大化利用算力资源,从而有效提高资源分配率,降低云资源的使用成本. 本文分享自华为云社区<华为全球最大数据中心落地贵州,这些硬核技术有利支撑"东数西算 ...

  7. CANN 5.0硬核技术抢先看

    摘要:2021年12月,CANN5.0版本也将与大家正式见面,通过软硬件协同优化,该版本将会实现训练性能再翻倍,凭实力展现AI领域的「中国速度」! 本文分享自华为云社区<CANN 5.0硬核技术 ...

  8. 手绘vs码绘1——Q版小人

    手绘与码绘静态对比 前言 在互动媒体的课程上,我了解了P5.js这项技术,并且学会了运用它进行简单的网页绘图.可能有很多人认为,绘画是一种艺术形式,必须要拿起画笔才能产生好的作品,而代码听起来和绘画毫 ...

  9. 小米狂秀硬核技术!推多项产业AIoT方案,打造智能生活时代

    小米举办年度2019 MIDC小米开发者大会,小米AIoT的一众大咖们推出了小爱同学3.0.MiNLP平台1.2.AIoT智能酒店/地产解决方案.新款蓝牙Mesh模组等等.同时,小米还宣布,小米手机/ ...

最新文章

  1. 数字资产云交易所搭建开发平台,云交易的优势在哪?
  2. “无路之门”,一款VR恐怖冒险游戏
  3. Redis 持久化(persistence)
  4. MyEclipse优化设置(最详细版本)
  5. (转)__declspec(dllimport)和__declspec(dllexport)的区别,以及有关c/c++调用约定
  6. Eclipse常用技巧总结:热键,自定义模版及其他
  7. Ubuntu 安装 Tomcat 7.0.40
  8. MATLAB数值计算与符号运算
  9. CoreJava 笔记总结-第七章 异常,断言和日志
  10. 最新招聘公司网站 以及学校的宣讲会
  11. [JLOI2014]松鼠的新家【树上差分】
  12. 手机900e模式如何救_手机护眼模式真的有用吗?长时间看手机如何保护视力?...
  13. ubuntu环境下android开发环境安装
  14. 春节要闻回顾 | 数字人民币和元宇宙被搬上春晚;美国财政部报告警告NFT可用于洗钱...
  15. ubuntu最好用的划词翻译词典:有道词典和GoldenDict
  16. QT文本编辑器(QMainwindow版)超详细
  17. python 控制鼠标滚轮_python-pyautogui控制鼠标键盘自动操作
  18. 建模计算机处理器,实战建模渲染,用锐龙7 5800X拒绝拖稿
  19. 【计算机网络】计算机网络核心知识点
  20. 二三四五4位高管 陈于冰董事长 代小虎财务总监 罗绘副总对外对公 邱俊祺董秘 实控人韩猛

热门文章

  1. linux设置终端颜色256,如何设置我的Linux X终端以便Emacs可以访问256种颜色?
  2. Linux命令-安装zip和unzip命令
  3. 《大数据、小数据、无数据:网络世界的数据学术》一 导读
  4. c++ 继承访问控制初步
  5. PHPNow升级PHP版本为5.3.5的方法
  6. 进程间通信IPC之--共享内存
  7. VS新建类自动添加版本注释
  8. JDBC Driver常用连接方法列表
  9. ElasticSearch5.6安装head插件
  10. php取当前是pc还是手机号,利用PHP判断是手机移动端还是PC端访问的函数示例