苹果发布 AI 生成模型 GAUDI，文字生成 3D 场景

整理 | 禾木木

出品 | AI科技大本营（ID:rgznai100）

前有DALL.E文本生成图像，现有将文字变成 3D场景。近日，苹果 AI 团队发布最新 AI 模型 GAUDI，它是基于 3D 场景的神经架构 NeRFs，可以根据文字生成 3D 室内场景。

目前为止，NeRFs 主要用做 3D 模型和 3D 场景的一种神经存储介质，然后可以从不同的相机视角进行渲染。

最新 AI 系统 GAUDI

如果说 NeRFs 从不同角度逼真地渲染图像的能力可以用于生成 AI 呢？

此前，OpenAI 的 DALL-E 2 或 Google 的 Imagen 和 Parti 等 AI 系统展示了 AI 将文本生成图像的潜力，但内容也仅限于 2D 图像和图形。

2021 年末时，谷歌通过 Dream Fields 首次展示了 3D AI 生成系统，将 NeRF 生成 3D 视图的能力与 OpenAI 的 CLIP 评估图像内容的能力相结合。苹果 AI 团队发布的 GAUDI 是一种能够生成沉浸式 3D 场景的神经架构，可以根据文字提示创建 3D 场景。

例如，输入“穿过走廊”或“上楼梯”，就可以看到执行这一动作的 3D 场景视频。

Apple GAUDI 是 3D 内饰专家

虽然谷歌致力于使用 Dream Fields 生成单个对象，但将生成 AI 扩展到完全不受约束的 3D 场景仍是一个尚未解决的问题。这背后极有可能的原因之一是摄像机位置的限制。

虽然对于单个对象，每个摄像机位置都可以映射到一个圆顶，但在 3D 场景中，这些摄像机位置会受到对象和墙壁等障碍物的限制。

对于这个问题，GAUDI 模型的解决方案是：相机姿态解码器对可能的相机位置进行预测，并确保输出是 3D 场景架构的有效位置。

场景的场景解码器预测三平面表示，这是一种 3D 画布，辐射场解码器在其上使用体积渲染方程绘制后续图像。

在对四个不同数据集（包括室内扫描数据集 ARKitScences）的实验中，研究人员表明 GAUDI 可以重建学习视图并匹配现有方法的质量。

虽然现在 GAUDI 生成的 3D 场景视频质量还不是很高，但这也说明了 AI 在图像和视频技术这生成的另一种可能。

参考链接：

https://mixed-news.com/en/apples-new-gaudi-ai-turns-text-prompts-into-3d-scenes/

往期回顾

“如今，99%以上的代码都是垃圾！”

Deepfake 技术换脸真假难辨！

当你不再是程序员，很多事会脱离掌控

7岁男童因下棋太快，被机器人夹断手指？

分享
点收藏
点点赞
点在看

苹果发布 AI 生成模型 GAUDI，文字生成 3D 场景相关推荐

#今日论文推荐# 文字秒变3D？苹果发布最新AI生成模型GAUDI，根据文字提示创建3D场景
#今日论文推荐# 文字秒变3D?苹果发布最新AI生成模型GAUDI,根据文字提示创建3D场景继 AI 将文字变成图片后,又有 AI 可以将文字变成 3D 场景了. 苹果发布新 AI 系统 GAUDI ...
照片转3d模型_在线搭建3D场景
小编分享一个很有意思的可以在线搭建3D场景网站,像是玩积木一样简单,首先我们看一下网站是什么样的. 网站首页有很多场景.模型可以选择,把自己喜欢的模型往场景里摆放进行搭建,所选择的模型都有链接可以打 ...
【离线文本转语音文件】java spring boot jacob实现文字转语音文件，离线文本转化语音，中英文生成语音，文字朗读，中文生成声音，文字生成声音文件，文字转语音文件，文字变声音。
1.实现效果如下: 输入文字(支持中英文),点击转换生成***.wav文件,点击下载到本地就可. 生成后的音频文件播放,时长1分8秒 2.实现代码: 这次采用jacob实现,相比百度AI需要联网,本项 ...
115页Slides带你领略深度生成模型全貌（附PPT）
来源:专知本文多图,建议阅读8分钟. 本文为大家带来了斯坦福大学PH.D Aditya Grover同学的深度生成模型tutorial. [ 导读 ]当地时间 7 月 13 - 19 日,备受关注的 ...
【GAN优化外篇】详解生成模型VAE的数学原理
最近在学习生成模型的相关知识,这篇文章将介绍一下变分自编码器(Variational Auto-encoder),本文只介绍一些粗浅内容,不会涉及比较深刻的问题. 作者&编辑 | 小米粥 1. ...
预训练生成模型：结合VAE与BERT/GPT-2提高文本生成效果
论文标题: Optimus: Organizing Sentences via Pre-trained Modeling of a Latent Space 论文作者: Chunyuan Li, Xi ...
生成模型和判别模型_生成模型和判别模型简介
生成模型和判别模型 Intro 介绍 Recently I gave a presentation at work, where I explained how I solved some probl ...
扩散模型与生成模型详解
扩散模型与其他生成模型什么是扩散模型扩散模型的简介生成建模是理解自然数据分布的开创性任务之一.VAE.GAN和Flow系列模型因其实用性能而在过去几年中占据了该领域的主导地位.尽管取得了商业上的 ...
第五章：深度生成模型
目录 ➢Part One.深度生成模型概述 ➢Part Two.Hopfield神经网络 ➢一.神经网络的分类 ➢二.Hopfiled神经网络 ➢1.Hopfield神经网络优点 ➢2.Hopfiel ...

苹果发布 AI 生成模型 GAUDI，文字生成 3D 场景

苹果发布 AI 生成模型 GAUDI，文字生成 3D 场景相关推荐

最新文章

热门文章