OpenAI开源Point-E,可在Nvidia V100 GPU上1-2分钟生成3D模型
翻译&整理 | 杨阳
出品 | AI科技大本营
OpenAI的Point-E是3D模型的DALL-E,这个速度极快的系统可以从文本中生成3D点云。
在推出针对文本和图像的生成人工智能模型之后,OpenAI现在展示了下一步可能出现的东西:一个从文本到三维模型的生成器。通过文本描述,Point-E生成了3D点云,可以作为虚拟环境中的模型。除OpenAI之外,已经有其他用于3D生成的工智能模型,如谷歌的Dreamfusion或Nvidia的Magic3D。
Point-E生成展示
然而,据说OpenAI的开源Point-E速度明显更快,在一个Nvidia V100 GPU上可以在一到两分钟内生成3D模型。
OpenAI的Point-E生成点云
实际上,Point-E并不生成传统意义上的3D模型,而是代表3D形状的点云。相比之下,谷歌的Dreamfusion生成NeRFs(Neural Radiance Fields)——需要更多的时间,但与点云相比,NeRFs可以呈现出更多明显的细节。很显然,Point-E的质量相对较低,因而使得该系统的效率很高。
Point-E从文本描述中生成的点云的一些例子
当Point-E生成点云后,再由另一个作为三维建模和设计标准的模型将其转化为网格。根据OpenAI的说法,这个过程还不能完全避免出错:在某些情况下,云的某些部分会被错误地处理,导致生成错误的网格。
Point-E中的两个生成模型
具体来看,Point-E本身由两个模型组成:一个GLIDE模型和一个image-to-3D模型。前者类似于DALL-E或Stable Diffusion等系统,可以从文本描述中生成图像。第二个模型由OpenAI对图像和相关3D目标物体进行训练,学习从图像中生成相应点云。为了更好地训练,OpenAI使用了数百万个3D目标和相关的元数据。
通过GLIDE模型在 A corgi 中创建一个图像,然后通过点云扩散模型创建一个3D corgi
该团队报告说,“这两步过程可能会失败”。但它是如此之快,以至于生成目标的速度比Dreamfusion快近600倍。"这可能让它在某些应用上更加实用,或者发现更高质量的3D对象,"该团队表示。
“我们已经推出了Point-E,一个用于文本条件合成3D点云的系统。它首先生成合成视图,然后根据这些视图生成彩色点云。我们发现Point-E能够有效地产生以文本提示为条件的多样化和复杂的3D形状。”
据OpenAI称,Point-E是公司未来展开文本到三维合成业务的起点,目前已在Github上开放了源代码。Point-E 2可能最早在明年撼动3D市场。
参考链接:https://the-decoder.com/point-e-openai-shows-dall-e-for-3d-models/
OpenAI开源Point-E,可在Nvidia V100 GPU上1-2分钟生成3D模型相关推荐
- 在NVIDIA A100 GPU上利用硬件JPEG解码器和NVIDIA nvJPEG库
在NVIDIA A100 GPU上利用硬件JPEG解码器和NVIDIA nvJPEG库 根据调查,普通人产生的1.2万亿张图像可以通过电话或数码相机捕获.这样的图像的存储,尤其是以高分辨率的原始格式, ...
- NVIDIA V100 GPU 性能测试数据
1. 常用2U 服务器配备有8张nvidia tesla V100 GPU卡,性能测试结果说明: 如果你具有一台服务器,并且购买了超强计算能力的GPU卡,那么恭喜你,可以进行一次关于计算机超万亿次计 ...
- 绝!OpenAI 年底上新,单卡 1 分钟生成 3D 点云,text-to 3D 告别高算力消耗时代
内容一览:继 DALL-E.ChatGPT 之后,OpenAI 再发力,于近日发布 Point·E,可以依据文本提示直接生成 3D 点云. 关键词:OpenAI 3D 点云 Point·E O ...
- 一块V100运行上千个智能体、数千个环境,这个「曲率引擎」框架实现RL百倍提速...
视学算法报道 编辑:张倩 在强化学习研究中,一个实验就要跑数天或数周,有没有更快的方法?近日,来自 SalesForce 的研究者提出了一种名为 WarpDrive(曲率引擎)的开源框架,它可以在一个 ...
- 一块V100运行上千个智能体、数千个环境,这个曲率引擎框架实现RL百倍提速
©作者 | 张倩 来源 | 机器之心 在强化学习研究中,一个实验就要跑数天或数周,有没有更快的方法?近日,来自 SalesForce 的研究者提出了一种名为 WarpDrive(曲率引擎)的开源框架, ...
- 最新“3D版”DALL·E爆火,超快速度生成3D点云模型,OpenAI向谷歌新领域发起挑战丨开源...
萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 这边AI画画的热度还没下去,OpenAI已经连"3D版"AI画画都搞出来了. 没错,用文字生成3D点云模型,还是超--快的那种 ...
- 在NVIDIA A100 GPU中使用DALI和新的硬件JPEG解码器快速加载数据
在NVIDIA A100 GPU中使用DALI和新的硬件JPEG解码器快速加载数据 如今,最流行的拍照设备智能手机可以捕获高达4K UHD的图像(3840×2160图像),原始数据超过25 MB.即使 ...
- NVIDIA A100 GPUs上硬件JPEG解码器和NVIDIA nvJPEG库
NVIDIA A100 GPUs上硬件JPEG解码器和NVIDIA nvJPEG库 Leveraging the Hardware JPEG Decoder and NVIDIA nvJPEG Lib ...
- Open3DGen:从RGB-D图像重建纹理3D模型的开源软件
点云PCL免费知识星球,点云论文速读. 文章:Open3DGen: Open-Source Software for Reconstructing Textured 3D Models from RG ...
- 学习超大神经网络,CPU超越V100 GPU,靠的居然是哈希?
机器之心报道 机器之心编辑部 训练一亿参数量的全连接网络,44 核心 CPU 让 V100 甘拜下风,靠的居然是--哈希? 深度学习模型的训练和推理加速近来是研究领域关注的重点.虽然普遍观点认为,GP ...
最新文章
- 为什么一些现有成熟客户不愿意上S/4
- 自定义标签报 无法为TAG [my2:hello]加载标记处理程序类[null]
- 哪个Linux发行版运行kvm,如何在Linux发行版上安装和配置KVM和Open vSwitch
- 2017.9.6 音量调节 思考记录
- 自用shell命令搜集
- 敢不敢做一个复杂的人
- spss入门基本用法
- 亲邻门禁卡复制数据分析
- 华三基础命令(单臂,超级vlan,远程,聚合)
- 1的阶乘加到100的阶乘
- java 字符表 chr3,ASCII码对应表chr(9)、chr(10)、chr(13)、chr(32)、chr(3...
- 如何设置word表格中文字与表格线之间的距离(缩短文字和上面表格线之间距离),让表格变得紧凑
- com.android.xiong.aysnctasktest.MainActivity$PageTask.onPostExecute(MainActivity.java:116)
- 优秀生被批评后“自闭”一个月 挫折教育不可少
- Blood Type Diet
- google语音服务注意事项
- 计算机网络——数字数据的数字编码
- 用CH340模块进行程序烧写以及供电
- 温湿度传感器——室内温湿度检测环境系统
- Android 强制第三方应用横屏显示
热门文章
- javascript 忽略 报错_JavaScript数据类型中易被忽略的点
- 1013. Battle Over Cities (25)
- Ubuntu出现“dpkg: 依赖关系问题使得libbsd0:i386的配置工作不能继续”错误
- python笑脸猫图案_酷叮猫编程课堂:python生成字符画
- Linux如何实现网络通信
- SPU和SKU有什么区别
- 上海十大最美婚纱摄影外景地推荐
- 使用OpenCV和Python实现图像的颜色检测
- 你一定要知道的,8大花店运营指南
- app安全评估报告,如何搞定呢?!