翻译&整理 | 杨阳

出品 | AI科技大本营

OpenAI的Point-E是3D模型的DALL-E,这个速度极快的系统可以从文本中生成3D点云。

在推出针对文本和图像的生成人工智能模型之后,OpenAI现在展示了下一步可能出现的东西:一个从文本到三维模型的生成器。通过文本描述,Point-E生成了3D点云,可以作为虚拟环境中的模型。除OpenAI之外,已经有其他用于3D生成的工智能模型,如谷歌的Dreamfusion或Nvidia的Magic3D。

Point-E生成展示

然而,据说OpenAI的开源Point-E速度明显更快,在一个Nvidia V100 GPU上可以在一到两分钟内生成3D模型。

OpenAI的Point-E生成点云

实际上,Point-E并不生成传统意义上的3D模型,而是代表3D形状的点云。相比之下,谷歌的Dreamfusion生成NeRFs(Neural Radiance Fields)——需要更多的时间,但与点云相比,NeRFs可以呈现出更多明显的细节。很显然,Point-E的质量相对较低,因而使得该系统的效率很高。

Point-E从文本描述中生成的点云的一些例子

当Point-E生成点云后,再由另一个作为三维建模和设计标准的模型将其转化为网格。根据OpenAI的说法,这个过程还不能完全避免出错:在某些情况下,云的某些部分会被错误地处理,导致生成错误的网格。

Point-E中的两个生成模型

具体来看,Point-E本身由两个模型组成:一个GLIDE模型和一个image-to-3D模型。前者类似于DALL-E或Stable Diffusion等系统,可以从文本描述中生成图像。第二个模型由OpenAI对图像和相关3D目标物体进行训练,学习从图像中生成相应点云。为了更好地训练,OpenAI使用了数百万个3D目标和相关的元数据。

通过GLIDE模型在 A corgi 中创建一个图像,然后通过点云扩散模型创建一个3D corgi

该团队报告说,“这两步过程可能会失败”。但它是如此之快,以至于生成目标的速度比Dreamfusion快近600倍。"这可能让它在某些应用上更加实用,或者发现更高质量的3D对象,"该团队表示。

“我们已经推出了Point-E,一个用于文本条件合成3D点云的系统。它首先生成合成视图,然后根据这些视图生成彩色点云。我们发现Point-E能够有效地产生以文本提示为条件的多样化和复杂的3D形状。”

据OpenAI称,Point-E是公司未来展开文本到三维合成业务的起点,目前已在Github上开放了源代码。Point-E 2可能最早在明年撼动3D市场。

参考链接:https://the-decoder.com/point-e-openai-shows-dall-e-for-3d-models/

OpenAI开源Point-E,可在Nvidia V100 GPU上1-2分钟生成3D模型相关推荐

  1. 在NVIDIA A100 GPU上利用硬件JPEG解码器和NVIDIA nvJPEG库

    在NVIDIA A100 GPU上利用硬件JPEG解码器和NVIDIA nvJPEG库 根据调查,普通人产生的1.2万亿张图像可以通过电话或数码相机捕获.这样的图像的存储,尤其是以高分辨率的原始格式, ...

  2. NVIDIA V100 GPU 性能测试数据

    1. 常用2U 服务器配备有8张nvidia tesla  V100 GPU卡,性能测试结果说明: 如果你具有一台服务器,并且购买了超强计算能力的GPU卡,那么恭喜你,可以进行一次关于计算机超万亿次计 ...

  3. 绝!OpenAI 年底上新,单卡 1 分钟生成 3D 点云,text-to 3D 告别高算力消耗时代

    内容一览:继 DALL-E.ChatGPT 之后,OpenAI 再发力,于近日发布 Point·E,可以依据文本提示直接生成 3D 点云. 关键词:OpenAI   3D 点云   Point·E O ...

  4. 一块V100运行上千个智能体、数千个环境,这个「曲率引擎」框架实现RL百倍提速...

    视学算法报道 编辑:张倩 在强化学习研究中,一个实验就要跑数天或数周,有没有更快的方法?近日,来自 SalesForce 的研究者提出了一种名为 WarpDrive(曲率引擎)的开源框架,它可以在一个 ...

  5. 一块V100运行上千个智能体、数千个环境,这个曲率引擎框架实现RL百倍提速

    ©作者 | 张倩 来源 | 机器之心 在强化学习研究中,一个实验就要跑数天或数周,有没有更快的方法?近日,来自 SalesForce 的研究者提出了一种名为 WarpDrive(曲率引擎)的开源框架, ...

  6. 最新“3D版”DALL·E爆火,超快速度生成3D点云模型,OpenAI向谷歌新领域发起挑战丨开源...

    萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 这边AI画画的热度还没下去,OpenAI已经连"3D版"AI画画都搞出来了. 没错,用文字生成3D点云模型,还是超--快的那种 ...

  7. 在NVIDIA A100 GPU中使用DALI和新的硬件JPEG解码器快速加载数据

    在NVIDIA A100 GPU中使用DALI和新的硬件JPEG解码器快速加载数据 如今,最流行的拍照设备智能手机可以捕获高达4K UHD的图像(3840×2160图像),原始数据超过25 MB.即使 ...

  8. NVIDIA A100 GPUs上硬件JPEG解码器和NVIDIA nvJPEG库

    NVIDIA A100 GPUs上硬件JPEG解码器和NVIDIA nvJPEG库 Leveraging the Hardware JPEG Decoder and NVIDIA nvJPEG Lib ...

  9. Open3DGen:从RGB-D图像重建纹理3D模型的开源软件

    点云PCL免费知识星球,点云论文速读. 文章:Open3DGen: Open-Source Software for Reconstructing Textured 3D Models from RG ...

  10. 学习超大神经网络,CPU超越V100 GPU,靠的居然是哈希?

    机器之心报道 机器之心编辑部 训练一亿参数量的全连接网络,44 核心 CPU 让 V100 甘拜下风,靠的居然是--哈希? 深度学习模型的训练和推理加速近来是研究领域关注的重点.虽然普遍观点认为,GP ...

最新文章

  1. 为什么一些现有成熟客户不愿意上S/4
  2. 自定义标签报 无法为TAG [my2:hello]加载标记处理程序类[null]
  3. 哪个Linux发行版运行kvm,如何在Linux发行版上安装和配置KVM和Open vSwitch
  4. 2017.9.6 音量调节 思考记录
  5. 自用shell命令搜集
  6. 敢不敢做一个复杂的人
  7. spss入门基本用法
  8. 亲邻门禁卡复制数据分析
  9. 华三基础命令(单臂,超级vlan,远程,聚合)
  10. 1的阶乘加到100的阶乘
  11. java 字符表 chr3,ASCII码对应表chr(9)、chr(10)、chr(13)、chr(32)、chr(3...
  12. 如何设置word表格中文字与表格线之间的距离(缩短文字和上面表格线之间距离),让表格变得紧凑
  13. com.android.xiong.aysnctasktest.MainActivity$PageTask.onPostExecute(MainActivity.java:116)
  14. 优秀生被批评后“自闭”一个月 挫折教育不可少
  15. Blood Type Diet
  16. google语音服务注意事项
  17. 计算机网络——数字数据的数字编码
  18. 用CH340模块进行程序烧写以及供电
  19. 温湿度传感器——室内温湿度检测环境系统
  20. Android 强制第三方应用横屏显示

热门文章

  1. javascript 忽略 报错_JavaScript数据类型中易被忽略的点
  2. 1013. Battle Over Cities (25)
  3. Ubuntu出现“dpkg: 依赖关系问题使得libbsd0:i386的配置工作不能继续”错误
  4. python笑脸猫图案_酷叮猫编程课堂:python生成字符画
  5. Linux如何实现网络通信
  6. SPU和SKU有什么区别
  7. 上海十大最美婚纱摄影外景地推荐
  8. 使用OpenCV和Python实现图像的颜色检测
  9. 你一定要知道的,8大花店运营指南
  10. app安全评估报告,如何搞定呢?!