整理 | 郑丽媛

出品 | CSDN

在本周举办的计算机视觉和模式识别会议(CVPR)上,英伟达推出了一种名为 3D MoMa 的 AI “魔法”:将静态 2D 照片转换为可轻松编辑的 3D 模型。

据英伟达介绍,3D MoMa 可供建筑师、设计师、艺术家和游戏开发者将图像转换的 3D 模型快速导入图形引擎,使用过程中还可以修改比例、更改材料或尝试不同的照明效果。

从 2D 图像中提取 3D 模型

现实中,如想让使艺术家或工程师能充分利用 3D 模型,将其放入游戏引擎、3D 建模器或电影渲染器等广泛使用的工具中最好不过,不过前提是:这类 3D 模型是带有纹理材料的三角网格形式(主要用于定义 3D 图形和建模形状的基本框架)。

一般来说,许多游戏工作室和创作者习惯性会使用复杂的摄影测量技术来创建此类 3D 模型,不仅要劳心劳力地手动操作,还需耗费大量时间——但 3D MoMa 的出现或将改变这一局面。

据了解,3D MoMa 的背后,是被英伟达图形研究副总裁 David Luebke 称之为“统一计算机视觉和计算机图形的圣杯”的逆向渲染技术。

逆向渲染,即将一系列静态 2D 照片重建成物体或场景的 3D 模型的技术,而 3D MoMa 则是通过将每一个逆向渲染问题都定义为 GPU 加速的可微分组件,使用现代 AI 机器和英伟达 GPU 的原始计算能力来快速生成 3D 对象,使创造者可以在现有工具中不受限制地对其导入、编辑和扩展。

英伟达官博介绍道,3D MoMa 能在单个 Tensor Core GPU 上,1 小时内就生成三角网格模型,输出结果将直接与创作者正在使用的 3D 图形引擎和建模工具兼容。

不仅如此,因为 3D MoMa 生成的是三角网格模型,而网格就像是由三角形构建的 3D 形状纸质模型,因此创作者可以对其进行重建:改变其网格模型、材质和照明效果。

虚拟 3D 乐器大秀爵士乐表演

为了更直观地展示 3D MoMa 的功能,英伟达研究团队首先从不同角度收集了五种爵士乐队乐器(小号、长号、萨克斯管、架子鼓和单簧管)的近 100 张图像。

然后,研究团队利用 3D MoMa 将这些 2D 图像转换为每个乐器的三角网格模型,将其从原始场景中取出并导入 Omniverse 3D 模拟平台进行编辑。

正如上文所说,创作者可以对 3D MoMa 的输出结果重建,因此英伟达研究团队也进行了尝试。

  • 可改变材质,把小号原来的塑料材质转换为黄金、大理石、木材或软木;

  • 可将新编辑的模型放入虚拟场景,将这些乐器放入了经典的图形渲染质量测试康奈尔盒(Cornell Box)中,发现虚拟乐器在里面对光线的反映与现实世界中一样;

  • 这些通过逆向渲染生成的新模型可用作复杂动画场景的构成要素,如下面这个视频所示。

虽然目前的 3D MoMa 仍在开发中,但英伟达对此充满期待:相信它可以让游戏开发这和其他设计师快速修改 3D 对象,然后将它们添加到任何虚拟场景中。

参考链接:

https://blogs.nvidia.com/blog/2022/06/21/inverse-rendering-3d-research-cvpr/

https://thenextweb.com/news/nvidias-new-ai-magic-turns-2d-photos-into-3d-graphics

往期回顾

Matplotlib绘制圆环图的两种方法!

13个python必备的知识,建议收藏!

神器,轻松可视化Python调用流程!

搞定Python几个常用的数据结构!

分享
点收藏
点点赞
点在看

2D 照片变身 3D 模型,来看英伟达的 AI 新“魔法”!相关推荐

  1. 甲骨文中国裁员已定,补偿为N+6;VMware联手云平台合作伙伴AsiaPac,闪耀狮城;对标英伟达,寒武纪新货曝光……...

    关注并标星星CSDN云计算 极客头条:速递.最新.绝对有料.这里有企业新动.这里有业界要闻,打起十二分精神,紧跟fashion你可以的! 每周三次,打卡即read 更快.更全了解泛云圈精彩news g ...

  2. 论PS的功力,英伟达的AI这次谁也不服

    问耕 发自 凹非寺 量子位 出品 | 公众号 QbitAI 在修图这件事上,Photoshop有着崇高的地位. 前一阵子,流传过这样一个段子:"甲方不要PS!让我们用Photoshop做!& ...

  3. 用「我的世界」自动生成「现实世界」:英伟达展示AI脑补新技术

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自:机器之心 Minecraft 里面自建像素风世界不够过瘾?英伟达:那就让 AI ...

  4. 力荐联邦学习系统,据说英伟达Clara“上架”新进展!

    戳蓝字"CSDN云计算"关注我们哦! 作者 |  晶少 责编 | 阿秃 这是晶少本年度第二次面访Kimberly Powell,这位英伟达医疗领域的美女副总裁. 除了一贯的nice ...

  5. 给几个关键词就能出摄影大片,英伟达GauGAN上新2.0:将文本转成逼真图像

    来源丨机器之心 作者丨小舟.陈萍 这么美的照片竟然不是出自摄影师之手?! 在 2019 年举办的 GTC 大会上,英伟达展示了一款新的交互应用 GauGAN:利用生成对抗网络(GAN)将分割图转换为栩 ...

  6. 用英伟达的 AI “脑补”大法,制作超级慢动作

    为了解决视频画面卡顿.不够顺畅等问题,视频插帧大法应运而生.英伟达提出的 Super SloMo 方法在众多方法中一骑绝尘,对于一段普通设备录制的视频,能「脑补」出高帧率慢动作视频.有了这一神器,视频 ...

  7. 英特尔VS英伟达,AI芯片霸主争夺战重装上阵!

    编者按:本文为"新智元"(ID:AI_era)对Nervana Systems CEO的专访,作者闻菲,36氪经授权发布. 根据MarketsandMarkets最新市场研究报告, ...

  8. 新进展!英伟达用 AI 给纪录片配音,情绪语调拿捏得稳稳地

    编译 | 禾木木 出品 | AI科技大本营(ID:rgznai100) AI 已经将合成语音从单调的机器人电话和传统 GPS 导航系统转变为智能手机和智能扬声器中动听的虚拟助手. 虽然日常和Siri. ...

  9. 英伟达用AI给自家纪录片配音,情绪节奏稳稳拿捏,不说根本听不出来

    鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 先来听一小段音乐: 你能听出,这其实是AI唱的吗? 虽然日常和你对话的siri声音机械,还常常胡乱断句,但实际上,最新的技术进展显示,AI的 ...

最新文章

  1. Spring Boot Web 开发相关总结
  2. 综述 | 森林微生物组:多样性,复杂性和动态变化(IF:11.3)
  3. 个人觉得非常好的B树,B+树的总结
  4. 【Socket网络编程】14. perror()、errno 的使用
  5. 非递归遍历二叉树(算法导论第三版第十章10.4-5)
  6. tdk怎么设置_你真的做好网站的标题、描述、关键词(TDK)设置了吗?
  7. 废弃fastjson!大型项目迁移Gson保姆级实战
  8. 关于arguments,caller以及匿名函数调用的问题
  9. “OSPF” 开销值、协议优先级及计时器的修改
  10. IOS Xcode7 http 和 https
  11. pyhton2 and python3 生成随机数字、字母、符号字典(用于撞库测试/验证码等)
  12. 利用matlab编程实现主成分分析,利用Matlab编程进行主成分分析
  13. NPP/VIIRS夜间灯光数据下载和介绍
  14. 电子元件-555时基芯片
  15. python 白盒测试_白盒测试方法
  16. 薄膜单点压力传感器的制作
  17. 2020-2022年最全各省、市矢量和栅格数据(土地利用、植被覆盖、土壤类型、人口密度、NPP、气象水文数据、路网、省市县乡镇区划边界、poi数据、河流水系、建筑轮廓)
  18. unity材质球复制
  19. 2. VBA Excel宏
  20. 保密协议无效认定_保密协议与竞业限制协议有何区别?

热门文章

  1. 车载TBOX嵌入式设备软件的性能测试
  2. windows上如何搭建ubuntu虚拟机
  3. python应用程序开发者_用 NVIDIA ISAAC-SDK 在 Python 中开发机器人应用程序
  4. 前端开发查询,一个合格的初级前端工程师需要掌握的模块笔记
  5. Int8,Int16,Int32,Int64 有啥不同呢?看了立马就懂!
  6. html代码文本框首行缩进,如何将HTML页面中的文本设置首行缩进,文本首行缩进...
  7. signature=aff588228f0e2f8e22402c9f8bfc6ebe,来用百度密语吧!!!
  8. [Unity官方直播] 详解Unity Asset的一生——学习笔记(一)
  9. Python分析《我不是药神》豆瓣评论
  10. 在petalinux下提示:Failed to menu config project component....