衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

AI画师,技术又精进了——

直接一句话/一张图,生成3D模型、环绕视频、NeRF实例那种。

还是带颜色的。

输入“一幅美丽的花树画,作者Chiho Aoshima,长镜头,超现实主义”,就能瞬间得到一个长这样的花树视频,时长13秒。

这个文本/图片-3D生成AI,叫Dreamfields-3D,来自一个自称编程菜鸟的建筑学在读博士。

Demo刚被小哥放在微博、推特等平台,许多网友已经急着蹲内测了:

现在,小哥已经将它开源,colab上也能运行。

一起来上手玩玩看~

AI作画3D版在线玩

Dreamfields-3D玩法十分低门槛,大致只需要三步。这里介绍一下colab上在线玩的步骤。

首先,检查一下GPU,再安装个谷歌驱动器。

第二步,调出工具开始运行,并安装依赖项。

然后定义一些必要的功能,就可以在colab上训练和测试了~

玩的时候需要输入一些参数,保存格式有视频网格两种,输出模型格式为带顶点色的obj和ply。

万事俱备,让我们现在开始。

试试输入“一个赛博朋克风格的飞行霓虹灯汽车,格雷格鲁特科夫斯基和西蒙斯大林风格,长镜头,CG社会,虚幻的引擎,史诗游戏”?

会得到一个果然很赛博的汽车的视频。

如果你是《千与千寻》重度爱好者,想搞张吉卜力风格的视频玩玩。

没问题,prompt输入“一张美丽的天空城市的插图,吉卜力工作室,艺术站,8k HD,CG社会”,这不就来了——

有网友迫不及待上手,做出了个小计算机。

当然在鹅妹子嘤的惊叹中,也有网友表达了希望Dreamfields-3D更好的期许。

当然,除了文本输入,Dreamfield3D是支持图片作为prompt的。

不过现在版本还有待完善,如果输入图片,会造成过拟合,简单说就是如果喂它一张车的正面图,生成的3D视频中,那辆车可能4个面都是正面……

想要玩儿图片输入的友友们,怕是要再等等了。

基于现状,小哥在GitHub表达了未来的改进目标:

  • 同时使用不同的CLIP模型。

  • 仅在指定方向应用图像提示。未来可能要加一个图片角度的约束,例如只有在输入图片相同角度时,输出才参考该图片。

  • 作为NeRF实例读取现有网格,然后通过文本/图像prompt进行修改。

  • 在训练中减少GPU RAM的使用。

(但小哥说了,自己是个编程菜鸟,后续可不保证哦)doge

基于谷歌Dreamfields-Torch

小哥是建筑学出身,据他讲,Dreamfield3D是他从创作者角度出发,对Dreamfield-Torch做了些优化,主要的代码工作还是来自上游的Dreamfields-Torch和Dreamfields。

介绍下,Dreamfields来自谷歌,它的特点是无需照片样本,简简单单一句话,就能生成3D图像,还可以生成多种物品组合成的复合结构。

在生成3D场景时,通常会选用神经辐射场(NeRF)参数方案。

NeRF的特点是可分别渲染场景,但需要很多张3D照片,才能实现360°视觉重建。

相比之下,Dreamfields生成3D模型不需要照片,因为它基于NeRF 3D场景技术、OpenAI文本生成模型DALL·E以及CLIP的3D生成系统开发,通过神经网络来储存3D模型。

DALL·E和CLIP同样师出谷歌,前者通过文本生成图像,后者通过文本分类图片。用CLIP来分类DALL·E生成的图像,可以提升图像生成的准确性。

Dreamfields-Torch则是一个经过修改的Dreamfields的Pytorch实现,主要是把原Dreamfields的后端,从原始NeRR换成了instant-ngp。

以此为基础,小哥做出的Dreamfields-3D基本上靠CLIP + NERF运作。

作者简介

作者蒙胜宇(Simon Meng),奥地利因斯布鲁克大学(UIBK)建筑学在读博士。

硕士毕业于伦敦大学学院(UCL)建筑学,现为UIBK及UCL技术课程助教及特邀评图嘉宾,从事建筑设计、艺术、AI及生物学跨领域研究。

小哥从去年6、7月份开始关注AI图像生成。

他发现,很多破圈技术,如clip guide diffusion,disco diffusion,都是一些懂代码的跨界者做的。

去年年末谷歌发布Dreamfields,他就动了用它做3D输出的心思。

于是,在拿到动画后,他用AI做了超采样放大和插帧,然后导出帧到普通的多目重建软件(类似colmap),成功重建mesh(一个用3D模型数据还原的模型图)。

小哥把mesh发在推特上,结果Dreamfields论文的原作者Ajay Jain联系到他,表示了欢迎,还鼓励他保持优化更新——虽然那时候他用的是普通航拍实景重建软件,不是编程方法。

上个月,小哥在Dreamfield-Torch的基础上做了colab版,本月在GitHub开源,让大家能够愉快地玩耍。

以及,现在这个已经是基于Marching cubes的船新版本啦~

GitHub地址:
https://github.com/shengyu-meng/dreamfields-3D
colab地址:
https://colab.research.google.com/drive/1u5-zA330gbNGKVfXMW5e3cmllbfafNNB?usp=sharing#scrollTo=_VDLFG_gUEKa

参考链接:
[1]https://weibo.com/1948301550/M4o6m3vGn?type=comment#_rnd1663119855180
[2]https://twitter.com/meng_shengyu
[3]https://github.com/ashawkey/dreamfields-torch

Text-to-3D!建筑学小哥自称编程菜鸟,攒了个AI作画三维版,还是彩色的相关推荐

  1. python富翁与陌生人编程_GitHub近10万星:印度小哥用Python和Java实现所有AI算法

    原标题:GitHub近10万星:印度小哥用Python和Java实现所有AI算法 又到了招聘季.疫情将我们圈在家里这么长时间,以至于都宅废了! AI的算法你还记得多少?他们都是如何用Python和Ja ...

  2. AI画师技术又精进了? AI画师三维版试玩——Dreamfields和DreamFusion向文本生成3D模型领域进发

    0.AI画师二维版的出圈 最近AI画师的杰出表现让人惊讶无比,2022虽然不是ai绘图这项技术诞生的时间,但却是到目前为止最爆火出圈的绘图元年,现在市场上也已经有了很多成熟的AI绘画APP:用户仅需打 ...

  3. 太秀了!那个在 GitHub 用文言文编程的小哥,竟从 28 万行唐诗中找出了对称矩阵

    来自量子位 下面这张图,你能看出来,这首诗妙在哪里吗? 其实,横着读是一首诗,竖着读还是这首诗! 而且,这首诗可不是乱编的,其中的诗句都来自<全唐诗>,读起来也颇有意境. 创造这个奇妙组合 ...

  4. 太秀了!那个在 GitHub 用文言文编程的小哥,竟从 28 万行唐诗中找出了对称矩阵...

    点击上方"Github中文社区",关注 触达Github项目 来源:量子位 大家好,请看下面这张图,你能看出来,这首诗妙在哪里吗? 其实,横着读是一首诗,竖着读还是这首诗! 而且, ...

  5. 厉害了!那个用文言文编程的小哥,竟从28万行唐诗中找出了对称矩阵

    本文经AI新媒体量子位(ID:QbitAI)授权转载,转载请联系出处 梦晨 萧箫 发自 凹非寺 你能看出来,这首诗妙在哪里吗? 其实,横着读是一首诗,竖着读还是这首诗! 而且,这首诗可不是乱编的,其中 ...

  6. 用计算机研究唐诗,妙哉!那个用文言文编程的小哥,竟从28万行唐诗中找出了对称矩阵...

    梦晨 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 你能看出来,这首诗妙在哪里吗? 其实,横着读是一首诗,竖着读还是这首诗! 而且,这首诗可不是乱编的,其中的诗句都来自<全唐诗&g ...

  7. 拜访了这位小哥的GitHub后,我失眠了!

    之前很早就有耳闻过一个名叫John Washam的外国小哥自学编程的励志故事,还曾一度登上GitHub热度榜. 他的故事说来也挺励志.为了让自己从一个非CS科班的自学党蜕变成Google的软件工程师, ...

  8. 3年编程经验无名校背景,全栈小哥是如何拿下Twitter Offer的?

    作者 | zhiachong 责编 | Aholiab 头图 | CSDN 下载自视觉中国 出品 | CSDN(ID:CSDNnews) 外国小哥zhia是个有面试绝技的人,他只有三年的编程经验,并且 ...

  9. 无缝切地图的3D赛车游戏火了,小哥花16个月用JS打造,浏览器免费就能玩

    萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 一位小哥耗时16个月打造的3D版赛车游戏,这两天忽然火了起来. 只需一个浏览器,就能驾车从森林.海滩,"无缝切换"到广袤的沙漠 ...

最新文章

  1. C - Internet Address CodeForces - 245B(有些思维的水题)
  2. Nodejs下的ES6兼容性与性能分析
  3. android 9.0 权限管理_你真的了解Android权限机制吗?
  4. Html加jq实现5星好评效果,关于jquery实现五星好评的方法
  5. 动软代码生成器连接oracle数据库
  6. ibm x240使用 server guide 9.41 安装server 2003 32bit的一些注意事项
  7. Android网络验证逆向,【Android逆向】去除无聊的网络验证弹窗与360加固
  8. 常见视频文件格式详解
  9. Tegra3--NVIDIA--黄仁勋
  10. 三亿顶级流量社区,下厨房APP变现三部曲
  11. SQL的常见函数的使用方法和举例说明
  12. Python利用pptx模块三步将图片插入特定PPT模板
  13. 启动报错 Bean instantiation via factory method failed
  14. 人啊,就要对自己狠一点!
  15. 哪个牌子的运动耳机比较好、运动蓝牙耳机排行榜
  16. AngularJS风格指南
  17. 计算机主板 辐射,想当年单反镜头竟然还有核辐射?
  18. 大数据技术原理与应用(三)
  19. set_global_opts全局设置
  20. snmp的团体名配置_小白都能看懂的Linux系统下安装配置Zabbix

热门文章

  1. CSS学习之菜鸟入门
  2. Power-One电源维修Bel power电源维修PFC500-1024
  3. chisel的信号名命名机制
  4. C 算法精介----链表-双向链表
  5. 量子计算机可不可以穿越时空,一片蓝海 量子计算机的灿烂前景
  6. jdk1.7的HashMap重写以及与1.8的比较
  7. 黑马程序员------毕老师视频笔记第23-24天------网络编程(1)
  8. OA系统模块设计方案
  9. 前端《Vue.js从入门到项目实战》PDF课件+《微信小程序实战入门第2版》PDF代码调试
  10. 解决spring boot shiro的 Consider defining a bean named ‘shiroFilterFactoryBean‘ in your configuration问题