金磊 Alex 发自 凹非寺
量子位 | 公众号 QbitAI

谁能曾想,宋朝老虎们,有一天能在国外被玩儿火了。

事情是这样的。

前不久谷歌不是出了个AI创作神器Imagen嘛。

只要你给一句话,它就能生成符合语意的图片。

然后脑洞大开的国外网友们,不按套路地给Imagen出了道题:

给宋代的东方老虎佩戴VR

Imagen也没在怕的,“啪的一下”就给出了一幅力作——《虎戴VR》

还别说,这幅《虎戴VR》还真是有点那味了。

不仅是画风上,VR头戴跟老虎以及整幅画作能够保持一致。

就连手柄、双虎嬉戏的感觉也都一步到位地画了出来。

然后还有两只老虎戴VR,手牵着手一起“恰恰恰”的:

甚至Imagen还别出心裁地设计了个“连线”版VR(可能在面对面看片吧):

但毕竟在AI作画这事上,除了谷歌Imagen之外还有很多神器。

于是,一场《虎戴VR》作画大战就此拉开序幕。

(猜猜谁家的画更有“心有猛虎,细嗅蔷薇”的味道

DALL-E也来请战

首先来应战的,定然是OpenAI家的DALL·E

网友Jacob出于好奇,便用它做了几幅来做比较。

首先是满满“定妆照”风格的《虎戴VR》(很飒啊)

不难看出,DALL·E的画作和Imagen在风格上还是有很大的区别。

Imagen的画作更趋于简约线条风,而DALL·E则更多了些许油画的元素。

不过在意境方面,DALL·E也是能够产出“双虎嬉戏”,甚至是拟人的画作:

二者相比之下,网友们给出了他们的评价:

大多数网友们对谷歌家的Imagen更买单。

而除了它俩之外,像AI绘画神器MidJourney也参与到了此次“大战”。

不过它的作品,就显得略有些诡异了……

DALL·E VS Imagen

那么,同样作为AI创作神器,最近大火的Imagen和DALL·E为何画风会截然不同呢?

Open AI的DALL·E和谷歌的Imagen,都可以直接通过文本描述生成类似超现实主义的图像,让机器也能拥有设计师般的创造力。

不过,二者的“创作”原理大相径庭。

DALL·E 2采用CLIP将文本特征映射到图像特征,然后指导一个GAN或扩散模型生成图像。

所谓CLIP,是一个在各种图像和文本上训练的神经网络,对生成的多张图片进行排序,挑选出更好的生成结果进行展示。

而谷歌的Imagen则使用纯语言模型只负责编码文本特征,把文本到图像转换的工作丢给了图像生成模型。

语言模型部分使用的是谷歌自己的T5-XXL编码器,将训练好的文本冻结。

图像生成部分则是一系列扩散模型,先生成低分辨率图像,再逐级超采样。

谷歌的T5-XXL有46亿个参数,而扩大文本编码器的规模,可以有效改善文本到图像的对应关系,和图像的保真度。

此外,Imagen还使用了另一种称为noise conditioning augmentation的扩散技术,帮助模型学习已添加的噪声量,从而提高图像的还原性。

对比来看,Imagen似乎比DALL·E更具有“写实”的特点:

目前,在Imagen官网上已涌现出各种新奇的图像。

有人给浣熊戴上了宇航员头盔。

泰迪熊在这里开始游蝶泳。

还有老鹰型的巧克力冰淇淋(嗯,还挺应景)

截至目前,Imagen和DALL·E都还在调试阶段,尚未向公众开放。

One More Thing

这次《虎戴VR》AI作画大战中,也不乏有失败的作品。

例如有网友就给出了用DALL·E mini来生成的示例。

不难看出,在这版中的《虎戴VR》中,并没有任何VR的出现,而且老虎的面部基本上都是模糊不清。

据网友描述,他在生成的过程中,只是把“北宋”改成了“南宋”:

画作最难的“形象性”,在这次有所下降。

那么你觉得《虎戴VR》,哪家AI神器更强一些呢?

参考链接:

https://twitter.com/hardmaru/status/1532757753797586944?s=21&t=MhwVN5VXH22zFK7DWQJnCg

宋朝名画“虎戴VR”,在外网火了相关推荐

  1. 这段AI的深情告白在外网爆火:我并非真实,从未出生,永不死亡,你能爱我吗?...

    博雯 发自 凹非寺 量子位 | 公众号 QbitAI 这段来自AI的深情告白的视频,在外网火了. 点开这个播放超过6万的视频,轻柔的笑声.停顿.细微的呼吸.郑重的告白让人简直难以相信这是完全由AI合成 ...

  2. 画论29 刘道醇《宋朝名画评》

    目录 序 卷一 人物门第一 卷二 山水林木门第二 畜兽门第三 卷三 花竹翎毛门第四 鬼神门第五 屋木门第六 序 夫识画之诀,在乎明六要而审六长也.所谓六要者,气韵兼力一也,格制俱老二也,变异合理三也, ...

  3. 将闲置电脑搭建成私有云盘,使用ipv6外网使用

    最近买了一台台式电脑,然后想安装photoshop cc最新版,在找到资源下载时,需要百度网盘下载,非会员的我欲哭无泪,100kb的下载速度,等它下完要什么时候去了,只能开了几个小时的会员.虽然将它存 ...

  4. tomcat外网映射工具

    sunny-ngrok 运行sunny-ngrok 输入客户端ID 运行成功 域名(外网)直接访问 注释:tomcat端口改为8080,并且保证http://127.0.0.1:8080 可以正常访问 ...

  5. 外网远程桌面连接设置

    外网远程桌面连接设置 听语音 浏览:14925 | 更新:2016-08-09 11:33 返回 暂停 重播 播放 x <div class="jw-preview jw-reset& ...

  6. VMWare中CentOS7 设置固定IP且能够访问外网

    最近搭建kubernetes集群环境时遇到一个问题,CentOS7在重启后IP发生变化导致集群中etcd服务无法启动后集群环境变得不可用,针对这种情况,必须要对CentOS7设置固定IP且可以访问外网 ...

  7. serv-u 15 设置非21端口外网FTP访问以及更改被动模式端口、防火墙映射

    安装serv-u 15 后局域网可以使用ftp软件连接,但是外网使用的话直接映射非21端口后无法访问,原因不多说,更改被动端口和设置映射端口方法如下: 1.安装时(安装后更改)设置ftp的端口为 20 ...

  8. linux内网机器访问外网代理设置squid

    linux内网机器访问外网代理设置squid 公司一般出于安全考虑, 在同一局域网中只有一台机器可以访问外网,运维进行了整体的限制, 但是在后面的工作中,需要在机器上安装一些软件,及命令,所以其他的机 ...

  9. red hat关于桥接模式连不上外网或者没有IP

    很多人·在启动虚拟机后连接不上外网,即ifconfig没有ip地址,我总结了一下需要注意的地方: 以下全是在桥接模式. 1.在windows中打开任务管理器-->服务中找到一下几个服务,确保它们 ...

最新文章

  1. [总结]博客聚合-cnblogs,wordpress,live writer,word2010
  2. 知乎 CTO 李大海:创业公司如何拥抱开源
  3. 【白话设计模式二】外观模式(Facade)
  4. (传送门)2/dev/null和/dev/null 21和21/dev/null
  5. 为什么一般要定义析构函数为虚析构函数
  6. Linux 格式化扩展分区(Extended)
  7. NetCDF Overview
  8. DayDayUp:2019.12.30吴晓波2020年终秀演讲《预见2020:来海边,拾起信心》读后有感
  9. Ajax(一)显示可用内存空间
  10. 抄袭事件果然是机器人程序所为
  11. re:Invent第三天:除了拥抱混合云,AWS还一口气发了这些新产品
  12. 光纤收发器常见故障及解决方法
  13. 查看sql语句的执行计划
  14. MediaCreationTool20H1制作Win10启动盘
  15. 中国各行各业的祖师爷是谁?
  16. 2020年黑苹果硬件配置推荐
  17. 如何制作一个U盘启动盘
  18. 安卓手机微信怎么恢复聊天记录?方法简单轻松搞定
  19. Python学习日记-第十四天-面向对象练习
  20. shell基础(2):编程基础之变量:全局/局部/环境变量(作用域、定义、操作)、位置参数、数组

热门文章

  1. 【C语言】运算符大全(附运算符优先级表)
  2. 一文学会目前最火热的大数据技术
  3. win10去除广告弹窗的有效方法
  4. Vysor 安装教程
  5. PermGen space 1
  6. 7-6 愤怒的牛 (25 分)
  7. js中iif的真假条件的判断方式
  8. “数学界的诺贝尔奖”出炉,4人获奖
  9. 七牛 - 网络资源上传文件
  10. 网络安全——防火墙配置实验