鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

把椅子上的萌犬P成猫猫,需要几步?

第一步,圈出狗狗。第二步,告诉AI你的需求。鼠标一点,齐活。

这位AI P图大师,其实是位老朋友——OpenAI风靡全球的那位DALL·E

现在,它刚刚完成了“2.0超进化”。不仅新学了一手出神入化的P图绝技,创作质量也有了飞跃式的提升。

话不多说,直接看作品感受一下~

这是DALL·E 2在“星云爆炸状柯基头”这一提示下的创作出来的画作:

这幅萨尔瓦多·达利的画像,是不是有点萨尔瓦多·达利内味儿了?

跟初代DALL·E比起来,着实是画质与艺术感双双飞升了。

“日出时分安坐在田野里的狐狸,莫奈风格”

所以,研究人员具体如何点亮了DALL·E的新技能点?

CLIP+扩散模型

DALL·E此番进化,简单来说就是分辨率更高了,延迟更低了。

此外,还有更新2大新功能:

首先,在更细粒度上实现文本→图像功能。

也就是说,DALL·E 2可以根据自然语言提示进行P图。在P图的过程中,还会考虑阴影、反射、纹理等元素的变化。

比如在左图标“2”的位置P一个火烈鸟泳圈,DALL-E 2会把水面倒影这种细节也处理到位。

其次,是可以在保留原作核心元素的基础之上,赋予原作船新的风格。

并且生成画面的画质是DALL·E 1的4倍,即从256×256提升到了1024×1024。

具体的实现方法,用OpenAI官方的话来说,就是结合了CLIP和扩散模型两种技术的优点。

CLIP是原版DALL·E功能实现的基础,是一个负责给图像重排序的模型,其零样本学习能力已经在各种视觉和语言任务上大放异彩。

而扩散模型的特点在于,在牺牲多样性的前提下,能大大提升生成图像的逼真度。

于是,OpenAI的研究人员设计了这样一种方案:

在这个名为unCLIP的架构中,CLIP文本嵌入首先会被喂给自回归或扩散先验,以产生一个图像嵌入。

而后,这个嵌入会被用来调节扩散编码器,以生成最终的图像。

OpenAI解释称,DALL·E能够get图像和用于描述画面的文本之间的关系。其图像的生成是在“扩散”过程中完成的,可以理解为是从“一堆点”出发,用越来越多的细节去把图像填充完整。

研究人员将DALL·E 2与DALL·E、GLIDE等模型进行了对比。

实验结果显示,DALL·E 2的图像生成质量与GLIDE相当,但DALL·E的生成结果更具多样性。

目前,DALL·E 2并未对公众开放,不过如果你感兴趣,可以在线注册申请一发~

项目地址:
https://openai.com/dall-e-2/#demos

DALL·E这波超进化,画质艺术感双飞升,还学会了无痕P图相关推荐

  1. AI赌神超进化:德扑六人局击溃世界冠军,诈唬如神,每小时能赢1千刀 | Science...

    鱼羊 栗子 乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI AI赌神完成了超进化! 两年前的Libratus,历时20天战胜4位顶级德州扑克选手,但只能1v1.现在全新的赌神Plurib ...

  2. 开关电源-反激+单级PFC超低纹波超低THD

    由于时间关系,本文就做一款简单的"60W-无频闪-单级PFC-反激恒流电源"来跟大家(指初学者,高手就不用看了)一起从入门走向精通. ⊙名称:60W-无频闪-单级PFC-反激恒流电 ...

  3. 半钧先生:分享一波超赞的冬至文案,句句暖到心!

    我是半均先生. 不知不觉间,岁末已至,今天就是"冬至"啦! 俗话说"冬至大如年",别忘了吃碗热腾腾的饺子,煮一锅软糯的汤圆,驱除寒气,暖暖身子. 遇见冬至,世界 ...

  4. NBA赛事直播超清画质背后:阿里云视频云「窄带高清2.0」技术深度解读

    在半月前结束的NBA总决赛中,百视TV作为全网唯一采用"主播陪你看NBA"模式的直播平台,以"陪看型"赛事解说来面对内容差异化竞争.与此同时,百视TV还运用了& ...

  5. python爬取4K超清画质手机壁纸,壁纸这东西当然是越多越好啦~

    前言 手机壁纸这东西大家都很熟悉吧,相信不论谁打开手机都希望自己的壁纸是自己喜欢的图片, 但是一张壁纸用久了就会想换一张新鲜感满满的图(当然排除情有独钟的), 但挑选图片的时间总是恒久的,有时长时间的 ...

  6. 红外测温枪,超进化 -- 智能温度传感器 基于 arduino 的智能测温模块

    红外测温枪,超进化!--智能温度传感器!基于 arduino 的智能测温模块. 前言 硬件选择 代码讲解 通过 SDDC 协议接入 Spirit 1 部分 配置设备信息 数据获取与发送流程 融合!特殊 ...

  7. 世界杯赛事超清画质看不清?为什么直播画质不清晰?

    这段时间最火的是什么?当然是世界杯!不管是关心足球运动的真球迷.还是打算借此"搏一搏"的朋友,至少大家都会在每天晚上齐聚于电视.电脑前,关注着一场场比赛的精彩过程和意外结果-- 当 ...

  8. 惊呆了!腾讯架构师撰写亿级网关、分布式微服务等“超进化”笔记 附源码

    如何将一个承载亿级调用量的网关系统设计得高效且稳定?如何将一个平台合理化地开放达到多边共赢?如何熟练地驾驭分布式系统设计?如何更深入地了解MQ的使用场景?如何搭建一个成熟的消息推送系统?以及RPC.I ...

  9. 苹果手机上网很慢_【1080P超清画质】盒子/安卓手机/苹果/平板等,适合所有上网设备,秒开资源真的很赞!...

    阅读前必看 大家好,[科技搞机汇]又和各位见面了,由于网络上搜集来的各种软件,尤其是破姐类的,都有一定的时效性,随时可能会失效,所以,建议大家把本公众号星标和置顶,这样每日最新推送的更文,就能即使得到 ...

最新文章

  1. Centos6.8防火墙配置
  2. matlab怎么实现循环,matlab怎么实现直到型循环
  3. Linux /dev目录详解
  4. 使用FlowDroid生成Android应用程序的函数调用图
  5. Struts2的配置文件——web.xml
  6. 构架高性能WEB网站的几点知识
  7. 华中科技大学计算机卓越计划,计算机卓越计划实验班培养计划.doc
  8. docker下载安装,命令大全
  9. stc单片机c语言 pdf,STC单片机C语言程序设计 第13章 STC单片机C语言指针.pdf
  10. Ubicomp一些有意思的论文
  11. 高性能数据库集群:分库分表
  12. linux把profile文件删了怎么办,误删Profile后的处理
  13. db9针232接口波特率标准_DB9 公头母头引脚定义及连接
  14. python代理IP的使用
  15. 使用Apifox测试套件自动化测试接口
  16. 一周企业财报 | 阿迪达斯、盖璞、Natura、舍弗勒、百世集团等11家企业发布业绩...
  17. android 动态修改logo,关于app动态修改logo的问题
  18. 生成对抗网络 Generative Adversarial Nets(GAN)详解
  19. 计算机上没有端口DOT4,dot4_001端口
  20. 腕管综合征(鼠标手)的康复之路

热门文章

  1. npm install 报错: WARN checkPermissions Missing write access to 解决方案
  2. Sublime Text 3中文乱码问题的解决(最有效)
  3. 使用jquery的load方法设计动态加载,并解决被加载页面JavaScript失效问题
  4. Action请求后台出现Response already commited异常解决方法
  5. 如何大写字符串中每个单词的第一个字符
  6. 如何删除未推送的git commit?
  7. Firefox 44.0将在Linux上启用H.264支持:GTK3仍缺席
  8. SQL SERVER 2005 CTE(通用表达式)
  9. 苹果要为app store速度奇慢付出代价
  10. flutter-webview的坑用到第三方插件的