来源:量子位

OpenAI今年1月公布的Dall-E可谓艳惊四座,只需输入一段话,就能根据内容输出一幅画。连吴恩达老师都不禁点赞。

比如让它设计一个“像牛油果一样的座椅”。

但是,OpenAI只在官网设置了几种固定模板,代码也没有开源,用户无法用AI设计出更多的图片。

不过现在有个好消息,一位华人小哥Philip Wang已经复现了一个PyTorch版Dall-E,叫做Deep Daze

他使用了OpenAI的CLIP以及斯坦福大学的Siren,可以在个人电脑上运行。

只需输入在命令行中输入一段描述,这个AI就能画出各式图片。

比如在绿色山丘上的薄雾(mist over green hills):

或者是“草地上的碎盘子”(shattered plates on the grass):

你觉得实际效果如何?

开发该项目的Philip Wang,就是在今年年初公布要复现Dall-E的那位大神,没想到不到3个月的时间,这个项目已经如此强大,在GitHub上已收获1.1k星。

安装与使用

Deep Daze可直接通过pip安装:

pip install deep-daze

安装完成后,输入以下命令运行。

imagine TEXT <flags>

‍‍其中imagine是命令,TEXT必须是一段不超过77个字符的英文描述,<flags>为可选参数,可加可不加。

如果我们想生成文章开始那张山中薄雾的图片,就输入以下命令:

imagine mist over green hills

<flags>中可加入的参数有:—deeper,获取更高的图像质量;—num-layers,指定网络的层数……更多用法可以去GitHub项目主页查询。

如果担心AI的想象力过于天马行空,可以指定一张图片,让AI在此图像基础上想象。这样就能保证图像不至于太过离谱。

具体的命令如下:

imagine ‘description’ —start-image-path /path/to/picture.jpg

假设我们给AI一张披萨的图片,让它想象“上面铺满青椒的样子”。

那么我们将上述命令中的描述改成“A pizza with green pepper”。

你以为这就是Deep Daze的全部?其实,它还有一个更强大的完全体——故事模式

只需设置—create_story=True,就可以解锁该模式,取消77个字符的限制,项目作者将美国诗人罗伯特·弗罗斯特的诗《雪夜林边歇马》输入其中,得到了一段mp4视频。

到这里我有点想让AI画一下“五彩斑斓的黑”,但贫穷限制了我的操作。

因为使用Deep Daze必须要安装CUDA,而且最好在不小于8GB显存的GPU上,才能获得不错的效果。而我现在根本买不起英伟达显卡。

项目地址:
https://github.com/lucidrains/deep-daze

猜您喜欢:

超100篇!CVPR 2020最全GAN论文梳理汇总!

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

让AI画画 | 大神复现OpenAI的Dall-E相关推荐

  1. “请给我一个五彩斑斓的黑”,只需一行命令就能让AI画画,OpenAI的Dall-E被大神复现...

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI OpenAI今年1月公布的Dall-E可谓艳惊四座,只需输入一段话,就能根据内容输出一幅画.连吴恩达老师都不禁点赞. 比如让它设计一个&q ...

  2. 大神开源AI代码!这次我也可以亲自上手、模仿OpenAI利用文本合成图像啦!

    作者 | 耳洞打三金 大家好我是三金,相信大家都还记得上周报道的OpenAI新出的名叫DALL.E的120亿参数神经网络模型,它可以魔法一般按照自然语言文字描述直接生成对应图片! 效果如下所示: 文本 ...

  3. ​谷歌大神 Jeff Dean 领衔,万字展望5大 AI 趋势

    ‍‍ 作者 | 学术头条 来源 | 学术头条 对于关心人工智能技术进展的读者来说,每年年底来自整个谷歌 research 团队撰写的年终总结,可谓是必读读物. 今天,由谷歌大神 Jeff Dean 领 ...

  4. 一周AI回顾 | 特斯拉AI负责人说神经网络正在改变编程,机器学习大神Bengio新论文专注RNN优化

    本期一周AI看点包括行业热点.投融资.业界观点.技术前沿以及应用等方面. 行业 英特尔将同AMD合作PC芯片 共同对抗英伟达 <华尔街日报>援引知情人士的消息称,英特尔将发布一款移动处理器 ...

  5. ​谷歌大神Jeff Dean领衔,万字展望5大AI趋势

    本文共14400字,建议阅读15分钟 本文为你重点介绍 ML 中可能产生重大影响的五个领域. 对于关心人工智能技术进展的读者来说,每年年底来自整个谷歌 research 团队撰写的年终总结,可谓是必读 ...

  6. “深度学习”这十年:52篇大神级论文再现AI荣与光

    来源:新智元 本文约4100字,建议阅读6分钟 从"深度学习三巨头"到何恺明,从谷歌到MIT,52篇神级论文带大家回顾深度学习这十年. [ 导读 ]从自动驾驶到Deepfake,深 ...

  7. GitHub的AI程序员“抄袭”算法大神代码,连原版注释都抄上了

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 本周GitHub官方和OpenAI联合发布了一款代码神器AI--GitHub Copilot,只需输入注释,即可自动生成代码,堪称一位&q ...

  8. 2021年,AI哪个方向最火?看看大神们怎么说

    导读:在人才不断流向业界.常规架构算力进入瓶颈期的今天,作为一名从业者应该看到什么?来听听大神们怎么说. 来源:华章计算机(ID:hzbook_jsj) 缩短概念证明与生产之间的差距.尽管搭建好的模型 ...

  9. 谷歌大神Jeff Dean领衔,万字展望5大AI趋势

    对于关心人工智能技术进展的读者来说,每年年底来自整个谷歌 research 团队撰写的年终总结,可谓是必读读物. 今天,由谷歌大神 Jeff Dean 领衔,这份总结虽迟但到.出于知识传播目的,&qu ...

最新文章

  1. mysql更新锁机制_mysql查询更新时的锁表机制分析
  2. javascript的基础(1)
  3. TensorFlow--线性回归问题初步
  4. android sdk64位资源,android SDK 有32位或64位的分别吗
  5. 在PHP中数组有两种形式区别,PHP三种数组合并方式区别示例
  6. 数据库名,全局数据库名,SID区别及有感
  7. centos网络隔一段时间就断_潮汕青年说 | 瞎吃小哥:隔着屏幕也要把你看馋的顶配版吃货...
  8. sqlite 无符号32_《符号与传媒》2020年总目录
  9. 【Oracle】DG三种保护模式及切换方式
  10. 初级软件水平测试题,2020初级会计题库软件机考系统练习试卷
  11. STM32L4系列二、STM32CubeMX 图形配置工具基本操作过程
  12. 2017年苏大计算机考研872真题及解析
  13. HTML5在客户端存储数据的方式
  14. 吃货在东京 -- 记那段吃不饱的日子 之一 牛头自助烤肉店
  15. 小程序源代码 古诗词
  16. 【零基础学Python】Day9 Python推导式
  17. BMZ-MISC-损坏的压缩包
  18. 解决img撑大父盒子
  19. VBA和Python双语对照,Excel编程学习更简单
  20. UEFI统一可扩展固件接口

热门文章

  1. 原生js操作元素类名—classList.add()、classList.remove()、classList.contains()、classList.toggle()
  2. 2022年4月投资笔记 | 佛系理财
  3. 视频直播应用,且配有弹幕显示,内容均从斗鱼抓取
  4. 低层次的努力,注定你过不好这一生
  5. 利用两阶段法通过寻找基可行解求线性规划问题的最优解
  6. 这30个Python自学网站,再也不用到处找资料啦~
  7. 【FXCG】亚历山大·埃尔德人生的传奇色彩。
  8. 5、乐趣国学—“行有不得,反求诸己。”
  9. sketch导出的html,Sketch导出
  10. JS--拷贝数组的方法(浅拷贝)