来源:DeepHub IMBA
本文约1000字,建议阅读5分钟
图像生成在过去几年中取得了长足的进步。

每年数以百万计的人都热切地等待着新一代神奇宝贝的发布。尽管收藏不断增加,但目标始终如一——Gotta Catch 'Em All!

作为一个狂热的神奇宝贝粉丝和人工智能爱好者,我曾多次尝试将两者融合都失败了。几年前,由于生成对抗网络 (GAN) 的出现,当图像生成开始蓬勃发展时,我尝试使用当时最先进的模型人工生成 Pokémon 图像。首先看看失败的作品。

随着图像生成领域的进步,可以生成的神奇宝贝的质量也在不断提高。一年后使用 ProGAN 的第二次尝试产生了稍微好一点的结果。虽然它捕捉到了神奇宝贝的清晰轮廓,但它严重缺乏任何细节 。

最近几年,生成建模领域取得了重大进展。随着 Transformer 的出现及其在海量数据上进行自监督学习的使用,图像生成进入了一个新时代。这些模型通常规模庞大,能够利用大量未标记的数据来学习高质量的表示。因此,这些模型可以在少量数据上进行微调,利用这些预先训练的表示来产生出色的结果。

值得一提的是模式崩溃的想法。当模型找到它认为最合理的图像时,它过于专注于产生特定的输出,导致图像缺乏多样性。早期的 GAN 深受这个问题的困扰,这反映在生成的 Pokémon 缺乏多样性上。

OpenAI 的 DALL-E,这是一种基于transformer 语言模型,能够使用文本-图像对的数据集从文本中生成高保真的图像。DALL-E 使用离散变分自编码器 (dVAE) 的组合来获得离散的潜在表示,同时利用强大的基于自回归transformer 的解码器来生成高质量的图像。dVAE 的使用有助于规避后验崩溃的问题——当它们与强大的自回归解码器配对时,潜在变量被忽略。

如果我们可以管理一个描述 Pokémon 及其相关图像的文本图像对数据集会怎样?然后可以用 DALL-E 对其进行微调以学习文本中视觉概念之间的相关性,例如神奇宝贝的类型,从而可以控制它生成的图像的属性。例如,将句子“草毒类神奇宝贝”传递给模型将生成草和毒类神奇宝贝的图像(通常被描绘成绿色和花朵状)。

在最近完成了该系列最新游戏《神奇宝贝:璀璨钻石》的通关过程中,我注意到每个神奇宝贝都拥有自己的 3D 模型。我们又有一个不错的新数据集可以玩了!

有了这些新发现的知识,我匆忙开始策划一个数据集来微调 DALL-E。这包括神奇宝贝的图像和类型的文字描述,以及神奇宝贝一些独特的属性。

在一些现成的 DALL-E  notebook的帮助下拼凑一些 PyTorch 代码,并将新创建的数据集放入模型中进行几个小时的微调,模型已经可以创建一些新的神奇宝贝!

生成 Pokémon 就像用文本描述提示模型一样简单。这里有一堆例子供你娱乐。

A grass type Pokémon

A fire type Pokémon

A water type Pokémon

A dragon type Pokémon

A fairy type Pokémon

A legendary water and dragon type Pokémon

图像生成在过去几年中取得了长足的进步。从生成模糊的像素块到能够根据文本描述生成神奇宝贝的合理图像是一项巨大的壮举。虽然图像还需要修复,但是它可以给我们带来无穷无尽的创意。

这些生物都没有名字,所以我欢迎大家提交你认为适合这些“神奇宝贝”的名字!

Max Woolf的 DALL-E 地址,里面有更多的图片展示:

https://www.reddit.com/r/pokemon/comments/rgmyxp/i_trained_an_ai_on_all_the_official_pokemon/

编辑:文婧

Pokémon AI,使用DALL-E生成神奇宝贝图鉴相关推荐

  1. 使用VQGAN+CLIP从图鉴文本描述中生成神奇宝贝

    还记得我们一年前发布的使用GAN生成神奇宝贝的文章吗,今天他的改进版本来了,这次我们根据文字描述来生成神奇宝贝. 先看看结果,这几个你们都认识吗,它们分别是:蒜头蛤蟆.喷火蜥蜴.呲水王八和黄皮耗子.不 ...

  2. 使用Stable Diffusion和Pokedex的描述生成神奇宝贝图片

    还记得我们以前使用GAN.Clip.DALL-E生成神奇宝贝的文章吗,现在是时候使用Stable Diffusion了 在本文中,我将展示如何从神奇宝贝系列不同游戏中的Pokedex条目中获取神奇宝贝 ...

  3. AIGC(AI Generated Content,人工智能生成内容)

    AIGC(AI Generated Content,人工智能生成内容) 什么是AIGC? AIGC(Artificial Intelligence Generated Content / AI-Gen ...

  4. 用人工智能打造神奇宝贝图鉴

    点击上方"AI算法与图像处理",关注公众号,选择加"星标"或"置顶" 作者:AI算法与图像处理 参考: https://www.pyimag ...

  5. 能通过一张照片(2D)得到3D的模型吗?AI自动识别户型图生成3D场景方案

    参考文献: 基于形状与边缘特征的户型图识别研究_江州.caj 面向自动家装生成的户型图识别方法研究_黄文.caj 基于深度学习的青年公寓户型自动生成研究_杨柳.caj 基于结构构件识别的户型图三维重建 ...

  6. Pytorch入门与实践——AI插画师:生成对抗网络数据集制作

    目录 摘要 1.用爬虫爬取二次元妹子的图片 2.获取图片中的头像 摘要 最近想搞一搞GAN,但是发现<Pytorch入门与实践--AI插画师:生成对抗网络>,但是发现数据集的链接失效了,所 ...

  7. 翻车现场:我用pytorch和GAN做了一个生成神奇宝贝的失败模型

    前言 神奇宝贝已经是一个家喻户晓的动画了,我们今天来确认是否可以使用深度学习为他自动创建新的Pokemon. 我最终成功地使用了生成对抗网络(GAN)生成了类似Pokemon的图像,但是这个图像看起来 ...

  8. 腾讯AI Lab招聘动作生成方向实习生

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入->[AI求职]微信技术交流群 腾讯AI Lab招聘动作生成方向实习生 参与动作预训练模型或语 ...

  9. 游戏NPC不再是站桩工具人,AI凭对话内容生成3D动作,真实度超越人类|网易新研究...

    羿阁 发自 凹非寺 量子位 | 公众号 QbitAI 你有没有看过油管很火的外国小姐姐模仿游戏NPC视频? △来自YouTube@Loczniki official 这僵硬的姿势.空洞的眼神.面瘫的表 ...

最新文章

  1. 数独高阶技巧入门之四:简单异数链
  2. Python List 列表list()方法分享
  3. tomcat(19)Manager应用程序的servlet类
  4. [Java面经] 关于面试的二三事.
  5. jsp文件命名规范_代码规范整理
  6. 计算机网络管理员高级技师证书,计算机网络管理员(高级技师)职业资格考核标准详细分析.doc...
  7. 赚钱的一大障碍:知道的赚钱门路太多
  8. ext 不能修改 输入框_在extjs中,如何用method改变textfield中inputType的问题
  9. android调用本地js文件上传,原生JS实现前端本地文件上传
  10. 如何解决样本不均衡问题
  11. 软考信息系统项目管理师论文范文:论项目的质量管理论项目的质量管理
  12. MyBatis缓存介绍
  13. NLP基础--single-pass 聚类算法
  14. 计算机如何连接隐藏的无线网络,无线网络隐藏了笔记本怎么连接?
  15. 一键快速设置图层lisp程序_AE脚本-多图层一键快速排列 Staircase V1.03 + 使用教程...
  16. Java笔记 - 黑马程序员_08(Lambda表达式,接口组成更新,方法引用,类加载器,反射)
  17. 写给 Linux 初学者的一封信
  18. 树莓派连接不上WIFi,VNC失效,SSH失效
  19. jQuery实现简单弹出框
  20. 医疗:疫情下的人类高质量数据共享场景 | 2021隐私计算半年纪

热门文章

  1. 编写歌唱比赛评分_【活动】预告||“唱自己的歌”歌唱大赛来啦
  2. 模板路径,模板变量,过滤器和静态文件的引用
  3. fiddler抓取https的最终说明
  4. 【书评:Oracle查询优化改写】第14章 结尾章
  5. LANMP框架搭建——源码编译
  6. 高性能JavaScript笔记三(编程实践)
  7. [技术文档] 一劳永逸,用USB设备制作多系统引导
  8. [轉]Webdings字体图案
  9. 网络-开发-CIO全面覆盖——51CTO.com今日变脸
  10. 计算机丢失filter.dll,AxCoFilter.dll