新智元报道  

编辑:卫民

【新智元导读】你想象中的「怪兽」是什么样的?长着老虎的身体、恐龙的脑袋?还是有着猫的爪子、鹰的翅膀?谷歌的一个研究团队推出了一款名为 Chimera Painter 画图工具,使你可以将生物的头、爪、耳朵、爪子等随意组合,然后一键生成一只属于你自己的「怪兽」。

「亚古兽进化,暴龙兽!」

随着一声召唤,一只萌萌的数码宠兽变身为体型巨大的数码战斗兽。

相信很多80、90后的同学都对这一部《数码宝贝》印象深刻,童年他们也曾幻想能够拥有一只属于自己的数码兽。

而现在,谷歌的一个 Chimera Painter 画图工具,或许可以圆了你童年的梦。

通过Chimera Painter ,你可以在体统提供或者自己上传的生物轮廓上进行「怪物创作」,点击「转换」按钮后,系统便会生成一个属于你自己的3D效果的「怪兽」。

强大的「怪兽制造器」背后,还是GAN

谷歌的研究团队创建了一个数字卡片游戏原型,这个原型的概念是把生物组合成新的混合体(怪兽),然后这些混合体(怪兽)可以互相「战斗」。在这个游戏中,玩家可以从真实世界的动物卡片(比如,美西螈或鲸鱼)开始,然后将它们组合起来,使它们变得更加「夸张」(可怕的美西螈-鲸鱼嵌合体)。这为演示图像生成模型提供了一个创造性的环境,因为可能的嵌合体的数量需要一种方法来快速设计大量可以自然结合的艺术元素,同时仍然保留原始生物可识别的视觉特征。研究团队的目标是在用户输入的指导下创建高质量的生物卡片图像,因此在用户反馈的指导下,尝试使用生成对抗网络(GANs)来创建适合幻想卡片游戏原型的生物图像。GAN 将两个卷积神经网络组合在一起: 一个生成器网络用于创建新图像,另一个判别器网络用于确定这些图像是否是来自训练数据集(在这种情况下,是用户创建的图像)的样本。研究团队使用了一种称为 条件 GAN 的变体,其中生成器接受一个单独的输入来指导图像生成过程。有趣的是,这个方法严格偏离了其他GAN的工作,后者通常专注于照片写实。为了训练 GANs,研究团队创建了一个全彩色图像数据集,其中包含单种生物的轮廓,这些轮廓改编自3D 生物模型。这种生物的轮廓描述了每种生物的形状和大小,并提供了一张分割地图来识别身体的各个部分。模型的任务是生成多物种嵌合体,基于艺术家提供的轮廓,经过模型训练,得到表现最好的模型之后被纳入到 Chimera Painter。图:生成的卡片艺术集成到卡片游戏,原型显示基本的生物

通过结构生成生物,语义细节也逼真

使用GAN生成生物的一个问题是,渲染图像的细微或低对比度部分时,可能会失去空间连贯性,尽管这些对人类具有很高的感知重要性。这样的例子包括眼睛,手指,甚至在具有相似纹理的重叠身体部位之间进行区分。GAN 生成的图像显示不匹配的身体部位生成嵌合体需要一个新的非摄影幻想风格的数据集,该数据集必须具有独特的特征,例如戏剧性的视角,构图和照明。现有的插图存储库不适合用作训练ML模型的数据集,因为它们可能会受到许可限制,样式冲突或缺少此任务所需的多样性。为了解决这个问题,研究团队开发了一种新的用户主导的半自动化方法,用于从3D生物模型创建ML训练数据集,这使得团队能够进行大规模工作并根据需要快速迭代。在此过程中,用户将创建或获取一组3D生物模型,每种所需的生物类型(例如鬣狗或狮子)都应建立一个模型。然后,用户制作了两组纹理,并使用虚拟引擎将其叠加在3D模型上——一组具有全彩色纹理(左图),另一组每个身体部位(例如头,耳朵,脖子, 等),称为「细分地图」(右图)。然后在训练中将第二部分身体部位细分提供给模型,以确保GAN了解到各种生物特定于身体部位的结构,形状,纹理和比例。实例数据集训练图像及其配对分割图这些3D生物模型都被放置在一个简单的3D场景中,同样使用了虚幻引擎。然后,一组自动化的脚本将采用这个3D场景,并在不同的姿势、视点和每个3D生物模型的缩放级别之间进行插值,创建全彩色图像和分割地图,形成 GAN 的训练数据集。使用这种方法,研究团队为每个3D 生物模型生成了10,000多张图片 + 分割图对,与手动生成这些数据相比,用户们节省了数百万小时的时间(每张图片大约20分钟)。

感知损失+Fine-Tuning,让怪物更「怪」

GAN 具有许多可以调整的超参数,导致输出图像的质量不同。为了更好地了解该模型的哪个版本比其他版本更好,向用户提供这些模型生成的不同生物类型的样本,并将其归纳为几个最佳示例。该研究团队收集了有关这些示例中存在的所需特征的反馈,例如深度感,有关生物纹理的样式以及面部和眼睛的真实感等。此信息不仅用于训练模型的新版本,而且能在模型生成成千上万的生物图像之后,从每种生物类别(例如瞪羚,山猫,大猩猩等)中选择最佳的图像。使用条件 GAN 创建生成的嵌合体研究团队通过关注感知损失对GAN进行了优化。该损失函数组件(也用于Stadia的Style Transfer ML中)使用从单独的卷积神经网络(CNN)提取的特征来计算两幅图像之间的差异,该卷积神经网络之前已经对ImageNet数据集中的数百万张照片进行了训练。从CNN的不同层提取特征,并对每个特征施加权重,这会影响特征对最终损耗值的贡献,这些权重对于确定最终生成的图像的外观至关重要。使用不同的感知损失重量生成的恐龙-蝙蝠嵌合体这是由GAN训练产生的一些生物,它们具有不同的感知损失权重,展示了模型可以处理的一小部分输出和姿势。使用不同模型生成的生物谷歌的该团队希望,这些GAN模型和Chimera Painter演示工具可以激发人们新的艺术创作思路——使用机器学习作为画笔时,可以创建什么?参考链接:https://ai.googleblog.com/2020/11/using-gans-to-create-fantastical.html

生成的头_谷歌新款怪物制造机,用GAN一键生成定制版哥斯拉相关推荐

  1. keil 生成三角波dac0832_傻瓜式印章制作工具,一键生成,不需要的不要看。

    今天给大家GTE一款印章工具 本印章制作生成器可以生成不同风格 不同字体的个性印章 先选择印章字体和样式 再输入2到4个汉字(名字)后 即可得到你设计的个性印章. 输入"李白"生成 ...

  2. python生成文章标题_利用简书首页文章标题数据生成词云

    原标题:利用简书首页文章标题数据生成词云 感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答.求职一站式搞定! ...

  3. sql 生成csv数据_创建包含SQL Server数据的动态生成的CSV文件

    sql 生成csv数据 介绍 ( Introduction ) A few months back, I presented a paper at SQL Saturday 327 in Johann ...

  4. python生成词云_今天玩点啥:使用python生成微信好友地域分析、微信昵称、个性签名词云...

    # -*- coding: UTF-8 -*- from wxpy import *from wxpy import * from os import path import re, jieba im ...

  5. 营业执照在线一键生成_如何在线制作证件照?证件照一键生成的方法

    如何在线制作证件照?每一年的毕业季也是就业季,几百多万的大学生都面临着找工作,而在工作之前必须准备好证件照,这样方便参加面试和入职.随着市场需求的逐步扩大,很多便捷的软件和网站都被设计出来了,比如小编 ...

  6. vue如何生成公钥私钥_百行Python代码演示1私钥生成多公链公钥原理。|区块链财富指北私钥篇(2)...

    <区块链财富指北>系列文章由NOCY.COM策划,肖南飞主笔撰写. 技术选型基于BOScore公链,旨在以有趣易懂的方式传播普及区块链技术,不构成任何投资建议! 学习之前说学习 今天这篇文 ...

  7. 插件怎么用_室内设计,3dmax插件教程,一键生成木地板

    大家好,今天给大家推荐的是一款地板插件.与以往室内地板的创建不同,平时我们是使用贴图的平铺来完成地面的铺设,而使用这款插件可以很方便的创建出地板的实体模型,相对于贴图来说更加真实. 下面我们就用这款插 ...

  8. ai自动配音_自媒体免费配音神器,一键生成100条AI配音

    随着短视频的大众化和低门槛化,从事短视频行业越来越容易,越来越多的人开始加入短视频制作领域.短视频制作离不开后期配音和字幕,但是对于很多初入短视频行业的个人和工作室来说,请专业的配音员也是一笔不小的成 ...

  9. python随机生成中文句子_关于python:从语法或Ngrams生成随机句子?

    我正在编写一个程序,该程序应该吐出一个我自己选择的复杂性的随机句子. 举一个具体的例子,我想通过吐出语法结构的有效句子并使用我已经学习过的单词来帮助我的语言学习. 尽管我愿意接受其他想法,但我想使用p ...

最新文章

  1. python语言标号_Python 编码为什么那么蛋疼?
  2. 【干货】迅雷产品经理:浅析用户成长体系
  3. oracle进城有哪些,oracle主要进程详解
  4. LeetCode 82 删除排序链表中的重复元素||-中等
  5. android 硬件对接,Android 对接硬件串口篇
  6. MySQL 字符串分割 SUBSTRING_INDEX函数
  7. Why Redis 4.0?
  8. SQL日期与时间函数
  9. 对AngularJS的编译和链接过程讲解一步到位的文章
  10. 【网络安全工程师面试合集】—邮件协议是如何被安全人员利用的?
  11. L2-006. 树的遍历-PAT团体程序设计天梯赛GPLT
  12. ubuntu GIT 安装与使用
  13. [Beta阶段]第十次Scrum Meeting
  14. 华为linux服务器系统安装,linux服务器系统安装
  15. 已知圆上三个点坐标,求圆半径 r 和 圆心坐标
  16. 【区块链开发入门】(二) 以太坊的编程接口
  17. HashSet模拟新浪微博用户注册
  18. JS正则表达式常见用法实例详解
  19. 论CTOR添加到11月BCH协议升级
  20. 数据结构学习:哈希表

热门文章

  1. 源码安装Tomcat及配置
  2. 金山逍遥网 sersync 服务器实时镜像同步方案
  3. 1 源码安装Zabbix agent 3.4
  4. Teraterm的Log设定
  5. bat中的[%~dp0]使用
  6. 【PostgreSQL-9.6.3】设置非自动提交
  7. redis缓存穿透,缓存击穿,缓存雪崩原因和解决方案
  8. nodejs连接mysql数据库,报错Client does not support authentication protocol requested by server的解决方法
  9. atomicReference 的使用和AtomicStampedReference 解决ABA的问题
  10. nginx部署vue前端,刷新出现404或者500错误的解决方案