看完 50000 张专辑封面后,AI 设计师疯狂输出
来源:HyperAI超神经本文约1700字,建议阅读6分钟西班牙艺术家利用 StyleGAN2 打造了一个 AI 设计师,借助 50000 张图像自学成才,没想到培养一个印象派设计师这么简单。
关键词:StyleGAN2 AI 艺术创作
也许是有些设计太经典出挑,总是让人情不自禁地模仿。
前日,乘风破浪走向观众视线的孟佳发布新歌,专辑封面被指原封不动地抄袭抄袭 ins 网红;
没多久,演员宋祖儿的造型设计,也被指出像素级抄袭韩国明星专辑封面,甚至连原创水印都没去掉,可见在设计创意的确不容易。
网友整理抄袭事件的对比图
从事创意工作的人,难免灵感枯竭,有意无意地参考、借鉴、模仿他人的作品。
「艺术家的事儿,能算偷吗?」
算,面对网友的声讨,不仅明星丢了颜面,设计师也失了水准口碑。
50000 张专辑封面,AI 设计师自学成才
同样是搬运后的二次创作,工具属性的 AI 似乎更理直气壮。
西班牙鬼才艺术家 Bruno López,基于 50000 张 Spotify 上的专辑封面,让 NVIDIA 神器 StyleGAN2 自学成才, 「进化」出了一个「没有感情的、抽象派专辑封面 AI 设计师」。
StyleGAN2随机生成的专辑封面
StyleGAN2 从 50000 张 Spotify 专辑封面中,很快形成出一套自己的设计规范和风格流派。
真实的专辑封面基本上由两部分构成,文字及主视觉元素。
AI 的训练过程类似人类「看图画找规律」,在专辑封面的布局上,AI 看起来也深谙黄金比例、斐波那契数列、三分法等尺寸比例规范。
不过 AI 生成的专辑封面整体画风略微有些「诡异」,部分封面甚至可以用「恐怖」来形容:面容狰狞的人脸,少了一只眼球的眼睛,看不出是海浪还是动物尸骨的背景……更不用提模糊的文字、阴郁的色调。
StyleGAN2 随机生成的专辑封面
虽然画风清奇,但是配色及布局相对合理
除了受训练样本风格的影响外,这些伪影的出现也与模型本身有关。因为这 50000 个训练数据,均来自 Spotify 的编辑推荐榜单。没有限定音乐艺术风格,这导致单个风格的训练数据不足,出现了较为严重的伪影和斑点。
StyleGAN2 中用标准化代替归一化
可以去除图像中的特征伪影
StyleGAN 是一种全新的生成器网络结构,由 NVIDIA 发布。这一模型借鉴了风格迁移的相关技术,可以将目标物体的主要属性,逐层修改输入。
由于 AdaIN 中的实例归一化的存在,会导致风格迁移过程中丢失一些输入的关键信息,这就导致了生成图像中斑点及伪影的存在。
StyleGAN2 是 StyleGAN 的升级版,提升了生成图像的质量,极大减少了特征伪影的出现,在细节处理上也更加精细。
用 AI 画的封面,生成卡点音乐 MV
要想训练一个成熟的 AI 设计师,少不了训练数据和预训练模型。Bruno López 介绍了「AI 设计师」的诞生过程,还用这些封面做了一个抽象的 MV (音乐录影带)。
创建数据集:
找到 Spotify 中对应的 API,给定专辑 ID 可返回多个元数据,包括专辑封面。
写爬虫脚本,爬取 Spotify 编辑推荐列表中的专辑曲库,并下载专辑封面。
获取一个数量约为 50000,图像分辨率为 640x640 的数据集。
在 Spotify 中调用对应的 API
训练过程:
作者在 Google Colab Pro 中,用原始 StyleGAN2 的 skyflynil 实现进行了训练。过程耗时数天,在 50000 个 周期后停止。
单纯地依靠 AI 生成略显粗糙的专辑封面,在大艺术家 Bruno López 看来还差点意思。
而火遍社交网络的卡点视频,让他灵光乍现。
制作卡点视频:
作者基于 lhzbrian 写了一个 Python 脚本,创建随机潜在向量(random latent vector),随后对这些向量进行插值,以创建一个由 AI 生成的动画过渡。
为了让动画跟歌曲同步,作者非常机智地使用了 PyDub,让插值的速度跟每一帧的节拍音量同步。
最后,利用 Pillow 的 Image 模块及 OpenCV 的人脸检测功能,脚本就能只使用潜在向量,生成具有指定特征(如不包括人脸的黄色专辑封面)的图像。
AI 生成封面组成的《Interference》卡点 MV
Bruno 还非常体贴地考虑到了观众体验,毕竟一个数秒的片段总有种意犹未尽的感觉。为了让最终成片更具有观赏性,Bruno 想到了排列组合。
他先是生成具有不同属性的多个片段,然后用Premiere 压成一个视频,这就是最终的「Interference 音乐视频」成片。
风格迁移,创意也迁移?
在艺术上,创作与模仿的边界在哪里?
从创作过程来说,艺术创作都是从临摹开始,临摹大自然,临摹社会。StyleGAN2 在学习生成专辑封面的过程中,充分再现了从临摹他人到形成个人风格的过程。
画家齐白石主张艺术「妙在似与不似之间」,他的画风格清新、形神兼备,自成一派。其实齐老在早年间,也是从临摹他人画作开始的。在不断地鉴赏、临摹、思考中,逐渐找到了自己的个人风格。
据央视纪录片记载,齐白石早年也曾临摹他人画作
再反观「设计界的搬运工」的像素级抄袭,署上自己的大名,甚至用于商业获利。从业务能力和职业道德上来看,这些创作者确实还不如 AI。
参考:
https://arxiv.org/pdf/1912.04958.pdf
https://thenextweb.com/neural/2021/03/08/ai-music-video-deep-learning-algorithm-stylegan2-album-covers-spotify-gans/
https://docs.google.com/document/d/1qePvtKTJ3lbpxKfiJ1cn0wAVLazza0Zux4Lb-aTHuBE/edit?usp=sharing
编辑:黄继彦
看完 50000 张专辑封面后,AI 设计师疯狂输出相关推荐
- 看完 50000 张专辑封面,AI 设计师开始疯狂输出
西班牙艺术家利用 StyleGAN2 打造了一个 AI 设计师,借助 50000 张图像自学成才,没想到培养一个印象派设计师这么简单. 作者 | 三羊 来源 | HyperAI超神经 头图 | 网友整 ...
- 我在名牌大学毕业后的经历 (看完感动,涌动,后泪流)
我在名牌大学毕业后的经历 (看完感动,涌动,后泪流) 我是82年,大学毕业3年5个月.现在一家大型市场咨询公司,自己带一个组,月薪16000,未算其他收入与分红.也就是传统意义上的白领打工仔.在北京, ...
- 看完这篇 Linux 权限后,通透了
我们在使用 Linux 的过程中,或多或少都会遇到一些关于使用者和群组的问题,比如最常见的你想要在某个路径下执行某个指令,会经常出现这个错误提示 . permission denied 反正我大概率见 ...
- 3分钟看完一篇论文,这个AI文本生成模型把今年NeurIPS 2300+篇总结了个遍
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 行早 发自 凹非寺 量子位 报道 | 公众号 QbitAI 今年Ne ...
- 用带遗传算法的神经网络解决贪吃蛇问题,看完这篇,从游戏AI角度理解神经网络!(一)
Designing AI: Solving Snake with Evolution--AI设计:用进化算法解决贪吃蛇问题 前言 The Game of Snake Choosing a Method ...
- 看完2017年这10大AI失败案例,就知道什么是人工智障了
本文授权转自网路冷眼(微信公众号:gh_37ca35f41890) 现在尽管我们大多人自然是机器智能的粉丝,但是我们也必须意识到一些新技术正在努力地有效地执行他们的任务,经常以人类不会犯错的方式出错. ...
- startuml如何画流程图_因为流程图没画好SCI被拒稿!看完师姐的攻略后我被吊打了!...
写SCI论文常常会遇到一个问题:对自己的研究很熟悉,但是如何把自己的研究过程介绍给读者则不是一件那么容易的事情.如果不能让读者了解研究过程,读者会对研究结果是否合理.如何应用存在疑问:尤其是期刊编辑和 ...
- 【java版数据结构】看完数据结构的顺序结构后,紧接着去实现ArrayList的底层(150行代码,数组扩容,增删改查,但未实现迭代器)
实现效果: 需求分析: 可以看到ArrayList容器有很多功能,在指定位置添加元素,在容器末尾添加元素,获取指定位置的元素,获取容器的大小,清空容器的元素,判断容器是否是空的,删除指定位置的元素,删 ...
- amd为什么还用针脚_为啥AMD处理器没散片,而Intel却有,看完这张图就懂了
今天在找素材的时候看到一张很有意思的图片,这张图片很好的诠释了为啥Intel处理器有散片而AMD却没有.从下面图片中我们可以看到,Intel的散片处理器很多都是通过小姐姐带进国内的,这也就意味着不用交 ...
最新文章
- python生成简单的FTP弱口令扫描
- apache集成tomcat,并根据域名进行分发 屏蔽端口显示
- 后台提示云提醒未激活 点击激活删除方法
- LeetCode Valid Parentheses(判断括号是否匹配)
- antd + react model自定义footer_使用ESLint+Prettier规范React+Typescript项目
- 【超100%解法】剑指 Offer 33. 二叉搜索树的后序遍历序列
- MFC序列化(serial)简单例子
- mysql参数配置详情_MySQL配置文件mysql.ini参数详解、MySQL性能优化
- Zookeeper Listener分析
- 《Python入门到精通》函数
- 解决Spring MVC整合Shiro出现无法访问静态资源文件的问题
- dp HDU - 5074
- STM32F4: Generating parallel signals with the FSMC
- 进销存excel_用Excel制作简单的进销存系统
- 概念学习(Concept learning)
- c语言课程设计 雪花飘落,c雪花飘落课程设计.doc
- 热门好用的手机号码归属地API
- Java final与static
- Exp5 MSF基础应用 20164323段钊阳
- 电感和磁珠有哪些区别?
热门文章
- csv 逗号数量不一样_敲黑板,表格后缀xls、xlsx、xlsb、xlsm、csv分别是什么意思?...
- 一九四六年首台电子计算机,2012年计算机一级MsOffice第四十九套练习题及答案解析...
- 深入实践Spring Boot2.3.2 文档建模
- WEBAPI 帖子收藏
- java排序——桶排序
- 【解题报告】【HDOJ1233】【最小生成树】还是畅通工程
- 博客园的“随笔、文章、新闻、日记有啥区别”
- iPhone开发四剑客之《iPhone开发秘籍》
- Double Precision Format(DPF)
- 亲历惊心48小时抢救35亿交易数据