看完 50000 张专辑封面,AI 设计师开始疯狂输出
西班牙艺术家利用 StyleGAN2 打造了一个 AI 设计师,借助 50000 张图像自学成才,没想到培养一个印象派设计师这么简单。
作者 | 三羊
来源 | HyperAI超神经
头图 | 网友整理抄袭事件的对比图
也许是有些设计太经典出挑,总是让人情不自禁地模仿。
日前,乘风破浪走向观众视线的孟佳发布新歌,专辑封面被指原封不动地抄袭抄袭 ins 网红。
没多久,演员宋祖儿的造型设计,也被指出像素级抄袭韩国明星专辑封面,甚至连原创水印都没去掉,可见在设计创意的确不容易。
从事创意工作的人,难免灵感枯竭,有意无意地参考、借鉴、模仿他人的作品。面对网友的声讨,不仅明星丢了颜面,设计师也失了水准口碑。
50000 张专辑封面,AI 设计师自学成才
同样是搬运后的二次创作,工具属性的 AI 似乎更理直气壮。西班牙鬼才艺术家 Bruno López,基于 50000 张 Spotify 上的专辑封面,让 NVIDIA 神器 StyleGAN2 自学成才, “进化”出了一个“没有感情的、抽象派专辑封面 AI 设计师”。
StyleGAN2 随机生成的专辑封面
StyleGAN2 从 50000 张 Spotify 专辑封面中,很快形成出一套自己的设计规范和风格流派。
真实的专辑封面基本上由两部分构成,文字及主视觉元素。
AI 的训练过程类似人类「看图画找规律」,在专辑封面的布局上,AI 看起来也深谙黄金比例、斐波那契数列、三分法等尺寸比例规范。
不过 AI 生成的专辑封面整体画风略微有些「诡异」,部分封面甚至可以用「恐怖」来形容:面容狰狞的人脸,少了一只眼球的眼睛,看不出是海浪还是动物尸骨的背景……更不用提模糊的文字、阴郁的色调。
StyleGAN2 随机生成的专辑封面,虽然画风清奇,但是配色及布局相对合理
除了受训练样本风格的影响外,这些伪影的出现也与模型本身有关。因为这 50000 个训练数据,均来自 Spotify 的编辑推荐榜单。没有限定音乐艺术风格,这导致单个风格的训练数据不足,出现了较为严重的伪影和斑点。
StyleGAN2 中用标准化代替归一化,可以去除图像中的特征伪影
StyleGAN 是一种全新的生成器网络结构,由 NVIDIA 发布。这一模型借鉴了风格迁移的相关技术,可以将目标物体的主要属性,逐层修改输入。
由于 AdaIN 中的实例归一化的存在,会导致风格迁移过程中丢失一些输入的关键信息,这就导致了生成图像中斑点及伪影的存在。
StyleGAN2 是 StyleGAN 的升级版,提升了生成图像的质量,极大减少了特征伪影的出现,在细节处理上也更加精细。
用 AI 画的封面,生成卡点音乐 MV
要想训练一个成熟的 AI 设计师,少不了训练数据和预训练模型。Bruno López 介绍了「AI 设计师」的诞生过程,还用这些封面做了一个抽象的 MV (音乐录影带)。
创建数据集:
1、找到 Spotify 中对应的 API,给定专辑 ID 可返回多个元数据,包括专辑封面。
2、写爬虫脚本,爬取 Spotify 编辑推荐列表中的专辑曲库,并下载专辑封面。
3、获取一个数量约为 50000,图像分辨率为 640x640 的数据集。
在 Spotify 中调用对应的 API
训练过程:
作者在 Google Colab Pro 中,用原始 StyleGAN2 的 skyflynil 实现进行了训练。过程耗时数天,在 50000 个 周期后停止。
单纯地依靠 AI 生成略显粗糙的专辑封面,在大艺术家 Bruno López 看来还差点意思。
而火遍社交网络的卡点视频,让他灵光乍现。
制作卡点视频:
作者基于 lhzbrian 写了一个 Python 脚本,创建随机潜在向量(random latent vector),随后对这些向量进行插值,以创建一个由 AI 生成的动画过渡。
为了让动画跟歌曲同步,作者非常机智地使用了 PyDub,让插值的速度跟每一帧的节拍音量同步。
最后,利用 Pillow 的 Image 模块及 OpenCV 的人脸检测功能,脚本就能只使用潜在向量,生成具有指定特征(如不包括人脸的黄色专辑封面)的图像。
AI 生成封面组成的《Interference》卡点 MV
Bruno 还非常体贴地考虑到了观众体验,毕竟一个数秒的片段总有种意犹未尽的感觉。为了让最终成片更具有观赏性,Bruno 想到了排列组合。
他先是生成具有不同属性的多个片段,然后用Premiere 压成一个视频,这就是最终的「Interference 音乐视频」成片。
风格迁移,创意也迁移?
在艺术上,创作与模仿的边界在哪里?
从创作过程来说,艺术创作都是从临摹开始,临摹大自然,临摹社会。StyleGAN2 在学习生成专辑封面的过程中,充分再现了从临摹他人到形成个人风格的过程。
画家齐白石主张艺术「妙在似与不似之间」,他的画风格清新、星神兼备,自成一派。其实齐老在早年间,也是从临摹他人画作开始的。在不断地鉴赏、临摹、思考中,逐渐找到了自己的个人风格。
据央视纪录片记载,齐白石早年也曾临摹他人画作
再反观「设计界的搬运工」的像素级抄袭,署上自己的大名,甚至用于商业获利。从业务能力和职业道德上来看,这些创作者确实还不如 AI。
您觉得呢?
#欢迎来评论区聊聊#
参考:
https://arxiv.org/pdf/1912.04958.pdf
https://thenextweb.com/neural/2021/03/08/ai-music-video-deep-learning-algorithm-stylegan2-album-covers-spotify-gans/
https://docs.google.com/document/d/1qePvtKTJ3lbpxKfiJ1cn0wAVLazza0Zux4Lb-aTHuBE/edit?usp=sharing
更多精彩推荐
☞百度香港二次上市,12 岁开发者、AI 机器人同台敲响“芯片代码锣”☞GitLab 在中国成立公司极狐,GitHub 还会远吗?☞又一个Jupyter神器,操作Excel自动生成Python代码
点分享点收藏点点赞点在看
看完 50000 张专辑封面,AI 设计师开始疯狂输出相关推荐
- 看完 50000 张专辑封面后,AI 设计师疯狂输出
来源:HyperAI超神经本文约1700字,建议阅读6分钟西班牙艺术家利用 StyleGAN2 打造了一个 AI 设计师,借助 50000 张图像自学成才,没想到培养一个印象派设计师这么简单. 关键词 ...
- 一周 AIGC 丨谷歌正面反击 GPT-4,Claude 一分钟看完万字长文,Stability AI 发布文生动画工具...
AIGC 再进化,谷歌在 2023 年 I/O 开发者大会上宣布面向所有用户开放 MusicLM 模型,输入文字描述即可生成音乐.GPT4 最强对手 Anthropic Claude 史诗升级,百页资 ...
- amd为什么还用针脚_为啥AMD处理器没散片,而Intel却有,看完这张图就懂了
今天在找素材的时候看到一张很有意思的图片,这张图片很好的诠释了为啥Intel处理器有散片而AMD却没有.从下面图片中我们可以看到,Intel的散片处理器很多都是通过小姐姐带进国内的,这也就意味着不用交 ...
- matlab画服装版,设计师必备款式图干货|如何绘制一张完美的款式图?看完这些你就懂了...
原标题:设计师必备款式图干货|如何绘制一张完美的款式图?看完这些你就懂了 *服装设计是艺术和技术的完美结合,服装设计是通过服装设计师经过市场调查,分析各种流行因素,进行设计构思,然后绘制出设计草图和效 ...
- max创意量子计算机,看完AdobeMax2020,80%的设计师都把Mac砸了……
作者:美丫姐,来源:你丫才美工 - 设计师的带薪拉屎好时光 没准儿,就到今儿为止了 正当国内不少设计师们,努力盘算双十一买啥更省钱时,一年一度的设计界盛典AdobeMax,正在大洋彼岸举办着. 虽说早 ...
- AI设计师“鹿班”核心技术公开:如何1秒设计8000张海报? 1
阿里妹导读:AI 改变了围棋,现在也在改变海报设计.阿里有一位名为 "鹿班" 的 AI 设计师,平均 1 秒钟就能完成 8000 张海报设计,一天可以制作 4000 万张,单单去年 ...
- AI设计师“鲁班”进化史:每秒制作8000张双11海报,没一张雷同!
在过去,每年双11,设计师们都会开启狂加班模式:做海报.改文字.换商品.调设计.换 banner,每个设计师对接几个运营人员,富士康流水线一样的重复性工作.一年双 11 下来,完成上亿张海报. 然而, ...
- AI设计师“鲁班”进化史:每秒制作8000张双11海报,没有一张雷同!
在过去,每年双11,设计师们都会开启狂加班模式:做海报.改文字.换商品.调设计.换 banner,每个设计师对接几个运营人员,富士康流水线一样的重复性工作.一年双 11 下来,完成上亿张海报. 然而, ...
- 看完300份作品集后,我想给求职的设计师们提点建议
近段时间我司一直在招设计师,就这一个设计岗,我就收到了近三百份简历. 当我一一看完这几百份作品集后,我意识到很多求职者在作品集的制作上还存在很多问题.且不说作品本身的好坏,单就作品集来看,90%以上都 ...
最新文章
- 初学者指南:使用 Numpy、Keras 和 PyTorch 实现最简单的机器学习模型线性回归
- Linux内核参数调优
- mysql创建表的时候对字段和表添加COMMENT
- 如何快速解决虚拟机中的CentOS7无法上网的方式
- 如何修改VC6的项目名
- Mysql基本用法-left join、right join、 inner join、子查询和join-02
- NoSuchElementException
- jsp获得文件的绝对路径
- php yii 表单title,Yii2.0-ActiveForm表单结构自定义教程
- 飞鸽传书2007程序语言的面向对象最后会成自然语言吗?
- 大数据平台搭建_一文读懂数据平台、大数据平台、数据中台
- springboot11 模板引擎
- 拓端tecdat|R语言Gibbs抽样的贝叶斯简单线性回归仿真分析
- (String)、toString()、String.valueOf区别
- 阿里矢量图三种在线引用方法
- php7.2 eregi,php – 函数eregi()已弃用
- 使用java编写中国象棋(内含源代码)
- Elasticsearch索引分片的数量及大小分配策略
- exsi 无法打开虚拟机 执行此操作的权限被拒绝[解决]
- MACOS 打开 Pycharm2020 闪退解决方法
热门文章
- 重磅!MaxCompute助力阿里开源自研语音识别模型DFSMN,准确率高达96.04%
- 2016政策与市场协同发力大数据,小公司如何搏杀BAT?
- Vue 数组中更新属性值后,视图不更新,等待其他元素更新后会触发的解决办法...
- JDBC实例--工具类升级,使用Apache DBCP连接池重构DBUtility,让连接数据库更有效,更安全...
- chsop 兼容jquery(解决与transport.js冲突)
- Linux下多播的配置【十全十美】
- MVVM开发模式MVVM Light Toolkit中使用事件和参数传递
- 图说:Windows 8使用搜索,快速开启应用
- UPDATE STATISTICS 有何妙用?
- [译]怎样用VisualStudio查看非托管代码