雷锋网 AI 科技评论按:能够迭代进化、模仿指定数据特征的GAN(生成式对抗性网络)已经是公认的处理图像生成问题的好方法,自从提出以来相关的研究成果不少,在图像增强、超分辨率、风格转换任务中的效果可谓是惊人的。 (具体可以参见 Valse 2017 | 生成对抗网络(GAN)研究年度进展评述 - 雷锋网(公众号:雷锋网) )

利用GAN达到图像超分辨率和风格转换示例

今年也有利用GAN做的简笔画到图像转换模型pix2pix(代码地址 https://github.com/phillipi/pix2pix  ,demo地址 https://affinelayer.com/pixsrv/  )。除了下图转换猫的,还有建筑物的、鞋子的、包包的,模型非常有想象力,随便画也没关系,感兴趣的读者可以自己到demo地址里画画看。

demo中用把线条转换成猫的示例

GAN能生成艺术作品吗?

GAN既然已经有如此的图像生成能力了,我们能不能用GAN生成艺术作品呢,毕竟许多现代艺术作品看照片好像也并不怎么复杂,比如下面这幅;超写实主义的就更不用说了。

蒙德里安《红黄蓝的构成》

然而,要创造出一副人类觉得有艺术价值的作品并没有那么简单。人类喜欢创新性的作品,人类不喜欢完全模仿的作品;《蒙娜丽莎》和《兰亭集序》只有原作者的原版才被认可是世界艺术瑰宝,后世的人就算基于它们创作,也要有自己的创新,才能带来新的艺术价值,才能被观赏者认可。

根据GAN的基本结构,鉴别器D要判断生成器G生成的图像是否和其它已经提供给鉴别器D的图像是同一个类别(特征相符),这就决定了最好的情况下输出的图像也只能是对现有作品的模仿,如果有创新,就会被鉴别器D识别出来,就达不成目标了。上面几个GAN的例子就能体现出鉴别器D带来的这个特点,用GAN生成的艺术作品也就注定缺乏实质性的创新,艺术价值有限。

那么,能不能让GAN具有一些创新的能力,让这些创新有艺术价值、带有这些创新的作品还能够被人类认可呢?罗格斯大学艺术与人工智能实验室、Facebook人工智能研究院(FAIR)、查尔斯顿学院艺术史系三方合作的这篇论文就通过CAN(Creative Adversarial Network,创造性对抗网络)给出了一种答案。神经网络库Keras的作者François Chollet也在Twitter上推荐了这篇文章。

先看看作品如何

CAN模型生成的一些艺术作品

可以看到,生成的艺术作品风格非常多样,从简单的抽象画到复杂的线条组合都有,内容层次也有区分。论文中也有对比测试结果,CAN生成的作品不仅比GAN生成的更讨人喜欢,甚至来自巴塞尔艺术展的人类艺术作品都比不上CAN。(具体数据看后文)

如何认识艺术创新

刚才说到,艺术作品需要有创新性,CAN中的C就是Creative,创新性的意思。那么创新性要如何衡量呢、如何达到呢?

以往基于GAN的图像生成方法研究中,人类可以把训练好的网络生成的图像和客观事实相对比(超分辨率、图像补全问题中)或者根据经验判断(风格转换问题中),用来衡量网络的效果;也有过一些更早期的算法,让人类作为训练反馈的一环,引导网络的训练过程。但是对于这次的课题需要设计一个能自动训练和生成、还要衡量作品的创新性的系统而言,以往的方法就起不到什么帮助。

同时,在作者们看来,为了能模仿人类艺术创作的过程,算法中很重要的一部分就是要把算法的创意过程和人类艺术家以往的艺术作品联系起来,像人类一样把对以往艺术的理解和创造新艺术形态的能力整合在一起。 为了能够想办法找到一个能够衡量创新性、参与迭代训练的创新性指标,作者们找来了一组艺术理论。

  • D.E.Berlyne认为,从生理心理学的角度讲,人类的状态中有一种叫做“唤醒水平”的指标,它可以衡量一个人有多警醒、多兴奋;唤醒水平可以从最低的睡觉、休息,一直到暴怒、激动。而一副作品具有“唤醒潜力”的总体特质,它可以提升或者降低观者的唤醒水平;它是作品新颖性、意外性、复杂性、多义性和疑惑性高低的综合体现,这几个属性越高,作品的唤醒潜力就越高。

  • Colin Martindale(1943-2008)提出过一个假说,他认为在任一时刻,创意艺术家们都会尝试增加他们作品的“唤醒潜力”,这就是一种拓宽创作习惯边界的方法。但是,这种增加动作必须使得观察者的负面反应尽可能小(尽量使观察者不付出额外的努力),否则过于激进的产品就会受到负面的评价。

  • Colin Martindale还提出过一个假说,他认为当艺术家探索艺术风格的更多作用的时候,转换艺术风格就会有提高“唤醒潜力”的作用。

这组理论只是解释艺术创新的理论中的寥寥几个,但是它们综合起来给出了两个具有计算性的、可以用于迭代训练的指标:

  1. 创新作品的创新程度不能过高,观者不认为作品是艺术作品的可能性应当尽可能小;

  2. 新的艺术风格就是创新的体现。

CAN网络的构建

根据提炼出的这两个指标,论文中基于GAN的原型构建了这样一种新型的对抗性网络CAN。

CAN模型的系统框图

首先,对于“指标1:创新作品的创新程度不能过高,观者不认为作品是艺术作品的可能性应当尽可能小”,就可以转换为经典的对抗性网络,G生成图像,经过艺术作品训练过的D判断G生成图像的是不是艺术作品。这样的对抗性网络生成的图像就已经可以被人类看作是艺术作品。

然后,论文中的模型还根据“指标2:新的艺术风格就是创新的体现”增加了一部分新结构用来处理艺术风格。

论文中使用了25类不同的带标签艺术作品用于D的训练,包含了抽象印象派、立体派、现代派、巴洛克、文艺复兴早期等等风格的共7万5千多幅。然后经过训练的D除了要反馈一幅图像“是否是艺术作品”外,还要反馈“能否分辨图像是哪种艺术风格”。G然后就会利用D的反馈生成尽量难以分辨艺术风格的图像——难以归类到现有分类中的,就是创新了。

“是否是艺术作品”、“是否难以分辨艺术风格”是两种对立的信号,前一种信号会迫使生成器G生成能够被看作的艺术的图像,但是假如它在现有的艺术风格范畴中就达到了这个目标,鉴别器D就能够分辨出图像的艺术风格了,然后生成器就会受到惩罚。这样后一种信号就会让生成器生成难以分辨风格的作品。所以两种信号就可以共同作用,让生成器能够尽可能探索整个创意空间中艺术作品的范围边界,同时最大化生成的作品尽可能游离于现有的标准艺术风格之外。

这也就是论文标题「CAN: Creative Adversarial Networks Generating “Art” by Learning About Styles and Deviating from Style Norms」的含义,创造性对抗网络可以学习艺术风格,然后背离这些现有的风格进行艺术创作。

还说艺术风格,现在是“不好分辨”,“好分辨”不行吗?

相比GAN,CAN增加的反馈是“是否难以分辨艺术风格”,追求的是生成的图像艺术风格难以分辨。虽然根据艺术理论的推导,新的艺术风格是一种创新,但既然是多加了一个反馈,追求“生成的图像艺术风格容易分辨”可以吗?会不会也能生成不错的作品呢?

从另一个角度看,假如追求“难以分辨”的CAN确实比追求“容易分辨”的CAN生成的图像更好,那这就是模型选取了合理的反馈的最佳体现。

说做就做。除了CAN之外,论文中还建立了三种模型用来对比。

  • DCGAN  64x64:经过艺术作品训练的DCGAN(深度卷积生成式对抗网络),输出分辨率为64x64

  • DCGAN 256x256:相比DCGAN  64x64,生成器多加了两层网络,输出分辨率为256x256

  • scCAN:style-classification-CAN,追求“生成的图像艺术风格容易分辨”的CAN

这三种模型生成的画面像下面这样

两种DCGAN和scCAN生成的画面

scCAN生成的画面中确实有了可辨认的风格,比如人物特写、风景或者群像。但是直观看上去并不怎么讨人喜欢。

让我们再来看一组CAN生成的图像,上方是人类评价最高的、下方是人类评价最低的。应该说都比scCAN生成的图像精彩得多。

人类评价最高和最低的CAN生成的图像

人类能给CAN的图像打几分?

根据刚才的图像可以看到,CAN的效果当然不错,DCGAN 256x256的图像其实也挺好。那么CAN的图像对观画的人来说是不是真的已经难以分辨创作者了呢?跟真的艺术家创作的作品相比高下又如何呢?

为了具体比较,论文中做了几个实验,让人类给不同组的作品打分。

实验1、2: 来自抽象印象派艺术家的作品、选自巴塞尔艺术展的作品、CAN生成的图像、DCGAN生成的图像,一共4组作品,由普通人判断这些作品来自人还是电脑,并给作品打分。

结果:实验1里有53%的人认为CAN的图像是来自人类的,认为DCGAN 64x64的图像来自人的有35%; 实验2里认为CAN的图像来自人类的比例是75%,DCGAN 256x256则是65%。来自抽象印象派艺术家的作品无疑是比例最高的,但有意思的是,两个实验里认为巴塞尔艺术展的作品来自人的比例都还不如CAN高(实验1中41%,实验2中48%)。

实验2的结果数据,先让人类评价者从几个角度评价作品,再判断是否是人类创作的。认为图像是人类创作的评价者比例为Q6

实验3:让人类评价者从用心程度、视觉结构、互动性、启发性几个角度给作品评分,结果CAN全部得分最高。这个结果可谓出人意料。

实验3结果数据

实验4:为了确认CAN和scCAN之间新颖性和美学表现的高低,请了一群艺术史学生对随机选出的CAN和scCAN图像进行评价。认为CAN的图像更新颖的比例为59.47%,认为CAN的图像更加有美学吸引力的比例为60%,确实有显著区别。

结论

论文中表示,虽然这样的模型还是不能对艺术风格概念有任何语义方面的理解,不过它确实展现出了从以往的艺术作品中学习的能力。至于为什么人类会在多个方面给CAN打出高分,作者们也希望和大家进行开放性的探讨。

论文原文地址: https://arxiv.org/abs/1706.07068 ,雷锋网 AI 科技评论编译

本文作者:杨晓凡

本文转自雷锋网禁止二次转载,原文链接

解读Facebook CAN:如何给人工智能赋予艺术创作的力量相关推荐

  1. Facebook的首席技术官:人工智能已用于内容审核,未来会做更多

    https://www.toutiao.com/a6696362352897425927/ 原文载于Fast Company,作者Harry McCracken 2017年,Facebook因平台内容 ...

  2. 中国人工智能学会通讯——艺术与人工智能的明天——人机信任合作 一、人工智能在艺术上的发展...

    今天非常开心有这个机会,让我谈一下未来人工智能对于人类艺术方面的结合.我今天探讨的中心是人机的信任合作,我相信这是艺术与人工智能的明天. 去年,AlphaGO基本上实现了全机器性质的计算学习,打败了人 ...

  3. 【干货贴】当人工智能与艺术碰撞 | AI写诗

    生成式人工智能产品(AIGC) ​前几天,扎克伯格称:Meta 将组建顶级 AI 团队,专注生成式人工智能产品,在短期内,公司将专注于构建创造性和表现力的工具. 说到富有创造力和表现力的艺术行为,首先 ...

  4. 万物皆可NFT 人工智能与艺术有着天然的关联性

    "我们觉得好的NFT.符合区块链精神的NFT,实际上是由很多的要素构成的,至少包括多模态的交互,这里多模态其实是对艺术图形表现形式的多维,它不光有2D.3D,不光有图片,还有文字.声音.视频 ...

  5. AI通过了艺术创作图灵测试,你根本分不出来作者是不是人

    各位geek朋友们,今年不用再看画了:近年来最大的艺术成就已经发生了. 这项艺术成就的诞生地,不是北京.新加坡.柏林郊区颜料四溅的画室中,不是威尼斯双年展上.请记住它出现的地点:美国新泽西州新布朗斯维 ...

  6. 计算机对油画的影响,现代电脑美术影响下的油画艺术创作

    摘要: "21世纪的文盲不是不识字,而是不会读图."随着视觉文化和电脑网络的快速发展,计算机技术也广泛地涵盖了整个意识形态领域.图像已成为这个时代的最大资源,我们已经快速进入&qu ...

  7. 2020年四川省大型舞台艺术创作申报材料流程及申请奖励补助

    关于四川省大型舞台艺术创作的申报已经开始了,你申请书写好了吗?还不清楚的赶紧来看看吧!具体的内容整理如下!请各企业根据实际情况进行申报,相关咨询了解请联系我们. 资助范围 资助在申报时已经完成项目策划 ...

  8. 铁匠smith_铁匠的制作:概念和艺术创作

    铁匠smith For our second blog post in this series, the team reveals some sources of inspiration behind ...

  9. 直播预告:如何用“错误”的方式进行CG艺术创作

    从小我们就被教导用对的方式做事,但你知道用"错误"的方式也可以成功吗? 本次瑞云直播,我们邀请了新锐艺术家刘鑫,为大家介绍先锋的CG艺术创作理念,一起探讨技术与艺术的关系,教你如何 ...

最新文章

  1. 素数、最大公约数、最下公倍数、质因数分解
  2. java 代理的三种实现方式
  3. android studio安装在其他盘,Android Studio配置移动到D盘(亲测)
  4. Keymob浅析2016网络营销十大趋势
  5. Apache Nifi 入门与进阶 GitChat连接
  6. phpcms网站搬家至服务器
  7. 3-Scala控制结构
  8. 【编译原理笔记01】什么是编译,编译系统各结构作用
  9. Tomcat and solr 环境配置
  10. 深入理解和使用nginx
  11. PHP文件需要反编译吗,php dezender批量反编译php加密文件
  12. ubuntu格式化磁盘并挂载
  13. iPhone 开发常用工具
  14. SBG Ellipse2最强替代型号推荐?AHRS INS/GNSS
  15. 线性同余方程和矩阵乘法
  16. 《如何阅读一本书》——读书方法的整理
  17. Nginx----web服务器,反向代理服务器
  18. springboot+jpa+mysql Springboot+jpa+jdbc+sqlserver 使用时遇到的一系列的问题
  19. 毕设项目-人脸识别考勤签到系统
  20. RFID MFRC522

热门文章

  1. MPU6050开发 -- 卡尔曼滤波(转)
  2. 【10.20校内测试】【小模拟】【无向图建树判奇偶环】【树上差分】
  3. iOS开发 - App程序启动原理
  4. Golang使用pkg-config自动获取头文件和链接库的方法
  5. 【编程练习】正整数分解为几个连续自然数之和
  6. spring配置文件-------通配符
  7. 【短语学习】盈余量分析(earned value analysis)
  8. Google Map浏览下载器
  9. 解决Spring下无法实时访问本地静态资源
  10. 硬件知识:电脑组装机必备的知识梳理