全文共6066字,预计学习时长12分钟

VR欧泊蝴蝶/Pamela Davis Kivelson
人类的艺术体验(绘画、音乐、雕塑、诗歌)往往融入了各种感官、联想、记忆和情感,并涉及人们所谓的“意识”。目前AI还不具备主观体验和多模态,但已经开始获得艺术创造力。创造力必须以意识体验能力为前提吗?答案是否定的。多模态、监督学习和人机协作将大大提高创意机器人的性能,因此专用AI的创造力或许很快就能赶超人类,同时它们也能更好地捕获和代表集体经验。大多数艺术品都是对复杂的感官模式和联想的识别与操纵,而这恰恰是AI所擅长的。因此,超级创造力——即一系列远超人类能力的创造性过程和结果——也许近在眼前。
创造力是个很简单的玩意儿。意识、智慧,这些才是困难所在。
David Cope
基于绘画作品《拿破仑翻越阿尔卑斯山》生成的AI图片
图源: u/vic8760/Reddit.

人类的艺术体验包含多种感官、联想、记忆和情感,并涉及有意识和超意识的过程。想象你正在听最喜欢的歌:每一个旋律,每一处和谐的起承转合,都与一些独特的情感有着微妙的联系,例如兴奋、平静、怀旧、嬉闹。在音乐的熏陶下,那些画面、场景和想法不断地在你脑海里跳跃,你甚至会想起一些历史和文化事件。音乐具有很强的暗示性,可以改变听众对生活体验的情感解释。电影制作人对此深谙于心,他们会利用恰到好处的配乐来操纵观众对每个场景的情绪反应。同样,绘画、雕塑、故事和诗歌也能激发情感、记忆和其他感官性的联想。可以说,如果一件艺术品无法触发多种感官的情感体验,无法激发丰富的联想,那么它一定不是优秀的艺术品。

目前尚不清楚的是,创造艺术需要何种程度的人类对艺术的体验能力。虽然AI缺乏人类的艺术感知力,但它是否也能像人类作曲家、画家一样创造艺术?越来越多的证据(尤其在绘画和音乐方面)显示,艺术创造力并不以主观体验能力为前提,而是可以由AI从人类创造的艺术和反馈中习得的。随着AI在模式和联想式学习方面能力增强,并且得到更多人类的反馈,它创造的艺术,将能够以越来越复杂的联想,引发越来越丰富的多感官体验和人类情感。也就是说,AI能创造出越来越高端的艺术,甚至有可能超越人类。

艺术创造力并不以主观体验能力为前提

科技永远在激发人类的创造力——看看史前洞穴中那些用原始工具创作的壁画,再看看几个世纪后,人们用刷子和五彩斑斓的颜料创作的绘画,还有钢琴的发明,以及被称为“第七艺术”的电影艺术的发展。人类与机器日益密切的合作有望推动艺术的下一次科技突破,创作出前所未有的艺术品。

如今的AI与艺术

人们已经将深度学习用于对人类画家进行风格模仿,并无可否认地创造出了高品质的艺术品。卷积神经网络通过对画家的风格进行编码——从较低等级的笔触,乃至空间感知和构图,抑或是画作本身,对抗生成网络(GAN)在此基础上生成逼真的绘画,例如肖像画或抽象裸体,从而实现风格迁移。第一幅被拍卖的AI绘画正是GAN(由19岁的斯坦福大学研究员Robbie Barrat开发)生成的,这幅画在佳士得拍卖行以432,500美元的价格成交。像Robbie Barrat 和Mario Klingemann这样的AI艺术家仍在进行充满创意的AI作品创作,例如输入数据、训练AI、再选出最优秀的作品。然而,由于AI艺术品与人类艺术品的区分度很小,越来越多独立的AI画家也许将要涌现。

《屠夫的儿子》/Mario Klingemann(2018年“流明数码艺术奖”获得者)

David Cope是来自加州大学圣克鲁兹分校的作曲家和音乐教授,早在深度学习诞生之前,他就已经在AI音乐领域做出了开创性工作。1981年以来,他一直致力于通过算法提炼音乐的本质,这些算法对特定作曲家的音乐进行解构和模式识别,并与相同风格的音乐进行模式组合。他取得的第一个巨大成功是创造了“艾美”(EMI,音乐智能实验,正如Yuval Harari在《人神合一》中所讨论的),艾美借鉴了巴赫、维瓦尔第、肖邦等作曲家的艺术风格,创作出了优秀的音乐作品,并在1997年成功骗过了一个现场观众。近年来,索尼的Flow Machines系统也已创作出十分悦耳的歌曲(例如《Daddy’s Car》、《Mr Shadow》以及《A Mon Sujet》——你能听出来这些歌是AI创作的吗?)。与此同时,初创企业Aiva和Amper也在开发深度学习,并根据顾客需求进行作曲,它们可能很快就能提供个性化音乐服务。在不久的将来,即使作曲家先围绕歌词确定下了歌曲的主题和节奏发展,更具挑战性、更费力的编曲和伴奏制作或许还是得由AI胜任。当我们在试着优化人机合作时,可能会同时增强人类和AI的创造力。

AI甚至可以在没有人类经验的前提下创作诗歌。目前已经出现了能够创作巧妙俳句的机器人,其诗歌的高质量部分归功于语言本身的美感和节奏——这是AI可学习的,还有一部分归功于读者的主观感受。早在2010年,机器人创作的诗歌就已经骗过了文学杂志的审稿人。如果你认为自己可以分辨人写的诗歌和机器写的诗歌,欢迎点击此链接Bot or Not进行挑战。

除了音乐、绘画和诗歌,AI也越来越多地应用于许多其他艺术形式和创意任务中,各种AI艺术工具也正在涌现。麻省理工学院的一支创新团队正在试图证明,人机合作能够生成单凭人类无法想象的新艺术品和手工品(包括音乐、产品和产品设计、时尚、香水、巧克力松露、珠宝、鸡尾酒和戏剧)。Pamela Davis Kivelson是斯坦福大学的讲师,也是沃尔沃集团的入驻艺术家,他以硅谷的科技发展为主题,在各种表演和项目中融合了多种艺术形式,包括摄影、风格迁移的AI绘画、人像视频、甚至是AI诗歌等。她说,“AI艺术让我能够……基于NBI(“非二元性别认同”)创造出新颖的视觉语言……从字面上来看,物理学家可以用费米液体,或者量子隧道中的一组电子或一个量子比特来象征,但我希望重新定义这一形象——以挑战人类集体无意识的偏见和推论。这些隐秘的偏见一直影响着我们的行为。”

通往超级创造力之路

1965年,Stanislav Lem发表了科幻小说《Cyberiad》,书中的“建构者”Trurl试图研发写诗机器人,他意识到一位诗人的思想往往涵盖了他所在文明与文化的所有经验。为了将这些经验全部编码并输入机器,Trurl构建出了一台超级计算机,它可以模拟整个宇宙的演变,也可以模拟诗人的出生、成长以及所受的文化熏陶。这位AI诗人正如横空出世的天才,起初人们对它不屑一顾,但当最终认识到它的力量,人们痛觉失去了人生的意义并集体自杀。Trurl所遵循的实现AI创造力的路径在于复制人类的创意过程,但这有些不切实际,因为目前正在兴起的真实路径恰恰回避了对人类的复制。

假设人类距离通用AI时代还遥遥无期,那么目前的专用AI能达到何种程度的创造力?推动其发展有三条道路可循:训练、多模态、人机协作。目前人类的探索还相当有限,专用AI的提升潜力依旧很大。

“我们创造了属于自己的AI艺术,你也可以”。 《WIRED》/ Tom Simonite

持续的反馈和训练。在绘画和音乐领域,AI对人类反馈的利用还十分有限。相比之下,人类艺术家在品味艺术的过程中可以即时地(尽管是带有偏见的)进行自我批评。机器没有主观经验,无法自我指导,但它们可以通过数据训练和反馈来利用人类经验——例如通过评级或者点击“爱心”来谱曲(正如Periscope那样),抑或是画出流程草图。从许多艺术家、或者是许多艺术评论家、甚至是许多普通人那里得到反馈,可能更甚于从一位艺术家那里借鉴的主观经验。此外,这一反馈过程也会推动新的艺术风格、艺术团体和前卫作品的出现。

多模态和联想式学习。在听喜欢的歌或沉浸于某幅画时,我们所体验到的是复杂的、多模态的情感和联想,这会把我们带入一个充斥着图像、记忆、解释、分析性思想、历史文化关联以及感官体验的心灵世界,这就是艺术的最高形式。

画是看得见听不着的诗,而诗是听得见看不着的画。

列奥纳多·达芬奇
AI能否创作出“大规模、亲切、色彩鲜亮和感性客观”的音乐? Lera Auerbach既是音乐家,也是画家、雕塑家、编剧、诗人、作家,AI能否也像他一样同时创作出音乐、绘画、诗歌和文学作品,并使它们融会贯通? 究竟怎样才能让AI掌握多模态与各种艺术形式、艺术事件及社会发展趋势之间的关联?

目前,大量的训练数据已然存在:电影及其音轨、歌曲及其歌词、绘画评论、音乐专辑、电影、表演。此外,众包的形式可用于对多模态关联进行大规模标签。看书时脑海里浮现出配乐,听歌时脑海里浮现出单词网络,给某段旋律配一幅合适的插画,听歌或看画时想起来一件事,欣赏艺术品时想起过去或现在的一件事或是一篇新刊登的文章……由此产生的概念网络是高度可个性化的,可以映射出具有重要历史意义的文化和代际联想——就像人类创作的艺术品一样。这一概念网络也会带来巨大的商机,比如音乐制作人可以从Netflix广受追捧的连续剧中寻找借鉴,产品设计师也可以从潮流文化中汲取灵感。

借助于大规模的训练和多模态关联的概念地图,AI还有可能准确预测人类对艺术产生的生理和心理反应,同时,AI在创造沉浸式音乐、绘画、诗歌以及多模态体验方面的能力也将远超人类。

量子材料研究/Pamela Davis Kivelson; 图源: Robert Cava

人机合作。大规模训练和关联式学习的展开,将进一步拓展AI与人类的开创性合作。众包作曲是指作曲家先写出基本曲调,然后由AI借助网上的反馈对其进行完善和编曲。同时,习得的多模态概念地图往往可以跨越多种艺术形式和体验,例如,人可以为音乐选择插画,这些画反过来影响乐曲的谱写。此类的反馈循环可促进AI与人类在任何艺术形式上的合作——甚至是AI文学,因为AI正在快速获取与人类相媲美的写作能力。

进一步的人机协作有望促进AI能力的拓展,并最终同时提升人类和机器两者的创造力。正如Kivelson所设想的,在未来,“集体创意AI将增强全球联系,重新定义工作室的本质,挑战身份政治,并激发自由开放的新思想”。

AI艺术也许会变成最有效的社会反光镜,因为它有可能重新定义人们对身份认同的理解。

此外,正如人类艺术经常从历史和社会背景中汲取价值,AI艺术也可以将不同群体的经验、不同的艺术作品以及任何文本信息进行结合,从中捕捉人们的集体经验,重新定义人们对身份认同的理解,从而变成最有效的社会反光镜。

最后,AI还可以突破人们给创造力施加的重重枷锁。以赋格曲为例,巴赫所作的六声部赋格曲《音乐的奉献》被称为有史以来最美的曲子,但同时也十分复杂、极难驾驭。用六个以上的声部来作曲通常很困难,这是为什么?因为人能弹钢琴的只有十根手指,人的工作记忆也无法容纳四至(最多)七件互相独立的事件,画家、雕塑家和诗人也受到类似的限制。但机器是自由的,因此机器可能会将艺术的边界扩展至人类无法触及的范围。

无脸肖像/Artrendex Inc.

有意识的经验vs模仿

人类在欣赏艺术时会用到神经系统,这是AI目前还不具备的。神经系统是一套复杂的情感系统,可将人类的大脑和神经内分泌系统联系在一起,通过释放激素来控制人类的感受和行为,它可以控制人类的生理反应,例如起鸡皮疙瘩、快感、心跳和呼吸的变化等,也可以借助个人经验和历史事件的记忆,将感官和概念关联相结合。许多人都认为艺术需要呈现。Kivelson认为:“舞者能用身体的特定部位感受动作。观看舞蹈时,我们能感受到舞者在表达内心的感受……如果人类集体呈现的创造性智慧有所发展,新形式的AI创造力也会出现。”

暂且不提意识这个头号难题,如果没有人类的神经系统,AI即使获得了创造力,也无法具备人类对艺术的主观体验。意识可以为创造过程提供反馈,但从本质上讲,创造力正在脱离意识。Trurl虚构的AI诗人通过吸收和学习人类的艺术作品及反馈,将有意识的经验外包给人类,它所利用的就是人类的集体意识。

此外,在不久的将来,计算机艺术家会通过创造艺术来优化预先指定的功能,例如沉浸式体验的程度,而不是为了实现其(并不存在的)表达内心世界的愿望。AI创意所产生的驱动力将与人类艺术家截然不同,因为有意识的经验驱动的创意与模仿是天差地别的。未来,AI将会学习如何引发人类某种特定的感官和情绪反应,而这一过程正如动物模仿一样,并不需要具体呈现或有意识的主观体验。

反向拼贴画/Mario Klingemann

我们是否可以设计一个测试(对抗过程)来区分人类艺术和AI艺术?如果AI能够轻易通过类似图灵测试这样的测试,那就意味着无意识的AI完全可以毫无破绽地模仿人类艺术家,也即创造力完全不需要主观经验和感受能力。

创意AI将会成为一种强大的工具,正如一种新型显微镜,可用于对人类活动和沉浸式体验进行定量测量。

创意AI将会成为一种强大的工具,正如一种新型显微镜,可用于对人类活动和沉浸式体验进行定量测量。它可以回答人类难以解释的问题,例如影响人类创造力的是什么?影响人类艺术体验的是什么?艺术品是如何改变人类的生理和心理反应的?如果能够更好地理解这些,人类也就有可能在看似遥远的目标上产生突破:未来的AI+群体超级创造力机器能否具备有意识的自我经验?这一过程应该如何设计,我们又该如何在这一过程中真正理解人类意识的实质?

想要让计算机获得人类的艺术体验能力,究竟需要复制人类哪些神经过程(虽然两者的物理组成完全不同)?毕竟艺术的目标恰恰就在于获得主观的艺术体验。但目前我们对意识体验的生理过程以及能够生成有意识经验的计算机还不甚了解,从“意识是幻觉”到“一切都是艺术”,相关理论五花八门。其中,“意识是一种物质状态”、“意识源于量子波函数的坍缩”等基于物理的理论将计算机的输入/输出和人类的主观体验做出了区分,同时假设物理在计算领域具有基础性的意义。这不无道理,因为有意识的经验比单纯的输入/输出更为基础性。AI虽然不具备意识体验的神经系统,但仍可以成为艺术家,而且我们无法证明计算机可以独立于生理基础而产生意识,正如我们无法证明灵魂可以独立于物质而存在。

创意AI可能会成为通用AI的下一个里程碑,因为它能促进多模态工程和关联式学习的发展,也能推动AI与人类进行更为高效的合作。

象棋、围棋和图像识别领域的重大突破推动了专用AI的发展,与此相似,创意AI可能会成为通用AI的下一个里程碑,因为它能促进多模态工程和关联式学习的发展,也能推动更为高效的人机协作。正如Sebastian Thrun所言,“创意AI会如何演变,对此我们根本还一无所知。如果把世界上一切知识和创造力都装进一个瓶子,它迸发出的力量将超乎你的想象。”

无名粉彩肖像画/Mario Klingemann

推荐阅读专题

留言 点赞 发个朋友圈

我们一起分享AI学习与发展的干货

编译组:莫菲菲、殷睿宣

相关链接:

https://towardsdatascience.com/supercreativity-b4114ebd0357
如需转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读

EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017 论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾

长按识别二维码可添加关注

读芯君爱你

AI的艺术创造力超越人类?绝不是痴人说梦相关推荐

  1. 谷歌用AI诊断早期肺癌超越人类医生,登上Nature子刊

    伊瓢 发自 凹非寺  量子位 报道 | 公众号 QbitAI 在我国,肺癌一直是各种癌症中致死最多的. 据国家癌症中心统计,我国每年新发肺癌约78.7万人,因肺癌死亡约63.1万人,如果这些患者都能早 ...

  2. 语音和面部识别技术能帮助AI在情商上超越人类吗

    长期以来,我一直把研究情商作为一种业余爱好.直到最近,我依然相信,即使人工智能(AI)接手所有需要记忆和逻辑推理能力的任务之后,情商仍将是我们人类的核心优势之一. 在过去的几年里,我将主要精力放在研究 ...

  3. 吴恩达:比起争论AI会否超越人类,倒不如先担心你的饭碗能否保住

    雷锋网 AI科技评论按:Facebook CEO 马克·扎克伯格和特斯拉CEO 伊隆·马斯克刚刚在网上掀起一场关于AI威胁论的争辩,Coursera联合创始人.中国科技巨头百度的前首席科学家吴恩达就表 ...

  4. “LSTM之父”谈AI威胁论:AI将超越人类智力,对人类不感兴趣,呼吁暂停AI是一种误导

    他因在人工智能(AI).深度学习和人工神经网络领域内做出的成就而知名,一度被称为"(现代)AI 之父"或"深度学习之父". 他提出的长短期记忆网络(LSTM)被 ...

  5. ai的智能发展不会超越人类_人工智能:超越炒作

    ai的智能发展不会超越人类 by George Krasadakis 通过乔治·克拉萨达基斯(George Krasadakis) 人工智能,超越炒作 (Artificial Intelligence ...

  6. 在未来,机器人或 AI 还有多久才能具备人类的创造力?

    在未来,机器人或 AI还有多久才能具备人类的创造力? 2022年6月7日,迎来了首个高考日.高考作文也随即向全社会公布,我们的人工智能度晓晓同学在40秒内,完成了40篇作文,大家一起来看看,他能拿几分 ...

  7. 阿里达摩院包揽AI领域六大权威榜单冠军:用人类的学习方式超越人类

    让AI模仿人类的学习方式,结果会怎样? 8月26日,阿里达摩院语言技术实验室取得一系列突破,斩获自然语言处理(NLP)领域6大权威技术榜单冠军.据介绍,参与竞赛的6项自研AI技术均采用模仿人类的学习模 ...

  8. AI在这张“问卷”上首次超越人类,SuperGLUE被微软谷歌两家“攻破”

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 自然语言理解(NLU)迎来新的里程碑. 在最新的NLU测试基准SuperGLUE中,人类首次被AI超越了. SuperGLUE相比&quo ...

  9. 首次超越人类!“读图会意”这件事,AI比你眼睛更毒辣 | 达摩院

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 在超越人类这件事上,AI 又拿下一分. 就在最近,国际权威机器视觉问答榜单VQA Leaderboard,更新了一项数据: AI在" ...

最新文章

  1. 关于正则表达式 \1 \2之类的问题
  2. “学在清华”清华大学本科教育主题展在校史馆开展
  3. poj 3460 bookstore
  4. 【人工智能】命题逻辑测验题题解
  5. IQueryable接口与IEnumberable接口的区别
  6. golang 一段代码不甚明白
  7. Java小 orm_这么优雅的Java ORM没见过吧!
  8. mysql 数据类型 真假_【转】MySQL数据类型
  9. mt6735通用recovery_MTK65XX通用线刷刷机工具驱动-MTK65xx刷机工具驱动及教程下载最新免费版-西西软件下载...
  10. PADS logic 和PADS layout 连接
  11. 阿里云windows 2012服务器部署java web程序教程
  12. 博客园博客下载工具,可以主动搜索某人的blog,并以MHTML格式保存到本地文件夹脱机浏览。...
  13. RedHat配置阿里yum源
  14. Win 10 下 android studio显示 Intel haxm无法安装,以及VT-X和hyper-x的冲突问题
  15. ​单页应用程序是如何打破网页设计的?
  16. 在演讲中如何吸引你的听众技巧
  17. K_A19_002 基于STM32等单片机采集水位检测传感数据 串口与OLED0.96双显示
  18. 基于jupyter notebook的简单爬虫学习记录
  19. 阿里云物联网操作系统AliOS Things获国家重点研发计划立项
  20. 【博主告白】沁园春·新年

热门文章

  1. Linux下Vim的常用命令操作大全
  2. python中用turtle画爱心表白
  3. 进制转换——36进制
  4. Centos修改时间为24小时制
  5. 数据结构(六):伸展树简介
  6. 什么是CAS和AQS
  7. SEO优化收徒蜘蛛池是什么
  8. oracle rac密码,oracle rac如何修改密码,硬盘损坏如何恢复?
  9. Android App的设计架构:MVC,MVP,MVVM与架构经验谈
  10. NVIDIA 显卡驱动CUDA ToolkitcuDNN下载地址