全文共5786字,预计学习时长17分钟

图源:Unsplash

你能想象吗?也许在屏幕对面和你视频聊天的美女不是“人”。

啊,她也不是“机器人”,更不是“妖魔鬼怪”。

可能她只是一堆数据构成的“假人”……

看看下面这位美女。她看起来很美很有亲和力。也许你会在Linkedin或者WeChat上和她联系,或者雇佣她来经营社交媒体。如果在孩子的体操课上见到她,你会打个招呼,寒暄几句。根据你的说服力,如果有机会,甚至可以在她的Tinder或微博个人资料页上向右滑动查看。

制作人员:这个人并不存在。/生成式对抗网络 风格

唯一的问题就是:她不存在,上面的图像是由一种名为“生成式对抗网络(GAN)”的新型机器学习技术生成的。该技术于2014年出现,在普及度和可能性上都呈现出爆炸式增长。图灵奖获得者Yann LeCun将该技术描述为“过去20年来机器学习中最酷的想法”。这项技术用于视频游戏、天文学和艺术,并席卷了媒体和法律界。

幕后的生成式对抗网络

生成式对抗网络的工作原理是:使用两个深度学习神经网络,让其在小型战斗中相互竞争。第一个是生成网络,通常是一个卷积神经网络,在一组样本图像上进行训练。像所有卷积神经网络(CNN)一样,生成式对抗网络可以学习训练集的属性和模式,并能够从头开始生成相似的图像。

第二个是判别网络,它也用原始数据进行训练,旨在评估一张特定图像是否遵循原始数据集的统计分布。简而言之,当给定一张新图像时,判定网络可以推测该图像是否属于原始图像集。

这就让事情变得很有趣。生成式对抗网络并没有让各个网络静静地嗡嗡作响,而是让这些网络相互对抗。生成式对抗网络的目标是创建足以欺骗判别网络的伪造图像。判别网络的目标是避免受到欺骗,准确地猜测出哪些是假图像,哪些是原始数据。

生成网络一遍又一遍地生成新图像,而判别网络则对其进行评估。然后,两个网络会检查自己的工作,看看哪个网络赢得了每一轮比赛。当两个网络相互争斗数千次后,都会使用反向传播从错误和成功中学习。生成网络更擅长生成逼真的假图像,而判别网络则更擅长去区分这些图像。随着时间的推移,两个网络通过相互竞争而不断得到完善。该技术利用并行计算的最新进展来快速训练网络,NVIDIA和其他GPU公司最早使用这种技术。

GPU技术上的进步如像NVIDIA这样的显卡,使得生成式对抗网络成为可能。制作人员:Gado图片。

常规训练结束时,生成网络已非常擅长生成逼真的假图像了。生成网络依靠自己的力量运行,虽然对手判别网络有了很大改进,但现在生成网络能生成足以欺骗人类的假图像。

这很像棒球运动员在接棒球之前挥舞着重重的球棒,或者一名大学生正在使用比预期考试难度更大的问题来学习。通过训练每次比赛中表现越来越好的狡猾对手,生成网络可以不断提高游戏水平。当强大的对手离开,转而欺骗普通人时,这项任务变得相对容易。

生成式对抗网络会带来问题

不足为奇的是,可以生成逼真假人的人工智能系统引起了轩然大波,这种系统远远超出了深度学习的领域。在媒体领域,生成式对抗网络会对可信度造成威胁。生成式对抗网络很自然地与“深度造假”相关联,深度造假中的神经网络能模拟真实的人,创建一些人们似乎从未说过或做过的视频或图片。

当然,人们能够用Photoshop把名人或政客P到从未参加过的活动中,或展示他们和从未见过面的人握手。但要创建一个真实的视频:名人政客似乎发表着种族主义言论或说出会煽动所在政党的声音,这样的能力更加困难,并且通常要借助生成式对抗网络。

这对新闻媒体的生存是一大威胁,新闻内容的(假冒新闻除外)可信度至关重要。如何得知举报人提供的隐藏视频片段是真实的,还是生成式对抗网络精心制作的虚假内容以故意破坏对手名声呢?

还有更黑暗和棘手的问题。启用生成式对抗网络的色情图像已出现在互联网上,通常使用真实名人的面孔。这个问题可能会进一步扩大。名人很容易标记,因为互联网上已经有很多相关的照片,公众对名人的个人生活也是兴趣高涨。这就让找到生成式对抗网络的训练数据相对容易,而且发布虚假视频或照片也变得有利可图。但是随着技术的进步和所需训练集规模的缩小,黑客可能会伪造几乎任何人的X级剪辑视频片段,利用这些片段进行敲诈或勒索。还记得之前那个爆火的软件ZAO吗?

图源:Unsplash

谁拥有这些伪造的人?

除了这些生存威胁和令人惊悚的风险外,即使出于积极原因而建立的生成式对抗网络也会带来一些棘手的法律问题。一个关键问题是:谁真正拥有生成式对抗网络带来的图像权。

美国版权法非常明确地规定,受版权保护的作品必须要有一个人类作者。但这个基本前提面临着多方面的轰动性挑战,比如自动摄像机拍摄的监控录像的所有权案,以及臭名昭著的猴子自拍案,PETA声称一只凤头猕猴拥有用摄影师相机拍摄的图片权。

机器创建的图像版权很复杂,例如监控摄像机的录像。制作人员:Gado图片。

如果某作品需要人类作者才能获得版权保护,那么是否有人拥有生成式对抗网络制作的图像版权呢?毕竟,这些图像不是人拿着相机拍摄的,而是两个对抗的计算机程序相互竞争带来的结果。这是一个棘手的问题,但庆幸的是,其他领域有这样的先例,下面会一一进行介绍。

除了所有权,人在使用生成式对抗网络时有什么限制呢?可以使用生成式对抗网络伪造任何人吗?

人类会做出反击

面对生成式对抗网络的威胁,许多组织和立法者已经作出回应。代表演员和艺人利益的美国电影演员协会(SAG)正在积极游说呼吁立法,防止制片公司用生成式对抗网络全息图代替真实的演员。

这一做法很有必要,如果可以创建虚假又逼真的布拉德·皮特(Brad Pitt)让他参加竞标,那为什么还要去雇用真正的布拉德·皮特呢?生成式对抗网络创建出的布拉德不需要休息,不会忘记台词,也不太可能要求七位数的薪水。但是,对于去世的演员来说,事情变得更加复杂。美国电影演员协会希望终止生成名人图像的权利,但这与《第一修正案》中的一些挑战性议题相抵触。

美国已经有好几个州参与到了这场争论中。2019年10月3日,加利福尼亚州通过了法案AB-602,该法案规定,禁止在选举60天内使用生成式对抗网络制作虚假色情作品或政客的剪辑视频。纽约正在考虑通过公开权制定生成式对抗网络的法规。

用于好的方面的生成式对抗网络

对生成式对抗网络进行监管非常必要。当然,以合成色情图像或其他剥削性内容为例,立法者介入或清除品行不端的演员很有意义。

但是,也存在过度监管生成式对抗网络的风险。当用于好的方面时,生成式对抗网络可以是一种有着大量潜在好处的强大技术。

例如,以建立生成式对抗网络的初心为例。最初开发该技术并不是出于生成令人信服的假人图像的目的,而是为了生成用于训练其他深度学习系统的大数据集。

通常,在机器学习中,很难找到优质的数据。尤其是在使用新颖的网络和技术的情况下,数据科学家需要大量图像训练新型的视觉人工智能系统,有时需要一百万个图像甚至更多图像。购买所有的这些图像非常昂贵,特别对于科学家个人或研究小组而言。

甚至购买基本训练的图像版权也十分昂贵,例如在真实环境中描绘真实人物。制作人员:Gado图片。

生成式对抗网络就是为了解决这一问题。例如,有了生成式对抗网络后,正在建立新型面部识别系统的研究科学家无需再去购买数百万张人脸图像。相反,他们可以一次训练一个生成式对抗网络,然后使用这个网络生成所需要的尽可能多的假脸图像,并在这些图像上训练新系统。

生成式对抗网络主要用于此目的。但这仍不是一个完美的解决方案,IBM的一位同事表示,这个过程类似于影印一张影印图像而不是影印原始文档,并且存在相同的失真和质量损失,但生成式对抗网络仍然是数据科学家的重要工具。

在实际训练数据有限的情况下,生成式对抗网络仍是至关重要的。他们提出,例如,生对抗网络作为部分解决方案,可解决缺少除高加索男性以外的面部训练图像这一问题,从而增加深度学习系统的多样性。还可以在ThisPersonDoesNotExist.com上对自己生成的假人进行试验。

除了机器学习,生成式对抗网络还具有各种各样的实际用途。在股票、摄影和时尚领域,生成式对抗网络可生成逼真的肖像而无需雇佣模特或租用场地。这使摄影师或设计师(尤其是刚起步的人)在没有前期投入的情况下更容易实现某一概念或展示新衣服。

在其他领域,生成式对抗网络可用于任何有视觉图案的地方。生成式对抗网络可以为天文学中的暗物质建模,从2D照片中创建物体的3D模型,为电子游戏创建虚假房间或空间,呈现人的衰老过程,甚至为癌症研究中的新分子或蛋白质提供一些想法。

前进中的生成式对抗网络

未来,生成式对抗网络将变得更加强大。

目前,在视觉领域,生成式对抗网络主要限于生成相对有界限的、高度图案化的图像,这其中有大量训练数据可供使用。人脸就是一个很好的例子-人脸因人而异,但具有许多相同的基本属性。全世界有超过60亿的人,可供生成式对抗网络学习的地方还有很多(同样地,假设生成式对抗网络的创建者有足够资源购买大型的数据集)。

但是,随着技术的进步,这些障碍将变得不那么重要。人们普遍认为,在接下来的3-5年中,生成式对抗网络将会发展到足以从头开始创建全新的场景,而不仅仅是脸部特写。例如,设计师可能会说:“我想拍摄一位女性,她走下楼梯,扶着栏杆,抬头看着她的肩膀”,而生成式对抗网络则可以创建出像照片一样真实的照片。

对于未来的这种诱人的设想早已存在。名为Stack的一种生成式对抗网络已经可以对单个对象执行这类操作,并根据外观的文字描述生成假鸟的图片。另一种生成式对抗网络可以通过块状的汽车、人等地图来生成形象的(即使不够完美)街道场景。

这种生成式对抗网络可以通过一组视觉指令生成半逼真的街道场景。制作人员:Ting-ChunWang 等人

显然,随着这些技术的进步,可以取代大部分的摄影、电影制作、室内设计或其他依赖视觉媒体的制作。

这些行业中的员工是应该立即寻找新工作,还是冒着被生成式对抗网络取代的风险?所有的视觉艺术都会被机器取代吗?

回到未来

在进入全面恐慌模式之前,需要停下来片刻,回想一下这个领域早已存在类似生成式对抗网络的相同属性和最终产品。

在这个领域中,有些人会沉浸于他们记忆中的数百万人、地点或物体。他们接受了广泛的培训,这些人有时是一些苛刻或狡猾的评论家。

在某些情况下,这些评论家也会采用所需场景或概念的文字描述。然后,他们选择一些工具,并使用这些工具来创建一个全新的图像。该图像可能会在新情况下呈现一个已知人物,或者可能在实际不存在的场景中呈现出一个想象中的人物。该领域被称为“插图”。

插画家、动画师和CGI艺术家通常会执行与生成式对抗网络相同的任务——他们的全部工作就是想象新的场景、人物和地点并把他们呈现在页面或屏幕上。在许多情况下,他们的创作都是如照片般逼真,尤其是在当CGI创作通常与真实的地方或真实的演员无法区分时。

生成式对抗网络可看作是一种说明工具,而不是某个新的威胁,因此生成式对抗网络并没有那么吓人。当然,生成式对抗网络使得创建逼真的插图更加容易,也更加逼真(这取决于插画家或动画师的技能)。但最后,生成式对抗网络并没有做任何新的事情;只是将“深度学习”应用于一种古老的艺术概念,这种概念可以追溯到最早人类开始在洞穴墙壁上画水牛。

把生成式对抗网络视为插图工具也解决了许多有关网络的法律问题。法院一直裁定CGI创作的作品符合版权保护的条件,因为这些作品是通过人工操作员的通过创造性的选择制作而成。

而且,CGI工具也不总是确定的-要么从人类那里获得指令后,然后在关键帧之间“填充”动作,要么创建设计师未直接建模的新颖序列。没有人会说动画师创作的电影得不到版权保护,只是因为After Effects填补了关键帧之间的某些动作,或者为线框增加了纹理和光照。至关重要的是动画师的创意以及如何生成最终产品。

图源:Unsplash

生成式对抗网络存在于类似的空间中。生成式对抗网络可以想象新的场景,但需要生成有用的输出,并且仍然需要人类指导如何创建。即使生成式对抗网络可以随机生成人脸,仍然需要人类的投入和指导来决定哪些人脸可信,哪些适合特定的创意项目等。提供指导本身就是一项创造性的工作,因此应该要有版权。生成式对抗网络的结果并不完美-在许多情况下,仍需要人类的帮助才能产生可用的结果。

比如,看看本文最开始的那个人。乍一看,这个女人看上去很真实,但凑近看一看。她的耳朵怎么了?那是耳环吗?有污垢吗?这张基本的图像看上去不错,但这得益于熟练(中等程度)的人工操作员进行了清理和调整。所有这些调整和选择都是富有创造力的行为,可以把生成式对抗网络的原始输出变成有用且令人信服的插图。

生成式对抗网络的输出仍然需要人工选择和编辑。制作人员:ThisPersonDoesNotExist / Style生成式对抗网络,由GadoImages编辑

从这里来,要往哪里去?

生成式对抗网络提出了一些社会应该继续思考和探索的重大问题。利用这些技术进行深度伪造和露骨的内容制造会令人不安,引发社会骚动,监管机构应该尽早解决此类问题。

但是,与此同时,社会在监管插手这些新技术时应谨慎对待,避免扼杀这些技术的积极应用。尽管生成式对抗网络的输出可能令人恐惧甚至毛骨悚然,但它有潜力革新许多视觉艺术,让时装和摄影更具包容性,促进药物的发明,以及解决各种想象不到的问题。现有的插图领域提供了一个法律和道德框架,可以开始解决有关生成式对抗网络及其影响的问题。

在这个社会上,我们需要承认伪造人像的威胁,但也要接受带来的好处。在他们微笑的面孔后是生成式对抗网络技术的成熟与灵活运用,也是未来社会发展与进步不可抵挡的重要力量源泉之一。

推荐阅读专题

留言 点赞 发个朋友圈

我们一起分享AI学习与发展的干货

编译组:李林虹、齐欣

相关链接:

https://medium.com/swlh/this-is-not-a-person-but-she-is-a-threat-6d6f2d4083f4

如需转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读

EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017 论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾

长按识别二维码可添加关注

读芯君爱你

红颜祸水?她很美,却不是“人”,还成为了威胁?相关推荐

  1. 你写的机器学习代码占多少内存?这件事很重要,但很多人还不懂

    作者 | Tirthajyoti Sarkar 编译 | 蛋酱 来源 | 机器之心 算法完美是重要的,但更重要的是成功部署,这篇文章能够帮助你了解有关代码内存占用的一切. 在进行机器学习任务时,你需要 ...

  2. 你写的ML代码占多少内存?这件事很重要,但很多人还不懂

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:Tirthajyoti Sarkar 本文转载自:机器之心  ...

  3. anddroid bitmap如何由rgb8888转为rgb565_最美的期待—孕期很美好,妊娠纹让人烦恼,爱美的孕妈妈们如何是好?...

    原标题:最美的期待-孕期很美好,妊娠纹让人烦恼,爱美的孕妈妈们如何是好? 怀胎十月,一朝分娩.对孕妈妈们来说,整个孕期虽然辛苦,但却幸福感十足,既完成了新生命的孕育,体验到了人生很重要的一段完整而又光 ...

  4. 苹果ios鸿蒙,苹果iOS界面一直都很美,鸿蒙系统在这方面,让人担心

    从前,终端系统OS界天下三分,无论是电脑还是手机,或者是其他终端,微软的系统,苹果的系统,谷歌的系统,在互联网中有着不可言喻的作用和地位! 后来,智能手机的发展,系统经过市场的教育,将开发者少的win ...

  5. 我的心底装着宽恕和包容世界很美

    朋友林夏闹着辞职要走,还是三年前的事. 那一天,同事们凑份子,为他送行.平常,公司里,大家都忙得焦头乱额的,彼此间并没有太深的交往,没想到,饭店里还是哗啦啦去了好几桌人.尽管嘴上不说,大家都觉得,林夏 ...

  6. c语言sleep_编程代码:用C语言来实现下雪效果,这个冬天,雪花很美

    前言 1.本文主要围绕 如何 在 控制台上 下起 一场 只有自己能看见的雪 2.是个简易跨平台的,主要是C语言 3.动画 采用 1s 40帧, 雪花具有 x轴速度和y轴速度 4.比较简单,可以给学生作 ...

  7. 取两个数较小值c语言_编程代码:用C语言来实现下雪效果,这个冬天,雪花很美...

    前言 1.本文主要围绕 如何 在 控制台上 下起 一场 只有自己能看见的雪 2.是个简易跨平台的,主要是C语言 3.动画 采用 1s 40帧, 雪花具有 x轴速度和y轴速度 4.比较简单,可以给学生作 ...

  8. db4o, 看上去很美

    由于厌烦了手写Sql,在几个小项目中尝试着使用了Db4O.DAL层写起来是爽了,但是,还是有很多其它东西会绊你的脚. 没有主键的概念(因为对象的内存地址,或者引用就能标志一个对象了).因而外界想指向一 ...

  9. 看起来很美 VS. 是你来检阅我的忧伤了吗?

    看来了wayfarer "设计,看上去很美!"--算是我的随想<?xml:namespace prefix = o ns = "urn:schemas-micros ...

最新文章

  1. teamviewer设备数量上限_智能控制设备连接故障排除
  2. mysql获取查询策略语句_MySQL数据库查询性能优化策略
  3. 「每天一道面试题」如何理解方法的重载与覆盖?
  4. PWN-PRACTICE-BUUCTF-30
  5. Netty 5.X 官方指南翻译版6:Writing a Time Client
  6. VisualStudio中C++程序输出一闪而过的解决方案
  7. python中导入win32com.client出错问题
  8. 用C语言编程复数计算器,简单实现C++复数计算器
  9. HTTP 405Method not allowed
  10. 暴力破解Windows密码(二、三):使用getpass内存提取windows用户密码、使用quarkpwdump导出windows用户密码hash值
  11. 锁相放大器在中微流控的应用
  12. R语言教程:什么是R语言,以及如何安装
  13. 大连引入‘智慧路灯’助推‘智慧城区’建设,道路改造25基高杆灯
  14. 初试401 英语86分上岸苏州大学经验分享
  15. 2021-IEEE论文-深度神经网络在文档图像表格识别中的应用现状及性能分析
  16. JAVA Stream的collect用法与原理(详解)
  17. 威尔·史密斯[Will Smith]
  18. ROS学习-创建一个ROS msg和一个srv
  19. 异步编程之异步编程与多线程编程的联系和区别
  20. bootstra查阅参考文档

热门文章

  1. 2017年哈工大数理逻辑期末考试参考答案
  2. Python·.·.print()函数格式化输出-超详解
  3. python中tan怎么表示_python中Tan的逆(tan-1) - python
  4. python实现:命令行翻译.string 和 .xml 文件 -- mkTranslate:支持多种语言的互译
  5. 【老生谈算法】matlab实现图像压缩算法源码——图像压缩
  6. 浓缩德国奎尔鱼油 (QÜELL FISH OIL™ HIGHT EPA / DHA / D)
  7. shutdown配合at命令 实现定时关机,重启---
  8. 【Linux】在Windows 10环境下安装适用于 Linux 的子系统 (WSL安装指南)
  9. 爱看广场舞的老爷爷的笔记 --shell命令
  10. Spring Cloud 进阶笔记