GAN

离开OpenAI回到谷歌之后，Goodfellow成立了一个全新的小组来对生成模型进行研究。生成模型，简单来说就是对影像、声音以及对现实世界的一切其他“表示”（representations）进行创造的系统，Goodfellow认为，它将成为通往各种形式人工智能的一条重要路径。

“如果AI学会了构想现实世界中的种种细节——比如现实中的图像和声音，这将帮助AI更好地理解现实世界的结构、框架。”Goodfellow解释说，“AI也将更容易去理解它的所见所闻。”

2014年，Goodfellow还是蒙特利尔大学的一名博士生。在微醉与同学进行了一次论争后，Goodfellow在酒吧里想出了名为“生成对抗网络”（GAN）的AI技术。这是种非常奇妙的想法：用一个AI对现实世界的图像进行创造，再用另一个AI去分析结果并对图像的真伪进行识别。

“你可以将二者的关系想象成一个艺术家和一个文艺批评家。”Goodfellow说，“作为艺术家，生成模型希望愚弄艺术批评家，让后者认为它画出来的东西是真实的。”因为“艺术批评家”如此努力地将这些“画”辨认为假，“艺术家”就慢慢学会了摹拟那些真的东西，而这原本是只靠它自己所不能做到的。

在这样的过程中，这两种神经网络会推动着AI向前进步，直到AI不再需要人类作为自己的老师。

Facebook的AI研究负责人杨立昆（Yann LeCun）将GAN称作“过去20年内在深度学习上最酷的想法”。Goodfellow的想法在很大程度上还处在发展之中，但这些想法已经在AI的圈子内迅速传播。包括杨立昆在内的很多研究者都认为，这些想法将会促成“无监督学习”的实现。

斗酒Code百行

△ Ian Goodfellow

Goodfellow构思出这个想法时，是在加拿大蒙特利尔一家名叫“三个酿酒师”的酒吧里。当时，他和一些同学来为刚刚完成博士学业的Razvan Pascanu送行。其中一位同学向大家描述了一项新的研究计划——将图像上的所有内容都识别成数学元素，然后将这些数据输入机器，使后者能创造新的图像。

此时，已经微醺的Goodfellow说，这种方法永远不会奏效，因为需要考虑的数据实在太多了，没有人能把它们全部记录下来。也是在这个时候，Goodfellow想出了他认为更好的办法：能够教会机器创造现实图像的神经网络。

Goodfellow确信，如果要用一个神经网络创造图像，那么就可以用另一个神经网络扮演它的对手来判断图像的真伪，并将这些判断结果反馈给第一个网络。最终，第一个神经网络将学会足以乱真的假图像。

一场争论就这么发生了，那位同学同样坚如磐石地认为Goodfellow的办法不会有用。于是，Goodfellow当晚就回家做了一个东西出来。“我回家时还是醉着的，而我的女朋友那时已经睡着了。我坐在那想的只有：我的朋友在酒吧里说的是错的！”他回忆说，“我熬夜在自己的笔记本电脑上写出了GAN。”结果代码第一次工作就成功了。

“那非常幸运。因为如果那没有奏效，我可能就要放弃这个想法了。”Goodfellow说。

后来他和几位研究者发表了一篇阐述这种想法的论文。在那三年之后，已经有成百上千的论文对这个概念进行了阐发。在第一篇论文里，两个神经网络制作出了一个能生成真实手写数字的系统。现在，研究者们将这种想法应用在照片上——从一只猫，到龙卷风甚至整个星系。这种技术甚至可以用来进行天文实验和模拟粒子物理。

但这目前仍然非常难以实现。它不光是对一个神经网络的训练，而是要在两个神经网络上同时进行。Goodfellow在谷歌成立专注于GANs的研究团队，希望对这种过程进行精炼。

结果远比预期的要好，它不仅能用于生成图像和声音，还能用来识别图像和声音，而这只需要很少来自人类方面的帮助。“这些模型学会了理解世界的框架。”Goodfellow解释说，“这同样能帮助系统在不需要被精确告知的情况下学习。”

无监督学习在今天还未成真，而GANs可以促进它的实现。如今，神经网络可以通过分析几百万张猫的照片来对一只猫进行识别，但人类必须十分谨慎地对那些猫的照片进行标注。人仍然非常多地参与到其中，而人的偏见在训练AI的过程中发挥了多大的作用同样是一个问题。LeCun这样的研究者正在推动系统向无监督学习状态演进，而这一旦实现，也将大大加速AI的进化。

开端

但那只是一个开始，GAN带来了很多其他的可能性。南加州大学的AI研究院David Kale相信，这个创意可以帮助他和同事们在不侵犯患者隐私的情况下开发医疗AI。GAN可以制造假的医疗记录，让机器学习系统在其上进行训练，不需要真实数据。

“与其把真实的患者记录扔在互联网上让各种人用，我们为什么不在那些记录的基础上训练一个GAN，然后用它生成一个能够以假乱真的虚拟的数据集开放给开发者呢？”

尽管很多研究者都在围绕GAN进行探索，但据说Goodfellow坚持要特别在Google建立他的团队。他是离开Google去了人工智能非营利机构OpenAI的研究人员之一，但不到一年之后，他就回到了Google，因为那是他的伙伴们所在的地方。

“把整天时间花在电话会议上，并不好玩，也并不是完成工作的最佳方式。”

分享很重要，紧密的合作也很重要。对AI研究者来说、对神经网络来说，都是这样。

本文作者：唐旭李林

原文发布时间：2017-04-12

GAN诞生记：最火的AI模型，来自一群博士的酒后争吵相关推荐

HuggingGPT火了：一个ChatGPT控制所有AI模型，自动帮人完成AI任务，网友：留口饭吃吧...
丰色发自凹非寺量子位 | 公众号 QbitAI 最强组合:HuggingFace+ChatGPT -- HuggingGPT,它来了! 只要给定一个AI任务,例如"下面这张图片里有什么 ...
能“看穿”换脸视频背后的AI模型
Deepfake是一款非常火的AI换脸工具,可以将专业复杂的AI换脸过程简单化,实现快速换脸,制作的内容甚至可以以假乱真. 但是,现在的技术不仅可以判断照片是否假冒伪劣,还可以跟踪所有背后的信息,你信 ...
Ian Goodfellow回忆GAN诞生故事：几杯啤酒喝出“20年来最酷的深度学习想法”
当Ian Goodfellow解释他在谷歌大脑所做的研究时,他引用了原子物理学家.加州理工学院教授兼畅销书作家的这句格言.但是,Goodfellow不是指自己,也不是Google内的任何其他人.他谈论 ...
用让新海诚本人惊讶的 AI 模型制作属于你的动漫视频
本文将介绍如何使用 GAN 模型来生成属于你自己的动漫风格的视频,为自己.喜欢的菇凉或者调皮可爱孩子生成一个别具一格的动漫风格的视频. 本文操作难度较低,适合想要试玩了解 GAN 模型的同学.可以同时 ...
华为诺亚实验室：端侧AI模型的技术进展与未来
主讲人 | 王云鹤华为诺亚实验室量子位编辑 | 公众号 QbitAI 近两年来,端侧AI在技术和应用方面都取得了快速发展.相较于云侧AI,端侧AI具有低时延.保护数据隐私与安全.减少云端能耗.不依 ...
华为诺亚实验室：端侧AI模型的技术进展与未来|量子位·吃瓜社
主讲人 | 王云鹤华为诺亚实验室量子位编辑 | 公众号 QbitAI 近两年来,端侧AI在技术和应用方面都取得了快速发展.相较于云侧AI,端侧AI具有低时延.保护数据隐私与安全.减少云端能耗.不依 ...
HuggingGPT进化，一键控制10万多个AI模型
本文机器之心编辑:张倩.蛋酱通过 Transformers Agents,你可以控制 10 万多个 Hugging Face 模型完成各种多模态任务. 从聊天到编程再到支持各种插件,强大的 C ...
Facebook 万字长文：AI 模型全部迁移至 PyTorch 框架
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达转自 | 新智元来源 | Facebook AI Blog 编辑 ...
《AI系统周刊》第5期：Cerebras发布可运行120万亿参数AI模型的CS-2芯片
No.05 智源社区 AI系统组 A I 系统研究观点资源活动关于周刊 AI系统是当前人工智能领域极具现实意义与前瞻性的研究热点之一,为了帮助研究与工程人员了解这一领域的进展和资讯,我们 ...

GAN诞生记：最火的AI模型，来自一群博士的酒后争吵

GAN

斗酒Code百行

△ Ian Goodfellow

开端

GAN诞生记：最火的AI模型，来自一群博士的酒后争吵相关推荐

最新文章

热门文章