您好 Ian 感谢您接受采访

您好 Andrew 感谢您的邀请 我很高兴能来到这里

现在你是世界上最炙手可热的深度学习研究者之一 请和我们一起来分享一下你的个人故事 你是怎样决定进入这个领域的呢

好的 我想 我最开始对机器学习感兴趣 是在认识你以前 之前我一直致力于研究神经系统科学 而我斯坦福的本科导师Jerry Cain鼓励我选修你的AI入门课程

哈哈 我现在刚知道这事

所以在此之前我一直都认为AI是一个很好的概念 但谈到在实际生活中的应用 我理解为 主要体现在游戏中 有很多事先编码的规则 让一些非玩家控制的角色 在不同的时间点按脚本说出不同的话 然后在你的AI入门的课程上 你讲解了诸如线性回归和线性回归误差的偏差和方差分解 我才开始意识到这是真正的科学 和神经科学相比,不如在人工智能方面开启一段科学职业生涯

我明白了 很棒 那之后呢

之后我回到学校成为你的课程的助教 噢 是的 想一个助教 其实对我来说 成为这门课的助教 是我生命中一个非常大的转折点 其中的一个学生 我的朋友Ethan Dreifuss 对Geoff Hinton的深度信念网络论文很感兴趣 最后在斯坦福 我们两个利用寒假的课余时间一起搭建了第一台 以GPU CUDA为基础的机器 并用它来运行玻尔兹曼机 在那时 我的直觉告诉我 深度学习是未来的主要发展方向 我也曾使用过许多其它的算法 比如支持向量机 但结果并不理想 训练集越多 算法计算得越慢 或者对于相同数量的训练集 很难在改变其他参数的情况下获得很大的性能提升 从那时开始 我就全力以赴投入深度学习中了

我记得Richard Reyna有一篇很古老的GPU论文 他在论文中的致谢部分 感谢你做了大量的前期工作

是的 那篇论文用到了我们搭建的一些机器 嗯 我搭建的第一台机器 是Ethan和我用我们自己的钱 在他妈妈家里组装的 在那之后 我们拿实验经费为斯坦福搭建了第二和第三台机器 太棒了 我从未听说这个故事 实在是太棒了

如今 基于之前你发明的 生成对抗网络(Gans) 产生了一场席卷深度学习领域的风暴 你是怎么产生这个想法的呢

我研究生成模型有很长一段时间了 生成对抗网络是一种 生成模型 当你有很多训练数据 并且你希望生成更多的虚构数据来加入训练集 在过去并没有出现过这种形式 在我产生生成对抗网络这个想法之前 曾有一些著名的方法用来生成模型 在我攻读博士期间 我尝试过其它所有的方法 比如玻尔兹曼机和稀疏编码 还有其它著名方法 我非常了解这些方法的优势和劣势 同时我也在寻找能避免所有劣势的机制 最后 当我在酒吧和我的朋友争论生成模型的时候 灵光一现 我告诉朋友们 你们需要做这个 这个 这个 和这个 并且我用人格担保这一定成功 但是他们没有相信我 我本来准备写一本关于深度学习的教科书 但是我有强烈的自信 一定能成功 我赶紧回家 写出了算法模型 并且真的成功了

所以你只用了一晚上就完成了生成对抗网络的第一个版本?

我离开朋友在酒吧举办的欢送会回到家后 差不多在凌晨 这个算法模型诞生了 第一版就能完美运行 非常非常幸运 我不用再去查找超参数或者其他东西

我之前在某个地方读到一个故事 你曾有一次濒临死亡 而这让你更为执着地从事人工智能研究 能不能和我们分享一下

好 其实当时我并没有垂死 但以为自己命不久矣 我当时头痛欲裂 感觉要炸了 医生说我可能有脑出血 当我等待MRI结果 想看看情况到底有多糟糕的时候 我突然意识到 当时我主要考虑的是 要确保能够有人能够 接手我的研究方向并继续下去 然而回想起来 那是一些非常可笑的研究方向 但这个经历让我意识到 实际上我人生中最重要的事情之一 是从事机器学习研究的工作

我了解了 非常好 当你以为自己快要死去的时候 你只是关心不要让研究半途而废 嗯 看来你已经找到了生命的真谛 嗯 现在 你仍然活跃在很多 关于生成对抗网络研究的活动中 能不能给我们讲讲你怎么看待生成对抗网络的未来

现在 生成对抗网络被用在很多不同的领域 比如半监督学习 为其它模型生成训练数据 甚至是模拟科学实验 理论上 这些事情都可以用其他的生成模型来完成 因此我认为生成对抗网络正处于一个很重要的抉择关头 现在 它们在很多时候能取得不错的效果 但是如果要真正发挥出它们的性能 更象是一门艺术而非科学 这有点象10年前人们对深度学习的感受 当时 我们使用 以玻尔兹曼机为基础的深度信念网络 但它们非常非常挑剔 我们逐渐开始使用Relu函数和批标准化 这使深度学习变得更加可靠了 如果我们能够将生成对抗网络变得和深度学习一样可靠 我想我们就能持续发现生成对抗网络在今天这些应用领域 拥有比现在更成功的应用表现 如果无法找出让生成对抗网络更为稳定的方法 那么我想它对深度学习的主要贡献 就是展示给人们 怎样使用生成模型来完成这些任务 最后 我们会用其它形式的生成模型来取代生成对抗模型 所以现在我大约用了40%的时间来让生成对抗网络变得更稳定

我明白了 很赞 那么就像10年前 有很多人投身于深度学习领域一样 比如你 最终会成为行业先锋 也许如今加入研究或使用生成对抗网络的人 如果能成功的话 最终也会开拓一片新天地

是的 很多人已经成为生成对抗网络的前期领航人 我觉得 假如你想给生成对抗网络勾勒出一些历史故事的话 不得不提到一些团队 比如Indico 和Facebook以及伯克利实验室做出的各种贡献

那么除了你的研究 你还合著了一本关于深度学习的书 能不能和我们分享一下?

是的 和Yoshua Bengio以及Aaron Courville一起写的 他们是我的博导 我们编写了第一本关于现代深度学习的教科书 有英文和中文两个版本 这本书获得了大家的肯定 两个版本加起来一共售出了大约有7万本 很多学生反馈 这本书让他们获益匪浅 在编写这本书时 与其他书有一点不一样的是 我们最开始强调 在涉足深度学习领域时所需要用到的数学基础知识 你在斯坦福的课程中提到 线性代数和概率论 是非常重要的数学基础 这让我记忆深刻 大家听到机器学习的算法 都会非常兴奋 但是如果真的想成为一个杰出的从业者 必须精通这些基础数学 否则无异于建造空中楼阁 所以我们在这本书的开始部分 就集中列出了所需的数学基础知识 这样你就不用去学习所有的线性代数的知识 而是可以迅速了解 那些对于深度学习来说非常重要的 学习算法所需要用到的线性代数方面的基础 因此对于一些数学并不是很好或者很多年都没有接触过数学的人来说 这个部分可以让他们无需其他教材

从这本书中直接学习所需要的知识 再开始深度学习的学习 是这样吗?

所有你需要知道的知识都在那里 这必然也需要花一些精力去学习和实践 嗯 嗯 好很好 如果有的人确实很害怕数学 这可能会有一点痛苦 但是如果你已经下定决心去学一些东西并且坚信可以掌握它 我想所有你需要的东西都在书里了 对于像你这样 在深度学习领域沉浸了很长时间的人来说

我比较好奇 如果你现在回首过去 能不能和我们分享一下 你觉得人工智能和深度学习 这些年都发生了怎样的演变

十年前 我觉得机器学习领域像是一个社区 在机器学习里最大的挑战是如何 利用深度学习来完成人工智能相关的任务 在一些很简单的任务上 其实我们有一些非常好的工具 比如识别提取特征的规律 人类的设计师可以做许多工作 来创造一些特征然后提交给计算机 而现在 这同样适用于很多不同的领域 比如预测某一个用户可能会点击广告 比如做一些基础的科学研究分析 但真正困难的是分析一个图像里上百万的像素 或者一段音频波形文件 这需要系统从无到有建立学习体系 大约5年前 我们解决了这个障碍 现在 我们所处的时代 愿意加入人工智能领域的研究者 可以选择许多不同的方向 或许现在最难的部分是让他们决定该走哪一个方向 你想让强化学习和监督学习一样成功吗? 你想让无监督学习和监督学习一样成功吗? 你想要确保机器学习的算法很均衡 避免我们想要杜绝的偏差吗? 如果能确保人工智能在社会上不会引发问题 例如引起社会动荡和造成大量人类失业 那我们就能保证每个人都可以受惠于人工智能 我想现在 的确有很多非比寻常的事情我们可以做 在预防人工智能带来负面影响的同时 确保我们能利用它带给我们的好处

现在 有很多人想参与AI工作 你能给他们分享下你的建议吗?

我想 很多想从事AI工作的人开始会想 他们绝对需要获得博士学位 或者其它类似的证书 我觉得 这实际上不是一个硬性要求 有一种获得大量关注的方式是写点好代码 然后放到GitHub上 如果你有一个有趣的项目 解决了在顶级水平工作的人员想要解决的问题 一旦他们发现你的GitHub库 他们会去找你 邀请你一起工作 去年我在OpenAI以及 今年我在谷歌招聘的很多人员 都是这种类型 我第一次对与他们共事感兴趣是因为 我看到了他们在互联网上的开源论坛上发布的一些代码 另外 通过写论文 并且把论文发布到arxiv.org也很好 有时候 在反复锤炼某个理念之后 足以真正在学术界做出新的学术贡献 但很多时候 达到这一点比较难 相比之下 通常创造出有用的软件产品 到达这一高度的时间要短的多

所以 认真读书 练习相关材料 把它放到GitHub 或者arxiv.org上

我觉得 如果你通过看书学习 那么同时做项目也真的很重要 或者 选择一种合适的方式 把机器学习的知识应用到你已经感兴趣的领域中 比如 如果你是一个野外生物学家 你希望进入深度学习领域 或许你可以使用深度学习来鉴别鸟类 或者 如果你不知道在你的生活中如何应用机器学习 你可以挑选一些东西来实践 比如创造一个街景门牌号分类器 其中所有的数据集已经有了 对你来说相当简单 采用这种方式 你可以 在阅读课本或 观看Coursera讲解概念的视频时练习所有的基本技能

那么 最近几年 我看到你在对抗样本方面做了许多工作 能跟我们谈一谈吗?

当然可以 我认为对抗样本 开启了一个新的领域 我把它称为机器学习安全 过去 我们见过一些计算机安全问题 其中攻击者可以愚弄计算机 让它执行错误的代码 这被称为应用级安全 还有一种假冒身份的攻击 人们可以愚弄计算机 让它相信 网络中的消息来源于某个人 但实际上并不是它们说的那个人 这被称为网络级安全 现在 我们可以看到 你也可以愚弄 机器学习算法 让它们做它们不应该做的事情 即使运行机器学习算法的程序执行了正确的代码 即使运行机器学习算法 的程序知道 所有这些信息是来自于谁 所以 我觉得 在开发一项新技术的起步阶段 就要把构筑安全性放在重要位置 我们发现 先构建一个可以运行的系统 再添加安全 这是非常困难的 所以 当我听到如果我们现在深入进去 开始预测机器学习面临的安全问题这一理念时 真的非常激动 我们可以确保 这些算法一开始就很安全 而不是若干年后想方设法从头开始打补丁

谢谢 太棒了 我觉得 你的故事里面有很多迷人的地方 虽然我们已经认识了很多年 但是我实际上并没有真正了解你 所以谢谢您今天的分享

偶 不客气 谢谢您邀请我 这是个很好的机会 好 谢谢大家 谢谢
翻译 | 审阅:Cousera Global Translator Community

价值连城 生成对抗网络(Gans) 的作者Ian Goodfellow的采访 给深度学习从业者的建议相关推荐

  1. 生成对抗网络入门详解及TensorFlow源码实现--深度学习笔记

    生成对抗网络入门详解及TensorFlow源码实现–深度学习笔记 一.生成对抗网络(GANs) 生成对抗网络是一种生成模型(Generative Model),其背后最基本的思想就是从训练库里获取很多 ...

  2. 生成对抗网络GANs理解(附代码)

    生成对抗网络GANs理解(附代码) 原文地址: http://blog.csdn.net/sxf1061926959/article/details/54630462 生成模型和判别模型 理解对抗网络 ...

  3. 判别两棵树是否相等 设计算法_一文看懂生成对抗网络 - GANs?(附:10种典型算法+13种应用)...

    生成对抗网络 – GANs 是最近2年很热门的一种无监督算法,他能生成出非常逼真的照片,图像甚至视频.我们手机里的照片处理软件中就会使用到它. 本文将详细介绍生成对抗网络 – GANs 的设计初衷.基 ...

  4. 掌握生成对抗网络(GANs),召唤专属二次元老婆(老公)不是梦

    全文共6706字,预计学习时长12分钟或更长 近日,<狮子王>热映,其逼真的外形,几乎可以以假乱真,让观众不禁大呼:awsl,这也太真实了吧! 实体模型.CGI动画.实景拍摄.VR等技术娴 ...

  5. 生成对抗网络GANs

    生成对抗网络GANs(Generative Adversarial Nets from datetime import datetime import tensorflow as tf import ...

  6. 一文读懂生成对抗网络GANs(附学习资源)

    原文标题:AnIntuitive Introduction to Generative Adversarial Networks 作者:KeshavDhandhania.ArashDelijani 翻 ...

  7. 小说生成对抗网络GANs

    1.前言 机器学习可以分为两类模型,一种是判别模型(discrimination model),给定一个输入,通过模型判别输入的类别.另一种是生成模型(generative model),给定输入,通 ...

  8. 【干货】生成对抗网络GANs算法在医学图像领域应用总结

    Goodfellow等人,介绍了生成对抗网络(GAN)以模拟数据分布.由于与两个基本属性相关的原因,GAN可以合成真实图像. GAN是一种无监督的训练方法,可以通过类似于人类学习图像特征的方式获取信息 ...

  9. Nikolai Yakovenko大佬:深度学习的下一个热点:生成对抗网络(GANs)将改变世界

    生成式对抗网络-简称GANs-将成为深度学习的下一个热点,它将改变我们认知世界的方式. 准确来讲,对抗式训练为指导人工智能完成复杂任务提供了一个全新的思路,某种意义上他们(人工智能)将学习如何成为一个 ...

  10. 深度学习的下一个热点:生成对抗网络(GANs)将改变世界

    本文作者 Nikolai Yakovenko 毕业于哥伦比亚大学,目前是 Google 的工程师,致力于构建人工智能系统,专注于语言处理.文本分类.解析与生成. 生成式对抗网络-简称GANs-将成为深 ...

最新文章

  1. 2021年大数据Hadoop(二):Hadoop发展简史和特性优点
  2. python可视化来分析全国疫情
  3. 织梦 百度sitemap制作教程
  4. 架构师之路 — 部署架构 — 高可用集群 — N+1 高可用模型
  5. [凯立德]2014春季版3121J0H+3121D0H
  6. Python高级网络编程系列之基础篇
  7. linux用xshell编辑文件,Linux远程管理器xshell和xftp使用教程
  8. 专访阿里巴巴量子实验室:最强量子电路模拟器“太章”到底强在哪?
  9. vue+elementUI 显示表格指定列合计数据
  10. nginx学习文档之二 配置负载均衡-windows配置负载均衡
  11. 申请google Map api key for android
  12. mysql报表慢_mysql慢查询日志报表工具mysqlsla
  13. 摩尔定律和梅特卡夫定律_摩尔定律f
  14. wh计算公式_电池的wh和mah怎么换算?
  15. 三级网络技术综合、应用题(2019、3)
  16. pdf批量盖章软件_我的PDF休要乱用 超实用的PDF批量加水印神器 它来了
  17. 如何随心意改变桌面快捷方式的图标
  18. Midjourney|文心一格prompt教程[基础篇]:注册使用教程、风格设置、参数介绍、隐私模式等
  19. 网上书店系统/书店管理系统的设计与实现
  20. 混合整数线性规划——切割平面

热门文章

  1. 三包围结构的字是什么样的_四张图说清楷书结构技巧,学硬笔书法的有福了
  2. java源码-LinkedHashMap
  3. Python(函数的参数)
  4. MySQLl数据量不一样,导致走不同的索引
  5. Office WORD如何在图片上添加文字
  6. Map 3D 2012定制和应用程序开发Webcast将于明天(6月23号)进行
  7. LeetCode - Duplicate Emails
  8. 转载:三种方式使得iOS应用能够在后台进行数据更新和下载
  9. 在ASP.net MVC中利用ajax配合razor进行局部加载
  10. 个人对回调函数的理解(personal understanding of callback function)