李杉 编译自 AI Frontiers
量子位 出品 | 公众号 QbitAI

提到Google的AutoML,大家总会想到Jeff Dean、李飞飞,而实际上,这个项目背后还有一位贯穿始终的幕后英雄。

他是吴恩达的学生,Google Brain的创立者之一,也正是他的研究,为谷歌神经机器翻译打下了基础。

他就是Quoc Le。

一个名为AI Frontiers的科技博客对Quoc Le的研究做了比较全面的介绍,量子位翻译如下:

Quoc Le身材瘦弱,举止安静,戴着一副厚厚的眼镜,你很难想象他竟然在人工智能领域领导一场革命。

2011年,Le与他的博士生导师吴恩达,以及Jeff Dean和Greg Corrado两位谷歌研究员共同创办了谷歌大脑,目标是在谷歌庞大的数据背景下探索深度学习技术。在此之前,Le在斯坦福大学针对无监督深度学习开展了一些开创性工作。

2012年,Le在ICML会议上发表了一篇论文,引起了人们对深度学习的浓厚兴趣:他开发了一种深度神经网络模型,可以从来自YouTube的1000万张图片中,自动识别出猫,还能识别ImageNet数据集中的3000多种物体。

这也就是把谷歌大脑带到公众视线之中的“认猫事件”。

这个庞大的系统包含1.6万台机器和10亿个突触,比之前任何一次尝试的规模都要大100倍。Le的论文发表后,同年晚些时候有了AlexNet的论文,于是,整个深度学习领域都开始引人关注。

虽然后来的事实证明无监督机器学习在商业用途上有些不切实际——至少当时如此——但Le还是在2015年接受《连线》采访时表达了一种愿望:“如果我们能够找到一种可以发现(还可以通过同样的方式学习)的算法,那就太好了,因为更实际的情况是,我们掌握的非标记数据远多于标记数据。“

序列对序列学习

2013年毕业后,Le便正式担任谷歌研究员。在此之后,他很快在机器翻译方面取得了惊人的突破,这也是机器学习最活跃的研究领域之一。

为了实现这个结果,他必须突破在图像和语音领域效果很好的深度学习方法。已有的方法只能分析固定大小的输入信息,而在自然语言中,句子的长度各不相同,词语的顺序也很重要。

2014年,Le与谷歌研究员Ilya Sutskever和Oriol Vinyals一起提出序列到序列(seq2seq)学习方法。这是一种通用的编码器-解码器框架,可以训练模型将序列从一个域转换到另一个域,例如在不同语言之间实现语句翻译。

seq2seq所需的工程设计选择较少,能让谷歌的翻译系统高效而准确地处理庞大的数据集。它主要用于机器翻译系统,但也被证明适用于更广泛的任务,包括文本摘要、会话AI和问答。

接下来,Le发明了doc2vec,这种无监督算法从长度各异的文本片段(如句子、段落和文档)中学习固定长度的特征表示。

Doc2vec是谷歌研究员Tomas Mikolov 2013年推出的word2vec的扩展,word2vec的想法是,每个单词都可以用向量表示,而向量可以从一组文本中自动学习。Le向其中添加了段落向量,因此无论长度如何,模型都可以生成文档的表示。

Le的研究工作得到了回报。2016年,谷歌宣布推出神经机器翻译系统,它借助AI的学习能力,可以随着时间的推移,逐渐形成更好、更自然的翻译。

2015年,Le入选《麻省理工学院科技评论》评选的“35岁以下创新者”名单,原因是他致力于“让软件足够聪明,以帮助人们在日常生活中获得好的感受。”

AutoML:让神经网络学会自我提升

训练深度神经网络需要大量的标记数据和反复的实验:你可以选择一个架构,构建一些隐藏层,然后根据输出调整权重。对于机器学习专业知识有限的人来说,这个训练过程有些费时费力。

2016年,Le和另一位谷歌同事Barret Zoph提出了神经架构搜索。他们使用循环神经网络生成神经网络的模型描述,并使用强化学习训练这个循环神经网络,从而尽可能提升生成的架构在验证集上的预期准确率。

这种新方法可以帮助研究人员设计新网络架构,该架构在CIFAR-10数据集中测试精度,能匹敌最好的人工架构。

一年后,Le和Zoph将他们的研究提升到了一个新的水平,提出了NASNet-A,这是一个针对大规模图像数据集设计的可转换架构。

Le的研究为AutoML奠定了基础,这套谷歌产品的目标用户,是那些在机器学习方面专业能力和资源有限的开发人员。

尽管还很早期,但AutoML正在解决现实问题:有数据科学家使用AutoML建立了一个模型,可以根据面条图像识别出一家餐厅,准确度几乎达到95%。还有日本开发人员用AutoML构建了一个模型,可以根据品牌名称对图像进行分类。

谷歌今年早些时候推出了AutoML Vision。在上个月的谷歌Cloud Next会议上,该公司还发布了翻译和自然语言工具。

过去6年里,Le一直处于深度学习发展的最前沿。这位36岁的谷歌研究员现在准备将深度学习提升到新的水平。

原文:

https://medium.com/@aifrontiers/an-unassuming-genius-the-man-behind-google-brains-automl-4ddc801f3e9b

加入社群

量子位AI社群19群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

Quoc Le,谷歌AutoML的幕后英雄相关推荐

  1. 谷歌大脑开源「数据增强」新招数:ImageNet准确率达85%,大神Quoc Le出品

    十三 发自 凹非寺  量子位 报道 | 公众号 QbitAI 你的数据还不够强. 玩深度学习的人都知道,AI算法大部分是数据驱动.数据的质量一定程度上决定了模型的好坏. 这就有了深度学习天生的一个短板 ...

  2. ​2021年机器学习什么风向?谷歌大神Quoc Le:把注意力放在MLP上

    来源:机器之心本文约2600字,建议阅读5分钟Attention is all you need. [ 导语 ]在机器学习领域里有一句俗话:「Attention is all you need」,通过 ...

  3. 2021年机器学习什么风向?谷歌大神Quoc Le:把注意力放在MLP上

    转载自:机器之心 在机器学习领域里有一句俗话:「Attention is all you need」,通过注意力机制,谷歌提出的 Transformer 模型引领了 NLP 领域的大幅度进化,进而影响 ...

  4. 从谷歌AutoML到百度EasyDL,AI大生产时代,调参师不再是刚需

    出品 | AI科技大本营 头图 | 付费下载于视觉中国 2018 年,Google Cloud 宣布将 AutoML 作为机器学习产品的一部分.至此,AutoML 开始进入大众的视野. 实际上,201 ...

  5. 终结谷歌AutoML的真正杀手!Saleforce开源TransmogrifAI

    来源:AI前线 本文共4739字,建议阅读10分钟. 本文我们介绍了 TransmogrifAI 的工作流程并讨论其背后的设计决策. [ 导读 ]尽管机器学习在过去十年中取得了巨大进步,但构建生产就绪 ...

  6. 实操指南:用谷歌AutoML构建图像分类模型

    2020-03-16 12:31:00 全文共2710字,预计学习时长8分钟 如何用谷歌AutoML创建单标签分类模型? 今天我们将使用一个来自generated.photos的AI生成的人脸数据集, ...

  7. 资讯丨谷歌 AutoML AI系统写的机器学习代码,完爆程序员

    谷歌 AutoML 系统最近出产了一系列机器学习代码,其效率甚至比研究人员自身还要高.显然,这是对"人类优越论"的又一次打击,因为机器人"学生"们已经成为了&q ...

  8. 归一化激活层的进化:谷歌Quoc Le等人利用AutoML 技术发现新型ML模块

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 最近,谷歌大脑团队和 DeepMind 合作发布了一篇论文,利用 AutoML 技 ...

  9. 谷歌AutoML鼻祖Quoc Le新作AutoML-Zero:从零开始构建机器学习算法

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! AutoML 试图将特征工程.模型选择.参数调节这些与特征.模型.优化.评价有关的 ...

最新文章

  1. 关于python字典以下选项中描述错误的是_关于 Python 对文件的处理,以下选项中描述错误的是_学小易找答案...
  2. Android SQLite数据库的详细使用
  3. 快递员要失业?两位前谷歌工程师研发出自动驾驶汽车只送货不载人
  4. 用 docker secrets 保存 appsettings.Production.json
  5. HTML P不能包含块级元素(包括自身)
  6. 安卓案例:View动画 - 弹球碰壁
  7. linux 临时 目录权限,linux文件和目录权限的设置
  8. 架构篇--系统监控--spring-boot2.0.X 系统原生信息监控,SQL信息监控,cpu温度监控报警,cup磁盘内存使用率监控报警,自定义端点监控以及子节点获取,系统异常邮件通知
  9. conficker病毒
  10. petalinux笔记
  11. 产品干货1:如何套用闫荣的产品心法?
  12. php的gc回收机制,php垃圾回收机制相关(GC)
  13. 关于Intel显卡控制面板导致快捷键失灵的解决方法
  14. 马原(2023版)导论笔记
  15. 车间生产管理系统(工厂数字化管理系统软件)
  16. 基金定投matlab程序,销售基金定投好简单:如何三分钟让客户理智开户做定投
  17. 笃静守一,深耕匠设:2018“渲云杯”全国空间表现大赛颁奖盛典
  18. 面试——数据库常问问题
  19. 企业内部文档共享平台-MM-WiKi
  20. mybatis的parameterType可以不写(我一般都不写)

热门文章

  1. 怎样解决编程语言之间的差异性问题?
  2. 2019年江苏省计算机一级考试题目和答案,江苏省计算机等级考试一级2019年(春)...
  3. mesh threejs 属性_ThreeJS拖动案例解析
  4. linux怎么装vnc插件,linux下安装基于GNOME的VNC连接工具Vinagre
  5. php5.6获取文件名,PHP 5.6:headers_sent间歇性地返回true,空文件名和第0行
  6. python支持函数式编程吗_利用Fn.py库在Python中进行函数式编程
  7. octave深度学习_【深度学习笔记】(一)Octave
  8. java 方法详解_Java方法详解
  9. mysql binlog ignore db_MySQL binlog_ignore_db 参数最全解析
  10. 18 安装zlib报错_scalapack win安装及mingw64环境配置