Quoc Le,谷歌AutoML的幕后英雄
李杉 编译自 AI Frontiers
量子位 出品 | 公众号 QbitAI
提到Google的AutoML,大家总会想到Jeff Dean、李飞飞,而实际上,这个项目背后还有一位贯穿始终的幕后英雄。
他是吴恩达的学生,Google Brain的创立者之一,也正是他的研究,为谷歌神经机器翻译打下了基础。
他就是Quoc Le。
一个名为AI Frontiers的科技博客对Quoc Le的研究做了比较全面的介绍,量子位翻译如下:
Quoc Le身材瘦弱,举止安静,戴着一副厚厚的眼镜,你很难想象他竟然在人工智能领域领导一场革命。
2011年,Le与他的博士生导师吴恩达,以及Jeff Dean和Greg Corrado两位谷歌研究员共同创办了谷歌大脑,目标是在谷歌庞大的数据背景下探索深度学习技术。在此之前,Le在斯坦福大学针对无监督深度学习开展了一些开创性工作。
2012年,Le在ICML会议上发表了一篇论文,引起了人们对深度学习的浓厚兴趣:他开发了一种深度神经网络模型,可以从来自YouTube的1000万张图片中,自动识别出猫,还能识别ImageNet数据集中的3000多种物体。
这也就是把谷歌大脑带到公众视线之中的“认猫事件”。
这个庞大的系统包含1.6万台机器和10亿个突触,比之前任何一次尝试的规模都要大100倍。Le的论文发表后,同年晚些时候有了AlexNet的论文,于是,整个深度学习领域都开始引人关注。
虽然后来的事实证明无监督机器学习在商业用途上有些不切实际——至少当时如此——但Le还是在2015年接受《连线》采访时表达了一种愿望:“如果我们能够找到一种可以发现(还可以通过同样的方式学习)的算法,那就太好了,因为更实际的情况是,我们掌握的非标记数据远多于标记数据。“
序列对序列学习
2013年毕业后,Le便正式担任谷歌研究员。在此之后,他很快在机器翻译方面取得了惊人的突破,这也是机器学习最活跃的研究领域之一。
为了实现这个结果,他必须突破在图像和语音领域效果很好的深度学习方法。已有的方法只能分析固定大小的输入信息,而在自然语言中,句子的长度各不相同,词语的顺序也很重要。
2014年,Le与谷歌研究员Ilya Sutskever和Oriol Vinyals一起提出序列到序列(seq2seq)学习方法。这是一种通用的编码器-解码器框架,可以训练模型将序列从一个域转换到另一个域,例如在不同语言之间实现语句翻译。
seq2seq所需的工程设计选择较少,能让谷歌的翻译系统高效而准确地处理庞大的数据集。它主要用于机器翻译系统,但也被证明适用于更广泛的任务,包括文本摘要、会话AI和问答。
接下来,Le发明了doc2vec,这种无监督算法从长度各异的文本片段(如句子、段落和文档)中学习固定长度的特征表示。
Doc2vec是谷歌研究员Tomas Mikolov 2013年推出的word2vec的扩展,word2vec的想法是,每个单词都可以用向量表示,而向量可以从一组文本中自动学习。Le向其中添加了段落向量,因此无论长度如何,模型都可以生成文档的表示。
Le的研究工作得到了回报。2016年,谷歌宣布推出神经机器翻译系统,它借助AI的学习能力,可以随着时间的推移,逐渐形成更好、更自然的翻译。
2015年,Le入选《麻省理工学院科技评论》评选的“35岁以下创新者”名单,原因是他致力于“让软件足够聪明,以帮助人们在日常生活中获得好的感受。”
AutoML:让神经网络学会自我提升
训练深度神经网络需要大量的标记数据和反复的实验:你可以选择一个架构,构建一些隐藏层,然后根据输出调整权重。对于机器学习专业知识有限的人来说,这个训练过程有些费时费力。
2016年,Le和另一位谷歌同事Barret Zoph提出了神经架构搜索。他们使用循环神经网络生成神经网络的模型描述,并使用强化学习训练这个循环神经网络,从而尽可能提升生成的架构在验证集上的预期准确率。
这种新方法可以帮助研究人员设计新网络架构,该架构在CIFAR-10数据集中测试精度,能匹敌最好的人工架构。
一年后,Le和Zoph将他们的研究提升到了一个新的水平,提出了NASNet-A,这是一个针对大规模图像数据集设计的可转换架构。
Le的研究为AutoML奠定了基础,这套谷歌产品的目标用户,是那些在机器学习方面专业能力和资源有限的开发人员。
尽管还很早期,但AutoML正在解决现实问题:有数据科学家使用AutoML建立了一个模型,可以根据面条图像识别出一家餐厅,准确度几乎达到95%。还有日本开发人员用AutoML构建了一个模型,可以根据品牌名称对图像进行分类。
谷歌今年早些时候推出了AutoML Vision。在上个月的谷歌Cloud Next会议上,该公司还发布了翻译和自然语言工具。
过去6年里,Le一直处于深度学习发展的最前沿。这位36岁的谷歌研究员现在准备将深度学习提升到新的水平。
原文:
https://medium.com/@aifrontiers/an-unassuming-genius-the-man-behind-google-brains-automl-4ddc801f3e9b
— 完 —
加入社群
量子位AI社群19群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
Quoc Le,谷歌AutoML的幕后英雄相关推荐
- 谷歌大脑开源「数据增强」新招数:ImageNet准确率达85%,大神Quoc Le出品
十三 发自 凹非寺 量子位 报道 | 公众号 QbitAI 你的数据还不够强. 玩深度学习的人都知道,AI算法大部分是数据驱动.数据的质量一定程度上决定了模型的好坏. 这就有了深度学习天生的一个短板 ...
- 2021年机器学习什么风向?谷歌大神Quoc Le:把注意力放在MLP上
来源:机器之心本文约2600字,建议阅读5分钟Attention is all you need. [ 导语 ]在机器学习领域里有一句俗话:「Attention is all you need」,通过 ...
- 2021年机器学习什么风向?谷歌大神Quoc Le:把注意力放在MLP上
转载自:机器之心 在机器学习领域里有一句俗话:「Attention is all you need」,通过注意力机制,谷歌提出的 Transformer 模型引领了 NLP 领域的大幅度进化,进而影响 ...
- 从谷歌AutoML到百度EasyDL,AI大生产时代,调参师不再是刚需
出品 | AI科技大本营 头图 | 付费下载于视觉中国 2018 年,Google Cloud 宣布将 AutoML 作为机器学习产品的一部分.至此,AutoML 开始进入大众的视野. 实际上,201 ...
- 终结谷歌AutoML的真正杀手!Saleforce开源TransmogrifAI
来源:AI前线 本文共4739字,建议阅读10分钟. 本文我们介绍了 TransmogrifAI 的工作流程并讨论其背后的设计决策. [ 导读 ]尽管机器学习在过去十年中取得了巨大进步,但构建生产就绪 ...
- 实操指南:用谷歌AutoML构建图像分类模型
2020-03-16 12:31:00 全文共2710字,预计学习时长8分钟 如何用谷歌AutoML创建单标签分类模型? 今天我们将使用一个来自generated.photos的AI生成的人脸数据集, ...
- 资讯丨谷歌 AutoML AI系统写的机器学习代码,完爆程序员
谷歌 AutoML 系统最近出产了一系列机器学习代码,其效率甚至比研究人员自身还要高.显然,这是对"人类优越论"的又一次打击,因为机器人"学生"们已经成为了&q ...
- 归一化激活层的进化:谷歌Quoc Le等人利用AutoML 技术发现新型ML模块
关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 最近,谷歌大脑团队和 DeepMind 合作发布了一篇论文,利用 AutoML 技 ...
- 谷歌AutoML鼻祖Quoc Le新作AutoML-Zero:从零开始构建机器学习算法
关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! AutoML 试图将特征工程.模型选择.参数调节这些与特征.模型.优化.评价有关的 ...
最新文章
- 关于python字典以下选项中描述错误的是_关于 Python 对文件的处理,以下选项中描述错误的是_学小易找答案...
- Android SQLite数据库的详细使用
- 快递员要失业?两位前谷歌工程师研发出自动驾驶汽车只送货不载人
- 用 docker secrets 保存 appsettings.Production.json
- HTML P不能包含块级元素(包括自身)
- 安卓案例:View动画 - 弹球碰壁
- linux 临时 目录权限,linux文件和目录权限的设置
- 架构篇--系统监控--spring-boot2.0.X 系统原生信息监控,SQL信息监控,cpu温度监控报警,cup磁盘内存使用率监控报警,自定义端点监控以及子节点获取,系统异常邮件通知
- conficker病毒
- petalinux笔记
- 产品干货1:如何套用闫荣的产品心法?
- php的gc回收机制,php垃圾回收机制相关(GC)
- 关于Intel显卡控制面板导致快捷键失灵的解决方法
- 马原(2023版)导论笔记
- 车间生产管理系统(工厂数字化管理系统软件)
- 基金定投matlab程序,销售基金定投好简单:如何三分钟让客户理智开户做定投
- 笃静守一,深耕匠设:2018“渲云杯”全国空间表现大赛颁奖盛典
- 面试——数据库常问问题
- 企业内部文档共享平台-MM-WiKi
- mybatis的parameterType可以不写(我一般都不写)
热门文章
- 怎样解决编程语言之间的差异性问题?
- 2019年江苏省计算机一级考试题目和答案,江苏省计算机等级考试一级2019年(春)...
- mesh threejs 属性_ThreeJS拖动案例解析
- linux怎么装vnc插件,linux下安装基于GNOME的VNC连接工具Vinagre
- php5.6获取文件名,PHP 5.6:headers_sent间歇性地返回true,空文件名和第0行
- python支持函数式编程吗_利用Fn.py库在Python中进行函数式编程
- octave深度学习_【深度学习笔记】(一)Octave
- java 方法详解_Java方法详解
- mysql binlog ignore db_MySQL binlog_ignore_db 参数最全解析
- 18 安装zlib报错_scalapack win安装及mingw64环境配置