文 | 蒋宝尚
源 | AI科技评论

在AI圈里有这么一个人,虽然大学没有毕业,但却做过谷歌大脑研究员,担任过OpenAI团队的领导人。他被人称作“怪胎”,也被人称作神童。

他的名字叫做Chris Olah。在众人眼里,他的成长树在一开始似乎长“歪”:18岁那一年,进入多伦多大学读本科,随后辍学开始研究计算机。他运气不错,在刚刚开始进行AI研究的时候,他就得到了知名学者、量子物理学家 Michael Nielsen 的指导。

2013 年,图灵奖得主 Yoshua Bengio 曾邀请他去做自己的研究生,但Chris居然拒绝了Bengio的邀请,去谷歌大脑团队做了实习生,跟随Jeff Dean研究卷积神经网络、交互媒体相关的内容。

仍然是运气不错。2015年,在 Greg Corrado 的帮助下,他转为了谷歌的正式员工。在谷歌的那段日子,发过多篇论文,带过博士生,并和贾扬清、Ian Goodfellow等顶尖研究员一起合作过。

根据谷歌学术,其h指数甚至达到了19,总引用数达到了32616,远超拥有博士学位的研究者。其中,最高引用的一篇文章,TensorFlow: Large-scale machine learning on heterogeneous systems”,是他在谷歌大脑和40多作者,包括Jeffrey Dean、 Ian Goodfellow等知名学者合写的关于tensorflow详细介绍。

Chris Olah 在最近的一篇博客中介绍了自己对于“如何提升研究品味”的看法以及背后的一些决策思考,以下为博客内容整理。

如何提升研究品味

要成为一名研究人员,最重要的一个能力就是培养研究品味(审美),因为,品味背后代表着能够选择一个好的研究问题。培养品味很难,下面我在分享一些可操作的训练方法。

在说明具体方法之前,有必要思考一下为什么培养研究品味如此之难。最核心的问题是:验证研究想法是否有价值的成本非常高昂。直观体现在时间成本上,通常情况下,验证想法需要耗费几个月的时间,这意味着,每年只能得到有限的几条关于审美的反馈。下面介绍的练习方法,将教你如何快速获反馈。

值得一提的是,不建议强迫自己去做不感兴趣的事情,即理智上认为它很重要。其实,最重要的问题应该是能让你感到极度兴奋。

练习方式

练习1:列出研究想法的清单。找一位导师,让他给每个想法打分。然后和他讨论你不同意的观点。

相比通常需要几个月才能验证研究想法。请教导师是极具性价比的方式。

练习2:当别人尝试你的研究想法时,将他的结果和你的预期相比。

当和别人头脑风暴时,你可能投入大量的时间精力,但同时你也可能拥有数十个研究想法。如果别人实现了你的想法,并发表了论文。那么,你可能会感到不舒服,但记住这是一个免费获得宝贵反馈的机会。

练习3:采访你周围的研究人员,了解他们的审美。弄明白他们为什么要努力解决他们所面临的问题?他们是如何挑选问题的?他们研究的“蓝图”是什么?

额外好处:如果感觉采访很棒,可以考虑获得允许后,把这些东西写下来。

另外,大多数博士生经常会和访问他们实验室的研究人员开一些简短的会议。目的之一是向来访者“推销”他们的项目,如果他们没有类似的兴趣,便可能没有什么成效。

练习4:阅读有关科学史的书籍。反思为什么一些研究者把注意力集中在被他们同时代人所忽略的重要方向上。

注:库恩的《科学革命的结构》(The Structure of Scientific Revolutions)是我最喜欢的书之一。

练习5:批判性地思考你的研究审美,以及你周围的社群审美。你的审美很可能会受到你的研究集群(合作者、顾问等)的影响。

思考的一些方向可以有:在过去几年里,你自己的研究或你所在的社群的看法在哪些方面是错误的?

是否有相邻的研究“流派”具有明显不同的研究审美?如果是这样,试着说出他们"最强烈"的观点,以及你同意或不同意的原因。

你在哪些方面不同意你自己社群的研究审美?你认为你的社群在哪些方面可能是错误的?

你的研究目标是什么?是为了寻找研究的乐趣?想让世界变得更美好?你正在处理的问题是否与这些目标有关系?

失败模式

列举一些失败的研究审美的模式:

失败模式1:过于依赖一个研究方向或者陷入沉没成本。

许多研究人员开始研究一个问题(通常是由于环境而不是预期的决定),然后发现很难继续下去。

可能的解决办法:留出一到两周的时间,后退一步,列出你认为最有前途的其他研究方向,可以看看新的研究,与他人交流,等等。然后问一下如果你从头开始,你想做什么。根据需要每1-2年重复一次。

失败模式2:缺乏背景知识或者亲密感。

理论知识是研究品味形成的重要因素,因为你的研究品味不可能凭空得来。

有时,人们陷入了一个陷阱,试图在动手之前就选择一个完美的问题或有一个卓越的见解。然而你的研究审美不可能凭空的来,因此你需要理论知识和研究亲密感。

可能的解决办法:在你感兴趣的领域帮助别人完成他们的项目。你会发现,在这过程中会学到很多东西,并且不用过度投入到长期的工作中。理想情况下,如果不担任项目的“头头”,或者做短期项目,能够让你比较轻松,也可以帮助保持你的研究感觉和研究热度。

失败模式3:环境与你的兴趣不一致。

我有时会和一些博士生交谈,这些博士生和他们的导师有不同的兴趣,他们试图把自己的研究兴趣扭曲成他们导师喜欢的东西。这通常会形成一些为了折衷而不是为了质量而进行优化的想法。如此一来,会导致不甚理想的研究,也会让你失去建立研究审美的机会。

即使你周围的人名义上支持你从事任何你感兴趣的工作,上述情况也会发生。而当你周围的人都缺乏热情的时候,要追求一个方向是很有挑战性的。

可能的解决办法:要么“搬家”到一个与你的兴趣相一致的环境,要么暂时融入你的社群,并尝试在这些兴趣范围内锻炼良好的研究品味。我通常认为,一旦你对自己感兴趣的东西进行了大量反思,并拥有了自己感到非常兴奋的东西,你就可以跳到另一个环境中去。

其他人的建议

在twitter上的讨论中,很多人提出了其他的想法。请注意,所有这些都是“构建品味的练习”。

• 雷切尔•普鲁登建议

想象另一个小组发表了你脑海中的论文。你会对读到它而感到兴奋吗?

Chris评论:我认为这是一个很好的启发式。

• Andy Matuschak建议

就你的观点提出反汉明(anti-Hamming)的问题。在你的领域里最有趣(但不重要)的问题是什么?你为什么不去做呢?

Chris评论:这是个很好的问题。参见汉明著名的“你和你的研究”演讲。

• 安迪也分享了一个失败模式:

试着让一个想法在看起来容易处理的时候去做。有一个令人兴奋而可行的方法是——让我想去做它!如果有一个想法,我长时间思考它,通常可以进化出更深层次的变体,并将其付诸实践。

• 迈克尔·尼尔森(Michael Nielsen)的《有效研究原则》(Principles of Effective research)指出了关注混乱领域的价值:

当你发现“混乱”时,很多人第一反应是回避,去寻找更容易理解的东西。但一个混乱的领域其实是一个机遇。很有可能会有一些深入的统一和简化的概念仍然等待着某人——也许是你——的理解和发展。

• 亚索·奥尔希尔(Arthur Allshire)

你所在领域的瓶颈问题是什么?如在许多强化学习的研究中,很多关注的是对算法的细微调整,但最大的改进来自于对RL的模拟的改进。

• Preetum Nakkiran

我发现写短期的“项目建议书”和长期的“研究陈述或计划”是思考动机和目标(在不同的时间尺度)的很好的练习。所谓的“项目提案”是指:一旦你决定花超过1个月的时间在什么问题上,那么不妨写下几页文字来告诉自己:为什么这个问题是有趣的,为什么这个答案是有价值的,以及你希望找到什么(比如初始证据),然后得到反馈。

…另外,建议你向你遇到的每个人询问他们的“大蓝图”研究目标。因为这非常有趣和重要,但一般不会出现在论文上。

• Christian Szegedy

事后看来,我在研究中所犯的大多数错误都是因为我听取了我尊敬的导师的批评,而我所做的大部分很酷的东西,最初都被大家认为是无用的、无趣的,或“祝你好运!”。一般来说,研究中的想法要么领先于其他想法,要么挑战传统智慧。加入后一种阵营需要较少的技巧,但需要更多的勇气。

Chris评论:我认为很有道理,但是要注意幸存者偏差,记住不同的人在他们职业生涯的不同阶段可能有不同的科学成熟度或审美。我猜想,许多博士生会发现,从一开始就制定自己的研究议程是非常具有挑战性的,因为成长或许会让他们改变想法。

• Sergey Gorbunov

关于研究品味,我对研究生或初级研究员的唯一建议是“不要”听你的导师或知名研究员的话……因为研究生院是唯一一个让你有机会尝试和失败的地方。研究生应该想出非常规的问题或者解决方案。(因为已建立的研究有自己的流程和思考方式????)。同样,建议也可以用来推翻自己。

• Boaz Barak

我喜欢“20/80项目”,即你做了80%的工作却实现了20%的目标:而不是问“我用最小的努力能得到的最好的结果是什么?”或者“我能否找到足以概括出主要障碍的问题,即使最终结果听起来并不怎么样?”

后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

 

[1] https://colah.github.io/notes/taste/

我,大学没毕业,在OpenAI搞AI,想教教你如何提升“研究品味”相关推荐

  1. 解码Snapchat CEO埃文:大学没毕业 完全不懂代码

    在埃文·斯皮格(Evan Spiegel)成为我们所知的Snapchat CEO之前,他有很多次都想顺从这个社会.例如2012年6月,斯皮格曾走上斯坦福大学体育馆的临时舞台,领取他实际上并未获得的毕业 ...

  2. 他把数学书当小说看,初中没毕业却敢自荐中科大数学研究生,现在天才都这么狂妄了吗?...

    全世界只有3.14 % 的人关注了 爆炸吧知识 他的脑子不太像人脑 太聪明了 今天,超模君来介绍一位看数学书像看小说一样的天才吧. 他是初中没毕业,靠自学8年,便成为文 革后第一个被中科大破格录取的数 ...

  3. 杭电AI学霸班:考研上岸3清北8浙大,还没毕业年薪拿百万

      视学算法报道   编辑:桃子 拉燕 [新智元导读]杭州电子科技大学「王炸班」34个人上岸名校,其中3人考进清北. 如今考研,何以用一个「卷」字形容... 近日,就在杭州电子科技大学人工智能学院就出 ...

  4. 马斯克直聘AI人才:高中毕没毕业无所谓,但是编程能力得过硬

    雷刚 发自 凹非寺  量子位 报道 | 公众号 QbitAI 火,大火,太火了. 这就是特斯拉2020年以来的股价趋势.在最新一轮暴涨后,马斯克都忍不住祭出"大火"表情包,庆祝市值 ...

  5. 马斯克直聘AI人才:高中毕没毕业无所谓,但是编程能力得过

    火,大火,太火了. 这就是特斯拉2020年以来的股价趋势.在最新一轮暴涨后,马斯克都忍不住祭出"大火"表情包,庆祝市值创下新高--1400亿美元,折合人民币9829亿元,已近万亿市 ...

  6. AI 没让人类失业,搞 AI 的人先失业了

    最近和几个 AI 领域的大佬闲聊 根据他们讲的消息和段子 改编出下面这个故事 如有雷同 都是巧合 1. 老王创业失败,被限制高消费 "这里写我跑路的消息实在太夸张了." 王葱葱哼笑 ...

  7. 我妈给我介绍对象了,我大学还没毕业呢,先在婚介市场也这么卷了的吗?【Python爬虫实战:甜蜜蜜婚介数据采集】

    大家好,我是辣条. 说出来你们可能不信,我一个在校还没毕业的学生家里竟然给我介绍对象了-这么着急的吗?现在结婚市场都这么卷了吗?男孩们女孩们不努力的话是会被家里捉回去结婚的哦. 这是和我妈的聊天对话, ...

  8. 官方论文还没出,刷爆AI圈的DALL·E刚发布就被复现?两天800 star!

    点击上方"CVer",选择加"星标"置顶 重磅干货,第一时间送达 萧箫 发自 凹非寺 来源:量子位(QbitAI) 没想到,OpenAI刚公布DALL·E,就已 ...

  9. 别人以为搞AI的高大上,我却觉得自己是个骗子

    2021-03-13 13:12:45 金磊 贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 搞机器学习的你,是否有过这种经历? 当别人看你工作,桌上2.3台显示器,满屏的代码,不禁惊呼 ...

最新文章

  1. 开源软件5大常见问题及解决方法
  2. iOS5.1 + XCode4.5 device debug,the screen will ...
  3. oracle编程艺术笔记1
  4. hibernate by example 排除某些列
  5. linux 复制文件 中文,linux中cp命令如何复制文件
  6. Xilinx实习一年总结
  7. 子列和列_最大子列和 - fanlinglong - 博客园
  8. 遗传算法原理以及matlab代码
  9. cadence 通孔焊盘_Allegro PCB -通孔焊盘制作 及Flash制作
  10. qq游戏坦大战服务器维护中,高手教你如何解决QQ游戏问题
  11. 如何快速准确的验证QQ邮箱是否开通,是否存在?
  12. 部分一二线城市的建筑物矢量图
  13. 免费下载数据集(转载)--大数据学习用
  14. 机器学习、深度学习中常用的优化算法详解——梯度下降法、牛顿法、共轭梯度法
  15. Spring Boot Redis关闭
  16. linux内核是干什么,linux内核开发工程师
  17. html5 三国杀,OL还更新HTML5吗?不更新不充值了
  18. 关于表格分页缓存数据
  19. 简约个人导航,主页,引导页html源码三分钟下载安装
  20. 录制失败因为媒体服务失败_啊啊啊啊!原来戚风失败是因为……

热门文章

  1. vs2010 rdlc 报表及报表控件
  2. jQuery UI应用--滑块Slider
  3. ctype.h,ctype.c 结构分析 \linux-1.0\linux\include\linux\ctype
  4. MySQL 引擎特性 · InnoDB Buffer Pool
  5. Java内存泄露原因详解
  6. MongoDB基本应用操作整理
  7. thief book怎么用_战略管理工具箱--30个好用的战略管理好工具
  8. rocketmq queue_RocketMQ 实战(三) - 消息的有序性
  9. python网络爬虫系列(七)——selenium的介绍 selenium定位获取标签对象并提取数据 selenium的其它使用方法
  10. Web框架——Flask系列之自定义过滤器详解(五)