CV 人的大型追星现场来了。

来源 | AI科技评论

作者 | 黄楠   编辑 | 陈彩娴

又一名 AI 大神有了新动向!

当地时间3月13日下午3点,何恺明在MIT做学术演讲。据现场网友所述,即便自己提前半小时去到现场,但仍挤不进会场,仅排队就拐了几个弯,MIT CSAIL 还临时开了隔壁会议室投屏,许多人是挤在小角落里听完全程的。

据 MIT CSAIL 实验室此前发布公告显示,本次何恺明的演讲主题是 "In Pursuit of Visual Intelligence"(追求视觉智能)。

在现场演讲中,何恺明按时间线顺序回顾其之前的几篇工作,主要包括了 ResNet、Faster R-CNN、Mask R-CNN、MoCo 和 MAE。据何恺明所言,“在 ResNet 出现以前,Deep learning 的大厦上空漂浮着一朵乌云,而 ResNet 去掉了这朵乌云。”

此外,何恺明也在现场透露了接下来的研究方向会是 AI for science,将聚焦视觉和 NLP 大一统做 self-supervised X+AI。

会议室爆满(图源:知乎)

MIT CSAIL 隔壁会议室满座(图源:知乎@睡不醒的芋泥)

(图源:知乎@睡不醒的芋泥)

1

何恺明将回归学术界?

何恺明是 CV 领域的翘楚,其谷歌学术被引用次数已经突破40万次,在2022年人工智能全球最具影响力学者榜单中,何恺明获得第一名。

自3月9日何恺明将在 MIT 进行 Job talks(求职演讲)的消息传出后,很快引起 AI 圈的关注。Job talks 是学术界的一个传统,多集中在每年的三四月份进行,申请博士或教职的学者会到高校内做学术报告,演讲内容多为自己的研究成果。

随后杜克大学教授陈怡然也在微博上发声,表示“一直听说何恺明在Market上,靴子终于落了地。”

值得一提的是,如果何恺明确认加入 MIT,那他将会成为全校被引用次数最高的学者。目前 MIT 全校被引用量最高的是化学与生物医学工程系的 Robert Langer,总引用量超过38万次。

有网友表示,何恺明能够进入到 MIT 的 Job talks 阶段,说明他已通过简历筛选,其研究成果和能力上得到 MIT 的认可,但这并不意味着何恺明最终会选择加入 MIT。

2

从高考状元到 CV 大神

何恺明是广东人,从小在广州长大,在广州执信中学读书时曾获得全国物理竞赛和省化学竞赛的一等奖。2003年5月,何恺明获得保送清华的资格,同年他以满分900分的成绩,成为当年广东省9位满分状元之一。进入清华大学以后,何恺明放弃保送的机械工程及其自动化专业转向基础科学班。

2007年,还未毕业的何恺明进入微软亚洲研究院实习,出于对计算机图形图像课程的兴趣,他选择加入了视觉计算组。头两年里,何恺明尝试做过不少各种各样的课题,但一直发不了论文,这对此前头顶着高考满分状元光环的他来说,无疑是个不小的打击。

何恺明花了更多时间在问题研究上,甚至在电脑游戏里找灵感。不鸣则已,一鸣惊人。2009 年,汤晓鸥、何恺明以及孙剑凭借论文“Single Image Haze Removal Using Dark Channel Prior ”,获得该年度 CVPR 的最佳论文奖,这也是该会议 30 年以来第一次(也是唯一一次)颁发给亚洲研究学者。

汤晓鸥(左)和何恺明(右)

2011年,何恺明从香港中文大学多媒体实验室(MMLab)博士毕业,后加入微软亚洲研究院工作;2016年8月,他离开微软亚洲研究院,转而加入 Facebook AI 研究院(FAIR)。

2015年,由何恺明提出的深度残差网络 ResNet ,在 ILSVRC 2015 分类任务竞赛中,首次超越人类水平,斩获竞赛第一名,该工作还拿到了 2016 年 CVPR 最佳论文。

ResNets 也成为计算机视觉领域的流行架构,并被用于机器翻译、语音合成、语音识别和 AlphaGo 的研发上。目前,何恺明谷歌学术被引用量已经超过40万次,其中引用量最高的,也是这篇工作,单篇引用量在2021年底突破10万次,目前已涨至15万次。

在 FAIR 期间,何恺明和团队在计算机视觉领域取得了不少亮眼的成绩,包括 Faster R-CNN、Mask R-CNN 等系列研究。其中,Mask R-CNN 解决了图片中的实例级对象分割问题,不仅能将照片中的人、动物等对象单一检测,还可为其每个对象实例生成一个高质量分隔遮罩,该工作获得了 ICCV 2017 的最佳论文奖。

而在去年火热的 AIGC 领域,何恺明团队在原有的 CLIP 架构基础上,使用掩码方法,不仅实现新模型速度3.7倍的提升,模型性能也得到了一定程度的优化。

3

离开大厂的 AI 大牛再添一员

事实上,早在去年 Meta 第一波裁员时,就有消息传出何恺明也在被裁名单中,但彼时阿里巴巴副总裁贾扬清在相关知乎问题下对这一消息进行了否认。

何恺明所在的 Facebook AI Research 自去年以来,已经发生过几次重大调整。

其中,图灵奖得主杨立昆(Yann LeCun)负责基础研究,Jerome Pesenti 负责管理整理 AI 部门的技术、产品赋能、运营等工作。但自2022年6月开始,FAIR 被并入至元宇宙部门Reality Labs,杨立昆转向该部门的首席科学家 Andrew Bosworth 汇报。

后续的调整也是围绕“去中心化组织结构”进行,重点在削减对基础研究的投入。

可以看到,即便如 Facebook 这样的巨头在整体预算整体收缩之际,AI 研究院率先面临了被边缘化的困局。

预算缩减、人心涣散,直接导致了优秀人才的离职频发。这些离开的 AI 大牛有两条发展路径:一是从工业界回到学术界,二是从大厂离开、自己创业,担任CEO或CTO等要职,并持续从风险投资人处成功获得融资。

就在半月前,亚马逊机器学习部门原杰出科学家/VP Alex Smola 与首席科学家李沐师徒二人离职,进军大模型方向创业,此次何恺明前往 MIT 面试教职的消息,也再次引发外界对大厂 AI 实验室和 AI 人员的讨论和思考。

参考链接:

1.https://www.csail.mit.edu/event/eecs-special-seminar-kaiming-he-pursuit-visual-intelligence

2.https://www.zhihu.com/question/588205714

END

分享

收藏

点赞

在看

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science相关推荐

  1. 何恺明MIT求职演讲现场:提前三小时就有排队,超百页PPT回顾CV发展,以及“大神月半了”...

    杨净 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 何恺明MIT求职演讲,真成AI圈大型追星现场了! 据量子位身处现场的听众朋友传回的消息,有同学提前3个小时已经蹲在门口排队了. 到演讲开始前 ...

  2. Paper:2020年3月30日何恺明团队最新算法RegNet—来自Facebook AI研究院《Designing Network Design Spaces》的翻译与解读

    Paper:2020年3月30日何恺明团队最新算法RegNet-来自Facebook AI研究院<Designing Network Design Spaces>的翻译与解读 导读: 卧槽 ...

  3. Paper之RegNet:《Designing Network Design Spaces》的翻译与解读—2020年3月30日来自Facebook AI研究院何恺明团队最新算法RegNet

    Paper之RegNet:<Designing Network Design Spaces>的翻译与解读-2020年3月30日来自Facebook AI研究院何恺明团队最新算法RegNet ...

  4. 再发力!Facebook AI何恺明等最新研究MoCo(动量对比学习)第二版,超越Hinton的SimCLR,刷新SOTA准确率...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! [导读]无监督学习再发力!Facebook AI 研究团队的陈鑫磊.樊昊棋.Ros ...

  5. 何恺明团队最新力作RegNet:超越EfficientNet,GPU上提速5倍,这是网络设计新范式 | CVPR 2020...

    鱼羊 十三 发自 凹非寺 量子位 报道 | 公众号 QbitAI 大神(组团)出奇招,踢馆各路神经网络. 还是熟悉的团队,还是熟悉的署名,Facebook AI实验室,推陈出新挑战新的网络设计范式. ...

  6. 何恺明团队最新研究:3D目标检测新框架VoteNet,两大数据集刷新最高精度

    [导读]FAIR何恺明等人团队提出3D目标检测新框架VoteNet,直接处理原始数据,不依赖任何2D检测器.该模型设计简单,模型紧凑,效率高,在两大真实3D扫描数据集上实现了最先进的3D检测精度. 当 ...

  7. 何恺明团队最新力作:超越EfficientNet,GPU上提速5倍|CVPR 2020

    2020-04-01 12:43:32 鱼羊 十三 发自 凹非寺 量子位 报道 | 公众号 QbitAI 大神(组团)出奇招,踢馆各路神经网络. 还是熟悉的团队,还是熟悉的署名,Facebook AI ...

  8. Facebook AI何恺明等最新研究MoCo(动量对比学习)第二版,超越Hinton的SimCLR,刷新SOTA准确率...

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :专知 AI博士笔记系列推荐 ...

  9. 何恺明团队最新力作SimSiam:消除表征学习“崩溃解”,探寻对比表达学习成功之根源...

    ↑ 点击蓝字 关注深度学习技术前沿 作者|Happy 编辑丨极市平台 导读 本文是FAIR的陈鑫磊&何恺明大神在无监督学习领域又一力作,提出了一种非常简单的表达学习机制用于避免表达学习中的&q ...

最新文章

  1. Hinton等大牛要来中国授课,首个AI人才国际培养计划在北大启动
  2. Python3.5+SQL+Prometheus+Grafana报表/监控
  3. MSU公布2019视频压缩评比报告客观部分
  4. 合理抽象灵活运用排列组合(洛谷P2181题题解,Java语言描述)
  5. pick王菊?作为“菊外人”的程序员能做点什么?
  6. CSAPP:第八章 异常控制流1
  7. (24)VHDL实现与或非(行为描述)
  8. Java面向对象㈡ -- 继承与多态
  9. 史上最简单的上传文件到linux系统方法
  10. Java 根据 Map 的 key 的 ASCII 码从小到大排序
  11. 魔物学院计算机,测试 | 你属于魔法学校什么学院的?
  12. Rockstar Games遭黑客攻击,《侠盗猎车手6》90个开发视频外泄
  13. LiveData vs EventBus?不,他们其实可以一起
  14. java任意音频格式转换MP3格式
  15. 基于神经网络的预测控制,神经网络预测系统应用
  16. FF-A架构中CA到TA的调用模型
  17. 3.3 WSN路由协议
  18. 3.1-图像分割引言
  19. 第7.21节 Python抽象类—register注册虚拟子类
  20. CSS 实现文本中间省略号

热门文章

  1. 【常用模块】ESP8266 WIFI串口通信模块使用详解(实例:附STM32详细代码)
  2. 红色极简风工作总结PPT模板
  3. 精挑细选的年度工作总结PPT模板
  4. 用Python实现多层感知器神经网络
  5. ad safe5.0.630.9901懂你版补丁包
  6. 建立一个网站需要哪些步骤?如何建立一个自己的网站?
  7. 手机视频怎么裁剪时长?教你三招快速搞定
  8. 【信息安全】-安全协议
  9. 高斯玻色采样enhance量子近似优化算法
  10. iPhone内置GPS芯片已经获得确认