根据科学研究,人类大脑皮层的70%活动都在处理视觉信息。如果人工智能赋予机器能够像人类一样思考、处理事情的能力,计算机视觉将承担巨大作用。作为一门研究如何使机器“看”的科学,计算机视觉已成为人工智能的重要分支,等同于人工智能的大门。

提到计算机视觉研究,就不得不提起近年来一个冉冉升起的“学术新星”——何恺明。从高考满分状元到“CVPR最佳论文奖”第一位华人得主,再到“深度残差网络”在ImageNet比赛中击败谷歌等公司夺得第一……“80后”的他早已众多光环加身。在学界,他被视为天才少年,也被称为“大神”,不断地为学界提供着诸多有分量的研究成果。

何恺明

从小就成为“别人家的孩子”

用“年少成名”形容何恺明一点不为过,因为他曾是万千学生和家长都膜拜的对象——高考状元。

出生于广州的何恺明是家中独子,父母均在企业里从事管理工作,从小就接触到优良的教学环境。实际上,能从众多学子中脱颖而出,除了教学环境之外,更多的是靠自己的努力。

何恺明年少时就被送到少年宫学习绘画,有时一待就是大半天,这也不断使他练就出沉稳的性格。同绘画一样,他对于文化课的钻研也十分耐得住性子,学习成绩优秀而且稳定。在老师的心目中,他是一个“性格比较内向”但是“目标明确”的学生,“从小就立志上清华”。

高中时,何恺明凭借全国物理竞赛一等奖被保送进清华大学机械工程及其自动化专业。不过,他却依然选择继续参加考试,并凭借着扎实的基本功和轻松的心态一举成为2003年的广东省高考状元。

凭实力进入清华的何恺明,放弃了原本保送的专业,转而选择了更有挑战性的基础科学班。成立于1998年的基础科学班是清华大学设立的一个跨系跨学科的尖子班,本科学生不仅要学习物理系、数学系的大部分基础课程,还要接受一定的科学研究的实际训练。

大学期间,何恺明继续着自己沉稳而优秀的表现,不仅连续3年获得清华奖学金,2007年,还未毕业的他就进入了微软亚洲研究院(MSRA)实习。

何恺明和导师汤晓鸥

本科毕业后,他进入香港中文大学攻读研究生,师从AI名人汤晓鸥。同时继续参与MSRA的工作。2009年,他的第一篇论文“Single ImageHaze Removalusing Dark Channel Prior”被计算机视觉领域顶级会议CVPR接收并被评为年度最佳论文,这是CVPR创办25年来华人学者第一次获此殊荣,也使何恺明在CV领域声名鹊起。

受游戏启发的CVPR最佳论文

然而,彼时刚刚涉足CV领域的何恺明,却并非一帆风顺。

在MSRA实习时,他并未选择自己擅长的物理和数学工作组,而是根据自己的研究兴趣选择了形象计算组。尽管他曾在大学的时候选修过计算机图形图像的相关课程,但是并非科班出身的他,兴趣也难以支撑工作的需要。

背景知识的缺乏使他在入门的路上举步维艰。回忆起那段时光,何恺明曾表示,自己在阅读文章的时候,常常都不知道哪些是大家都在用的方法,哪些才是作者的贡献。一切对他来说都是新的。

尽管有导师孙剑这样的学术大牛带着他进行课题研究,自身稳定而刻苦的品格也推动着他不断挑战困难,但在换过多次课题后,全部都以失败告终。

虽然结果对何恺明来说是残酷的,但是他也从中学习到了很多,尤其是多个研究课题的经历使他尝试了许多不同的方向,而MSRA轻松自由的研究方向也为他日后的科研奠定了牢固的基础。

其中,何恺明花了大量时间研究的image matting问题 (半透明物体边界提取),就为他日后研究的“去雾算法”带来很大帮助。在刚开始研究去雾的时候,何恺明发现雾的方程和matting的方程非常相似,而之前所研究的matting框架可以给去雾带来帮助。利用这个框架,只需要找到一个能局部估算雾的浓度的方法就足够了。

他在2009年获“CVPR最佳论文奖”的那篇论文,研究的正是图像的去雾技术,它可以还原图像的颜色和能见度,同时也能利用雾的浓度来估计物体的距离,这些在计算机视觉上都有重要应用(例如三维重建,物体识别)。

北京灰霾照片的去雾结果

难以想象的是,他最初对去雾研究的灵感竟是来源于电脑游戏。何恺明发现,3D游戏里有很多带有雾的场景,但这些场景都是虚构的不实在的东西。计算机生成的3D图像会与自然图像的统计规律有很大区别,但人的视觉系统却仍然能感觉到虚拟图像中存在的雾。这让他相信,人的视觉系统一定有一种有效的机制来感知有雾的图像,而且这种机制一定与现存的去雾方法不一样。

根据何恺明算法处理的图像,上为原图下为处理后

与之前的方法不同,何恺明把注意力放到了无雾图像的统计特征上。在无雾图像中,每一个局部区域都很有可能会有阴影,或者是纯颜色的东西,又或者是黑色的东西。因此,每一个局部区域都很有可能有至少一个颜色通道会有很低的值。他把这个统计规律叫做Dark Channel Prior。

即使有了想法和实验结果,第一次写文章也使何恺明觉得非常困难。他经常陷入自己和自己吵架的角色当中。在每一段话写好之后,常常会质问自己事情到底是不是这样的,这其中有没有漏洞。他也会思考,如果自己是评委,或者是读者,能看懂这篇文章吗,怎么写才能让思路更加流畅?

就在这样的挣扎中,何恺明的一稿通常要写好几天。每当他把自己说服了,孙剑还是总能提出新的质疑。就在这样的循环中,终于有一天孙剑说文章已经写得不错了,他才开始具体的修改。正是这样的苛刻要求,才会有后来高质量的文章。

因为热爱,所以一次又一次选择走研究的路

2011年,博士毕业的何恺明正式加入MSRA计算机视觉和深度学习的研究工作。在2015年的ImageNet图像识别大赛中,何恺明和他的团队凭借152层深度残差网络ResNet-152,击败谷歌、英特尔、高通等业界团队,荣获第一。目前ResNets也已经成为计算机视觉领域的流行架构,同时也被用于机器翻译、语音合成、语音识别和AlphaGo的研发上。

2016年,何恺明凭借ResNets论文再次获得CVPR最佳论文奖,也是目前少有的一人两次获得CVPR最佳论文奖的学者。

后来,何恺明和孙剑相继离开MSRA。与孙剑的选择不同,何凯明走得还是那条学院路。他选择了去Facebook,担任其人工智能实验室研究科学家,选择了进一步走学术之路。

在Facebook AI实验室研究期间,何凯明仍然醉心于研究,而且颇有建树。2017年3月,何恺明和同事公布了其最新的研究Mask R-CNN,提出了一个概念上简单、灵活和通用的用于目标实例分割(object instance segmentation)框架,能够有效地检测图像中的目标,同时还能为每个实例生成一个高质量的分割掩码。同年,凭借《利用焦点损失提升物体检测效果》这篇论文,他一举夺下了另一个计算机视觉顶级会议ICCV最佳论文奖。

ICCV 2017最佳论文

2018年,何恺明在美国盐湖城召开的CVPR上,获得了PAMI青年研究者奖。几个月前,何恺明等人发表论文称,ImageNet预训练却并非必须。何恺明和其同事使用随机初始化的模型,不借助外部数据就取得了不逊于COCO 2017冠军的结果,再次引发业内关注。

无论是在MSRA还是在FAIR,何恺明始终以他沉稳而优秀的表现,一路过关斩将,为学术界带来许多重磅的研究成果。有人曾表示,孙剑选择加盟企业,而何恺明似乎还在不知人间疾苦地奋斗在研究领域,但是虽然道不同,最终为行业所做贡献却是相同的。

天才少年何恺明:高考状元的开挂人生相关推荐

  1. “2018中国AI英雄风云榜”年度人物榜:“AI天才”何恺明

    编者按:2018年12月28日,由网易智能.清华大学数据科学研究院和24家评审机构共同评出的"2018中国AI英雄风云榜"年度人物榜单揭晓,10位人工智能领域的从业者获奖.其中,何 ...

  2. 牛!何恺明包揽2项ICCV 2017最佳论文奖!这位高考状元告诉你什么是开挂的人生

    大神终究是大神! 刚刚,AI 科技大本营获悉,继两次荣获 CVPR 最佳论文奖之后,何恺明参与的两篇最新论文又分别摘下 ICCV 2017 的最佳论文奖(Best Paper Award)和最佳学生论 ...

  3. 何恺明:从高考状元到CV领域年轻翘楚,靠“去雾算法”成为“CVPR最佳论文”首位华人得主...

    (给机器学习算法与Python学习加星标,提升AI技能) 本文转载自:德先生 根据科学研究,人类大脑皮层的70%活动都在处理视觉信息.如果人工智能赋予机器能够像人类一样思考.处理事情的能力,计算机视觉 ...

  4. 十年AI谁“最能打”?AI 2000榜单:何恺明最佳论文“刷”状元,谷歌机构排名第一...

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者丨维克多 来源丨AI科技评论 编辑丨极市平台 导读 今日,清华大 ...

  5. best,best,best ......何恺明开挂之路

    荣誉 别人的荣誉都是在某某大厂工作,拿过什么大奖,而何恺明的荣誉是best,best,best ......,裂开了 研究兴趣 据我观察,何恺明的研究兴趣大致分成这么几个阶段: 传统视觉时代:Haze ...

  6. 何恺明!再斩ICCV 2017最佳论文

    夏乙 若朴 发自 凹非寺 量子位 出品 | 公众号 QbitAI 何恺明第三次斩获顶会最佳论文! 昨天下午,ICCV 2017最佳论文公布. 何恺明为一作的Mask R-CNN论文,不负众望获得最佳论 ...

  7. 何恺明时隔2年再发一作论文:为视觉大模型开路,“CVPR 2022最佳论文候选预定”...

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 杨净 明敏 雷刚 发自 凹非寺 量子位 报道 | 公众号 QbitA ...

  8. 何恺明、陈鑫磊新研究:提出实例分割新方法,效果比肩Mask R-CNN

    https://www.toutiao.com/a6674769574212141579/ 何恺明大神的团队又有新研究了! 这一次,Facebook的陈鑫磊.何恺明等人,又从全新的角度,再次解决了实例 ...

  9. 清华姚班2019级新生来了:高考状元、奥赛金牌,也是一批被AI感召的00后

    乾明 边策 发自 凹非寺  量子位 报道 | 公众号 QbitAI 清华姚班,又纳一批少年英才. 据已公开信息,今年姚班今年已录取24名奥赛金牌得主,以及3省理科状元. 按照入学年龄计算,基本上都是0 ...

最新文章

  1. 廖雪峰JS教程学习记录---字符串
  2. 《互联网运营智慧》十一月进展
  3. Spring Boot2.x-10 基于Spring Boot 2.1.2 + Mybatis 2.0.0实现多数据源,支持事务
  4. BUUCTF--[VN2020 公开赛]拉胯的三条命令
  5. 【转】dicom网络通讯入门(3)
  6. 数据结构之图:有向图的介绍与实现,Python代码实现——25
  7. 收藏! | 入门必读:计算机视觉四大基本任务(分类、定位、检测、分割)
  8. 应用安全 - 代码审计 - Python
  9. AS3组件之Slider滑块拖动条
  10. 将C#的Dic转成Lua的Table将C#的List转成Lua的Table
  11. java 支付宝帐单_支付宝单笔提现转账到个人用户,java代码实现
  12. 射频可编程数字信号发生器的三大特点
  13. 天使投资、风险投资VC、私募基金PE 与“A轮、B轮、C轮融资”的关系
  14. 分析2440开发板和4412开发板的性价比_初学者你们怎么看?
  15. CTF---Web---SQL注入---10---get传参的删减
  16. 怎么查看linux系统下数据库的进程数,如何查看sybase数据库运行情况
  17. 【华为认证】HCIP 数通笔记—BGP路由反射器
  18. 国内疫情反反复复,线下实体店的如何转型才能突破困境?
  19. 如何零基础学习解析几何
  20. APK改之理 手游修改改编安卓程序工具安装使用教程

热门文章

  1. OOD沉思录 --- 类和对象的关系 --- 使用关系
  2. [杂笔]我的第一篇博客
  3. 利用Python3内置文档资源高效学习及官方中文文档
  4. 往hdfs写数据无权限
  5. Linux监控平台 zabbix介绍和安装
  6. 前端开发实习生的第一天
  7. 【浸入式英文学习方式】山姆莱萌帮助孩子建立扎实语言功底
  8. [原创]教你如何最快写出酷炫的dialog对话框
  9. Aop事务小结(事务管理器和自身构建)
  10. Node.js技术手册