补充推荐阅读:

1.『带你学AI』带你学AI与TensorFlow2实战之入门初探:如何速成深度学习开发

2.[深度应用]·首届中国心电智能大赛初赛开源Baseline(基于Keras val_acc: 0.88)

3.[深度应用]·DC竞赛轴承故障检测开源Baseline(基于Keras1D卷积 val_acc:0.99780)

4.笔者深度学公众号《极简AI》:

极简AI公众号

计算机视觉王者何凯明

2017年10月 22 日到10月29日,两年一度的计算机视觉国际顶级会议 International Conference on Computer Vision(ICCV 2017)在意大利威尼斯开幕。其中最佳论文和最佳学生论文奖,又被何凯明大神再度包揽!

这位为国争光的何凯明是谁?为何被通称为“大神”?

何凯明本人

沉稳的素质让他成为“别人家的孩子”

何凯明可谓是少年成名,因为他是万千学生和家长都曾“膜拜”的“别人家的孩子”——高考状元。

能从万千学子中脱颖而出,在2000年那个年代,并不完全是靠“比贫困地区更优异的教学质量和环境”,更多的是自身的努力。作为2003年广东省理科高考状元,何凯明的高考成就也许更多是因为他的沉稳耐心的性格。

少年时,何凯明没有把一切都抛弃而只顾高考,他年纪轻轻的时候就进入了少年宫学习,他选择了学习绘画。画画最需要耐得住性子,而何凯明却能一下午甚至大半天都坐在写生台前,慢慢画自己想画的。

何凯明学习文化课也和作画一般,非常耐得住。据他的班主任说,何凯明的成绩非常稳定,也很扎实,发挥非常的稳定。在中学读书期间就获得过全国物理竞赛和省化学竞赛的一等奖。

一路优秀的何凯明也走上了报送之路,在高考前,他就已经被确定报送清华大学。不过何凯明仍然参加了高考,凭着扎实的基础和稳定的发挥,何凯明的高考成绩比平时更出色,不仅超出了平时的水准,而且一举拿下了理科状元榜首!

原本何凯明报送清华大学是机械工程及其自动化专业,但凭实力进入清华的何凯明,又一次做出了不一般的选择,他选择了基础科学班。基础科学班是清华大学于1998年开始设立的为培养数学、物理等基础科学培养人才的尖子班,课程压力大,同时要学习数学系、物理系的大部分基础课程。

在大学期间,何凯明把沉稳发挥到了极致,专心于自己的学业,不仅在2003至2005年期间,连续三年都获得了奖学金,而且还有时间进入了微软亚洲研究院实习。

本科毕业后,何凯明继续精修,他选择了去香港中文大学攻读研究生,在这期间,他的第一篇论文,《Single ImageHaze Removalusing Dark Channel Prior》,被计算机视觉领域顶级会议CVPR接收并被评为年度最佳论文。同时,由于在微软亚洲研究院的研究工作,何凯明还获得了微软亚洲研究院的奖学金。

最佳论文得主

曾经的优等生做的研究“无一例外都没有成功”

然而,其实没有谁的成功是随随便便或者一帆风顺的。聪明如何凯明,也是如此。他虽然顶着高考状元的身份加入了清华大学,但是在专业学习上也不是“学神”似的随便两下就拿到奖学金。

更明显的是他在微软亚洲研究院的经历。由于兴趣,何凯明在微软亚洲实验室选择的是视觉计算组,这个给他带来了巨大的挑战。虽然他曾因为兴趣也在大学的时候选修过计算机图形图像的相关课程,然而,并不是科班出身的他,这些兴趣知识完全不足以应对在微软亚洲研究院的研究工作。

他曾经回忆起那段日子,这样表达当时的困扰:“在阅读文章的时候,我常常都不知道哪些是大家都在用的方法,哪些才是作者的贡献。对我来说,我看见的每一样东西都是新的。”

可想而知,他当时是什么懵逼状态。

可是,那又能怎么办呢?只能继续发挥稳定而刻苦的学习精神了。据悉,在其实习的头一年里,何恺明在导师孙剑的指导下,曾经做过些许不同的课题,但是无一例外都没有成功。

无一例外都没有成功,这对一个曾经的高考状元来说,得是多大的打击?

可是何凯明没有放弃,他除了发挥他的坚毅忍耐的学习精神,而且深深爱上了研究。这不,他和团队在2015年末举办的ImageNet图像识别大赛中,以“图像识别深度差残学习”系统傲立群雄。

后来,他还写了一篇让中国人为之骄傲的论文,他一篇关于图像去雾的论文,得到了三个审稿人最高的评分,同时恺明在迈阿密的演讲被观众认为是那届CVPR上最有趣的演讲。

这是中国人首次在CVPR获此殊荣,是华人的骄傲,而且人人都认为他这份Best Paper Award的奖项来得当之无愧。

然而,谁知道在论文写作的过程中,何凯明有多痛苦呢?他不仅经常和自己吵架,反复质问自己的观点是否正确,是否合理。好不容易说服了自己,还会遭到孙剑的再度质疑……

让何凯明出名的图像去雾研究

因为热爱,所以一次又一次选择走研究的路

这位大神其实与旷视科技Face++的还大有联系,他们曾经都是一个坑的战友,在微软亚洲研究院还是一个小组,他们还有共同的成绩:“残差网络”。对于这个成绩,孙剑在接受采访时,曾这样表示:

“要说一下做出这个残差网络完全是团队,何凯明、张祥雨、任少卿和我的集体智慧结晶,缺少任何一人都不敢说能走得到这一步,中间经历很多的失败和曲折。我深感能把我们 4 个不同技能的人凑在一起,打下一个「大怪兽」的幸运;和他们在一起忘我的研究过程是我研究生涯中最难忘的经历之一。”

与孙剑的选择不同,何凯明貌似还走得是那条学院路。并且,进一步地发扬光大。

他选择了去Facebook,担任其AI 实验室研究科学家,选择了进一步走学术之路。

在Facebook AI 实验室研究期间,何凯明仍然醉心于研究,而且颇有建树。

现在,他的最新研究成果MaskR-CNN公布,这是一个概念上简单,灵活,而且通用的对象实例分割框架,在 COCO 的实例分割,边界框对象检测,人物关键点检测 3个任务上均优于现有的单一模型。

除了图像去雾这个领域的成就,何凯明还在默默地继续耕耘。在今年的ICCV中,Facebook有15篇论文被收录,其中五分之一都有何恺明的名字,有多达三篇论文被收录。

何凯明和孙剑曾是伙伴

有人这样表示,同行的孙剑选择了加盟企业,而何凯明似乎还在不知人间疾苦地奋斗在研究领域,道不相同但同样的是为领域及行业所做的贡献。这个说话有理,孙剑那种是真正的博士,何凯明这样的博士也可以叫做真正的Doctor。

欢迎大家关注小宋公众号《极简AI》带你学深度学习:

基于深度学习的理论学习与应用开发技术分享,笔者会经常分享深度学习干货内容,大家在学习或者应用深度学习时,遇到什么问题也可以与我在上面交流知无不答。

出自CSDN博客专家&知乎深度学习专栏作家@小宋是呢

[深度大牛]·计算机视觉王者何凯明相关推荐

  1. 何凯明团队又出新论文!联合北大、上交用ViT做迁移学习,效果惊人!

    ‍ 转自:新智元 [导读]何凯明团队又发新论文了!这次他们研究的是如何将预训练好的ViT迁移到检测模型上,使标准ViT模型能够作为Mask R-CNN的骨干使用.结果表明,与有监督和先前的自我监督的预 ...

  2. 人工智能大神何凯明往事与风华岁月

    文章目录 快速认识大牛 少年英才 CVPR最佳论文展露头角,去雾算法扬名天下 残差网络轰动业界 何凯明和贾扬清 机器视觉三剑客:何凯明.孙剑与汤晓鸥 何凯明治学方法 研究成果与代表作 参考 快速认识大 ...

  3. 何凯明团队又出新论文!北大、上交校友教你用ViT做迁移学习

    视学算法报道   编辑:LRS 好困 小咸鱼 [新智元导读]何凯明团队又发新论文了!这次他们研究的是如何将预训练好的ViT迁移到检测模型上,使标准ViT模型能够作为Mask R-CNN的骨干使用.结果 ...

  4. 学习何凯明在图像中的降噪技术和识别率问题

    之前玩微信由于图像噪音干扰太高一直导致没法在工业是过渡,我是从从事交通大类的神经计算开发,这个转年几年过去我对算法其实很多还是不同,太零碎了.并且实际开发过程涉及对硬件的流处理器和存储单位的思考和分配 ...

  5. 深度学习计算机视觉常见的29道面试题及解析

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 作者丨我要鼓励娜扎@知乎 来源丨https://zhuanlan.zhihu.com/p/89 ...

  6. 深度学习计算机视觉发展简述

    深度学习计算机视觉发展简述   1995年诞生的LeNet5网络是最早的卷积神经网络之一,也是现在很多深度神经网络架构的起点.LeNet5利用卷积.参数共享.池化等操作提取图像特征,再利用全连接神经网 ...

  7. AI:一个20年程序猿的学习资料大全—人工智能之AI/机器学习/深度学习/计算机视觉/Matlab大赛——只有你不想要的,没有你找不到的

    AI:一个20年程序猿的学习资料大全-人工智能之AI/机器学习/深度学习/计算机视觉/Matlab大赛--只有你不想要的,没有你找不到的 目录 (有偿提供,替朋友转载,扫描下方二维码提问,或者向博主扫 ...

  8. 【百家稷学】深度学习计算机视觉生产实习(山西农业大学暑期实训)

    继续咱们百家稷学专题,本次是有三AI在山西农业大学开设的为期10天的正式暑期专业课程.百家稷学专题的目标,是走进100所高校和企业进行学习与分享. 本次主题 本次实训是在山西农业大学进行,主题是< ...

  9. 虎牙AI基础技术部招聘深度学习/计算机视觉实习生

    01 公司简介 虎牙公司是一家以游戏直播为核心业务.致力于打造全球领先直播平台的技术驱动型内容公司,旗下产品包括知名游戏直播平台虎牙直播.风靡东南亚和南美的游戏直播平台NimoTV等,产品覆盖PC.W ...

  10. 深度学习新王者AutoML和NAS

    一文看懂深度学习新王者「AutoML」:是什么.怎么用? 原文:https://zhuanlan.zhihu.com/p/42924585 原作:George Seif 夏乙 安妮 编译整理 量子位 ...

最新文章

  1. RNN神经网络的输入输出维度的关系
  2. BigDecimal divide方法结果为无限小数问题
  3. C++强制类型转换:static_cast、dynamic_cast、const_cast、reinterpret_cast
  4. 2015年第六届蓝桥杯 - 省赛 - C/C++大学B组 - C. 三羊献端
  5. 谁说docker-compose不能水平扩展容器、服务多实例?
  6. LeetCode 543. 二叉树的直径(DFS)
  7. 图片保存到数据库和从数据库读取图片并显示(C#)
  8. java软件工程师自我评价_java开发简历自我评价【java简历自我评价模板】
  9. 常用八大数据结构总结及应用场景-附示例截图
  10. android两边是椭圆的按钮,自定义Button形状(圆形、椭圆)
  11. linux pppd源码下载_linux pppd脚本配置
  12. PPT最强抠图技巧(收藏必备)
  13. DirectShow编程(3.5) - 关于DirectShow - DirectShow中的事件通告
  14. 【Cherno的OpenGL视频】Welcome to OpenGL
  15. 什么是基于web开发,CSS的浮动属性,干货满满!
  16. 潘石屹陈志武谈房地产:北京等城市泡沫已很严重(载自新浪)
  17. 一点透视,二点透视,三点透视的理解
  18. 来自 Google 的高可用架构理念与实践
  19. 阿里云安骑士和态势感知SAS有区别吗?
  20. win8专业版桌面ie图标不见了怎么恢复--win10专业版

热门文章

  1. android 毫秒值转换时分秒],毫秒数转换成天时分秒、时分秒
  2. 对皮尔逊相关系数进行假设检验
  3. 按键精灵手机版读取MYSQL_按键精灵手机版 如何连接远程网络数据库 进行读写操作...
  4. 计算机课ppt实验报告,ppt模板,实验报告
  5. java股票雪球数据接口_国内股票数据接口API(5分钟K线、日线)
  6. android 外卖源码,外卖人8.7源码外卖人订餐系统仿美团饿了么外卖安卓APP
  7. 当前企业最流行的三种软件开发模式
  8. 科技文献检索课题 计算机,科技文献检索完整作业
  9. ORACLE VARCHAR2和NVARCHAR2的区别
  10. 深入剖析锂电池保护电路的工作原理