点击上方“公众号”可以订阅哦

2017年数据挖掘领域最有影响力的赛事KDD Cup近日揭晓,Convolution队从全球70个国家的3582支队伍里脱颖而出,包揽两项任务的冠军。这支双料冠军队成员名单里,有一个我们熟悉的名字——美团点评高级技术专家燕鹏。

说燕鹏可能大家并不一定知道,但提起燕鹏的网名Eureka,玩算法竞赛的同学一定不会陌生。是的,燕同学就是在世界最大的算法竞赛平台Kaggle总排名第5的Eureka,目前在所有中国同学里排名最高,历史总成绩是16金13银3铜。

现在,就让我们一起来认识一下这位身边的大神吧。

Hi燕鹏,先简单介绍一下自己。

燕鹏,2002年清华硕士毕业,主要做模式识别。2002-2005在创业公司做计算机视觉相关工作,2005-2008年自己创业,2008-2016年在网易做广告相关的事情。2016年4月来到美团,主要负责酒旅排序的工作,现在到了金融服务平台,做机器学习相关的工作。

这几份工作都和数据挖掘专业相关,都是用机器学习来解决不同的问题,前期主要偏向图像,后期偏向数据相关。

那说说你的KDD Cup经历吧。

这个大赛在圈子里还是很有名的,20年悠久历史了。

算上这次我已经参加三次了。

第一次是2015年,当时我是队长,和7个不同国家(小编查了一下有美国日本韩国奥地利新加坡……)的人加上另外一个清华的同学,我们9个人组了队伍。队名就叫InterContinental Ensemble(洲际天团)哈哈。

大家在各个国家,用Skype,然后不同的时差,最后在一个时间点上等待着最终成绩的发布,最后我们第一名,这个让我印象很深刻。

等待成绩的时候一开始很忐忑,因为并不知道自己第几名。我们前几名的差距非常非常小,谁都可能是第一名,所以当时知道自己是第一名的时候,我们几个都炸掉了!

所以你已经拿过一次冠军了啊。


是啊。其实这次你们要是不说,也就过去了。这次我不是队长,只是队里的老大哥。

那第二次呢?好像没成绩?

2016年第二次也做完了,但由于算错了时差,答案提交得较晚,错过了获奖机会。

说说这次冠军之路吧。    

说实话,第一次赢了之后还是很高兴的。这次就没有那么强感觉了。相当于找人打了一局王者荣耀,赢了也没有值得炫耀的事情,输了也就输了。

另外第一次的前几名都是外国人,这一次比赛多是中国人,基本也没什么好说的。

还是说说细节和感受吧。(小编心理活动:不然我怎么写稿子啊)

今年组队的同学里,有两个微软的(胡可和黄攀),一个是北航的研究生(陈欢),其中微软的小伙子是队长。我们线下认识,就商量说一起玩一下吧。我们几个人都有Kaggle比赛的冠军经验,所以实力还是很强的。

我是抱着玩儿的心态去的,他们比我更想赢,毕竟还没有赢过嘛。很多玩数据挖掘的人,都想赢一次KDD,它是一个相对于知名度较高的比赛,夸张的说,这个比赛是这个圈子里的奥林匹克。

本次大赛的题目,还是有一定挑战性的。具体可以看胡可的分享。

(小编从胡可分享Slides里找到这幅图)

这次数据比较少,意味着你的方法结果会不稳定,这种不稳定会意味着最后要靠一些运气来争夺输赢。应该是实力+运气的组合,这两个的组合不太好量化,其实很多比赛到了最后比1、2、3名的时候,都会靠一点点运气。曾经我有一次比赛,在十万分位的比别人高一点点,赢了。

你们几个人是怎么合作的?


我们会先从自己的技术积累出发,充分讨论技术点和可能的方案。然后自由探索,分别给出自己的解决思路。这样做的好处是,不会一上来就把思路限制住。最后再进行充分融合。

你觉得在KDD这种比赛取得好成绩,需要哪些能力和素质?

首先数学得好。

第二是实践实践实践。经验很重要,用数据挖掘、机器学习的方法来解决各种各样的问题的经验。多做,多用机器学习解决各种各样的问题,那么你再来一个新问题,哪怕是以前都没有从来没有做过的问题,可能都会做得出来。

在这个比赛之前,我也参加过各种各样的比赛,一方面是看时间,一方面是看问题。我以前喜欢做我擅长的,如广告,后来就越来越杂,比如这次的是交通的问题,我也做过金融、教育、医疗的问题。这个就是兴趣,你可能看到一个新的东西,你就会要解决他,觉得这个还挺高兴的。

除了数学好,对数据得敏感,这个不知道怎么更好的描述,有些人先天看到数据就会很感兴趣,就会找到规律,我们经常会用数据来说明情况。

你是怎么加入美团点评的?


噢,原来的公司搬家了,搬远了。我家就在望京,美团点评离家很近,就来了。(小编心理活动:能不能别尽说大实话啊。)

那来了美团点评以后感觉怎么样?

各方面都挺好的,对公司很满意。Leader对我很信任,能给我一些空间,让我做一些探索性的事情。

对从事算法工作的同学,有什么建议?


我一直的观点,paper+方法都要有。

机器学习发展的速度非常快,从事算法的同学应该更多的去follow学术界和工业界的最新研究成果,想办法把这些研究成果运用到自己的工作中去。

另外,我觉得搞数据挖掘的同学可以多参加KDD这样的比赛,这是一个不错的学习的方式。大家从论文能学到东西,确实有很多新的方法,但是这种比赛里面会有很多技巧性的东西,这种技巧性的东西往往可能不是特别的深奥,写不出paper来,但也是非常有用的。

所以这两者不会重叠,会有一些互补。

最后一个问题,有什么优秀的学习资料可以推荐给大家?

我推荐《The Elements of Statistical Learning》,比较难,但我非常喜欢。

初级一点的同学,可以去学台大林轩田教授的机器学习课程。

低调,实在,但其实挺牛挺靠谱的。嗯,这就是我们美团点评技术团队。

(我们正在整理KDD Cup 2017冠军队的经验分享资料,也会在这里发表,敬请期待。)

【人物志】KDD Cup 2017双料冠军燕鹏相关推荐

  1. 人物志 | KDD Cup 2017双料冠军燕鹏

    2017年数据挖掘领域最有影响力的赛事KDD Cup近日揭晓,Convolution队从全球70个国家的3582支队伍里脱颖而出,包揽两项任务的冠军.这支双料冠军队成员名单里,有一个我们熟悉的名字-- ...

  2. KDD CUP 2017 回顾总结

    KDD CUP 2017 总结 @QQ:609659119 @https://blog.csdn.net/xiaopc3357/article/details/81062434 一. 任务:分为两个 ...

  3. 人物志 | MIT科技创新“远见者”:美团NLP负责人王仲远

    总第331篇 2019年 第009篇 2019 年 1 月 21 日,<麻省理工科技评论>发布了 2018 年"35 岁以下科技创新 35 人"(35 Innovato ...

  4. (干货)各大AI竞赛 Top 解决方案开源汇总+大牛经验(Kaggle,Ali,Tencent、JD、KDD Cup...)

    各大AI竞赛 Top 解决方案开源汇总 现在,越来越多的企业.高校以及学术组织机构通过举办各种类型的数据竞赛来「物色」数据科学领域的优秀人才,并借此激励他们为某一数据领域或应用场景找到具有突破性意义的 ...

  5. (干货转)各大AI竞赛 Top 解决方案开源汇总+大牛经验(Kaggle,Ali,Tencent、JD、KDD Cup...)

    各大AI竞赛 Top 解决方案开源汇总 现在,越来越多的企业.高校以及学术组织机构通过举办各种类型的数据竞赛来「物色」数据科学领域的优秀人才,并借此激励他们为某一数据领域或应用场景找到具有突破性意义的 ...

  6. 中国今年包揽前三,KDD Cup 20年全回顾

    雷锋网 AI 科技评论按:从1997年至今,KDD Cup已有二十年历史.日前,第23届KDD大会在加拿大召开,会上,KDD Cup2017优胜者将进行成果展示. 2017年8月13-17日,第23届 ...

  7. 1997-2007,KDD CUP的二十年

    2017年8月13-17日,第23届KDD大会在加拿大哈利法克斯召开.KDD CUP是ACM SIGKDD组织的有关数据挖掘和知识发现领域的年度赛事,作为KDD年会的重要组成部分,从1997年至今,已 ...

  8. KDD Cup 2019 AutoML Track冠军深兰科技DeepBlueAI团队技术分享 | 开源代码

    作者丨罗志鹏 单位丨深兰北京AI研发中心 近日,KDD Cup 2019 AutoML Track 比赛结果出炉,本次赛题是第五次 AutoML 挑战赛,由第四范式.ChaLearn 和微软联合举办, ...

  9. KDD Cup 2020 Debiasing比赛冠军技术方案及在美团广告的实践

    ACM SIGKDD (国际数据挖掘与知识发现大会,简称 KDD)是数据挖掘领域的国际顶级会议. 美团到店广告平台搜索广告算法团队基于自身的业务场景,一直在不断进行前沿技术的深入优化与算法创新.团队的 ...

最新文章

  1. (一)Android Studio 安装部署 华丽躲坑
  2. 跟无闻学习GO Web 编程(四) -- bee 工具使用
  3. 更加优雅的iOS自动布局
  4. OpenResty 通过二级域名做跳转
  5. ES6-10 super、4种遍历方式、原型、symbol遍历
  6. Linux执行定时任务(crontab)遇到的坑
  7. c++ 走向高级之日积月累
  8. spss 卡方检验_SPSS篇—卡方检验
  9. abaqus推荐用哪一版本的_微信拍一拍怎么用? 微信拍一拍功能在哪怎么拍别人...
  10. VC静态加载DLL和动态加载DLL
  11. WAV音频文件格式介绍
  12. spotify电脑下载歌曲_Spotify教程
  13. 天气预报查询数据接口、实时天气、未来24小时、7天/15天预报
  14. mysql数据库重新命名
  15. excel跨多个表格求和_收藏学习!一个Excel函数搞定进销存报表,你还在花钱买软件?...
  16. PHP通过地址获取经纬度
  17. 微软产品关于首字母大写的解决方案
  18. pycharm打包程序
  19. java设计九宫格拼图软件哪个好用_抖音超火的朋友圈九宫格用什么软件做的? 抖音九宫格图片制作教程...
  20. 已知a和b的最大公因数和最小公倍数求这两个数字

热门文章

  1. 卡尔曼滤波与组合导航原理_基于RAEKF的GPS/INS紧组合导航方法研究
  2. 学生小白怎样搭建个人网站?
  3. 面向对象编程、面向服务架构、基于组件开发三种编程模式的区别和适用领域
  4. Revit模型数据优化方法
  5. 硬件nat关闭还是开启_SSD4K对齐了,但是速度还是很慢怎么办?我的主板是华硕990FX,AHIC也开了,检测也通过了,-小派4K...
  6. JAVA心理咨询系统源码-大学生心理咨询系统java-心理咨询诊断系统java-基于SpringBoot的心理咨询平台
  7. SketchUp:SketchUp草图大师软件简介、安装、使用方法之详细攻略
  8. vcruntime140.dll文件丢失的解决方法
  9. CSS中的字体与排版
  10. 如何提高App Store审核通过率