编译整理 | 费棋

编辑 | 阿司匹林

出品 | AI科技大本营

Kaggle,这是个坐拥 100 万会员的数据建模和数据分析竞赛平台,目前已被 Google 收购。企业和研究者可在这个平台上发布数据,而统计学者和数据挖掘专家则可以进行竞赛以得到最好的模型。

最近,该平台再次成就了一位名叫 Mikel Bober-Irizar 的少年——刷新了他在 Competitions 中的排名,第 31 位,晋级为最高级的 Grandmaster(其他等级依次为 Masters, Experts, Contributors, Novices),达到这一级别的在全球范围内共有 122 人。更让人津津乐道的是,他是个年仅 17 岁的英国高中生。

去年 8 月,Mikel 就成为了 Kaggle 的 Competitions, Kernels 和 Discussion 三项排行榜中首位达到 Master 级别的会员,而且在 Kernels 和 Discussion 中的排名位列前 10 。

凭借其在 Kaggle 社区中的表现,Mikel 甚至成为了 AI 社区中一颗冉冉升起的新星。



在其主页上,他的简介是对机器学习、硬件、虚拟现实、网络和加密货币感兴趣,喜欢打破常规。

在过去几年里,Mikel 花了很多时间在互联网上研究在机器学习和人工智能方面的编程技能,几乎完全属于自学成才。

说起他怎么解决学习面临的困难,Mikel 称只通过 Google 搜索来尝试寻找解决问题的方案,即便网上有很多免费课程,但他也没有通过参加课程进行系统学习。当他在网上了解到 Kaggle 后,他想的是为什么不试试呢?

不过 Mikel 并没有将他全部精力投入到 Kaggle 上,他只将自己描述为“决策树拥抱者,喜欢数据,喜欢挑战。”

在比赛中“打怪升级”

短期内历经各种比赛的磨砺后,Mikel 在 Kaggle 中的排名越来越高。在 2016 年 11 月的博世生产线性能挑战赛中,他们的 4 人团队在 1373 支参赛队伍中排名第 5。他们通过使用生产线上 200 万件产品和 5000 个传感器的数据构建了一种算法,以预测博世工厂的产品中存在的故障。

他们的解决方案是使用复杂的特征工程来捕获高维度训练数据中的模式,并在大型的 XGBoost 模型集合中使用,最终获得了 0.51173 的分数。

而在 2016 年 7 月,他们的团队在 Avito 重复广告检测比赛中与 548 个团队竞争获得了第 2 名。他们尝试构建了一个模型,通过大规模执行文本挖掘和图像处理,可以准确地检测同一产品的重复广告。他们的模型还广泛使用深度神经网络和梯度增强来实现这一结果。最终,他们的模型得分为 95.3%,而 Avito 的内部基线为 90.4%。

2017 年,他帮助创建了一种使用计算机视觉技术分析 800 万个 YouTube 视频以创建准确标签的算法。他的队伍在 650 支队伍中排名第 7,这引起了 Google 的注意。

该项目的目标是使用 AI 和机器学习来扫描 YouTube 视频,并确定将标签放在对应的视频上。这是一个非常具有挑战性的计算机视觉技术问题,因为这需要了解视频和上下文中的内容以选择正确的标签。这种标记方式在照片上就很难(如 Google 和 Facebook 所做的那样),不过由于缺乏用来训练 AI 的公共数据集,视频面临的是一个更大的挑战。

Mikel 的团队则编写了自己的神经网络,通过已提供的一套训练视频来训练算法,然后可以应用在新视频上。当然,由于涉及到大量的计算(数据集本身有 8TB),这也算是他们遇到的一个挑战。

想从事 AI 行业

Mikel 很想继续从事人工智能行业,但他首先需要从高中毕业。不过,他在高中时期的实习履历,无疑会对他以后的发展大有裨益。

在 2016 年 9 月 – 2017 年 6 月 (10 个月),他被 Udacity 选中参加自动驾驶汽车车工程师 Nanodegree 的学员(11,000 名申请者中共有 500 名),并成为该课程的 5 名学生领袖之一。

2017 年 7 月 – 2017 年 7 月,参与了 Voyage 自动驾驶汽车中部署的各种硬件和软件项目。

2017 年 9 月 – 2018 年 7 月 (11 个月),担任 EduNow 这家创业公司的技术总监,从头开始帮助构建 EduNow 平台,专注于后端和服务器开发。

现在,Mikel 正在剑桥的三菱电机研究实验室进行为期三个月的实习,研究方向是图像合成和表示学习。

他的目标是考上麻省理工学院、加州大学伯克利分校或者剑桥大学。而且他有自知之明,尽管知道自己在 AI 研究中的天赋,但现在仍然有很多知识盲区。

“我不知道算法背后的数学知识,就实际使用它而言,我认为对它的运作方式找到一个合理的解释很重要。即使我不能从头开始写,也能知道它做了什么,这有助于我理解它可能存在的其他价值。”

相关链接:

https://mashable.com/2017/07/28/16-year-old-ai-genius/#QprEihGNliqL

https://www.linkedin.com/in/mikel-bober-irizar-a46b7230

——完——

招聘

AI科技大本营现招聘内容运营实习生,有意者请将简历投至:gulei@csdn.net,期待你的加入!


工作要求:

  • 熟练使用微信、今日头条等平台发布文章,并负责其他对外推广渠道的内容铺建,用户管理以及互动;

  • 追踪AI领域动态,协助AI内容生产;

  • 能保证每周三天的工作时间。

工作地点:

北京市朝阳区酒仙桥路10号院恒通商务园仙桥路10号院恒通商务园

AI科技大本营在线公开课第15期

机器学习专场

时间:9月6日 20:00-21:00

形式:线上直播+社群答疑

添加小助手微信csdnai,备注:机器学习

邀你加入课程交流群,即有机会获得定制T恤或者技术书籍

这个Kaggle三项排行榜的“顶级大师”,今年17岁相关推荐

  1. AI一分钟 | ​被大家吐槽的网红机器人索菲亚开微博了;阿里人工智能团队iDST获得道路场景分割三项第一

    一分钟AI 阿里正布局自动驾驶技术,道路场景分割获国际奖项,但阿里否认将进军自动驾驶业务,表示这项研究属于基础科学研究 小鹏汽车将在1月份完成新一轮融资,今年少量交车 通用汽车公司近日宣布,计划在20 ...

  2. 自然语言处理顶会COLING 2020最佳论文等三项大奖出炉 | AI日报

    自然语言处理顶会COLING 2020最佳论文等三项大奖出炉 12月8日至13日,第28届国际计算语言学会议(COLING 2020)在线上正式举行. 计算语言学国际会议COLING 2020(是计算 ...

  3. 2018云计算开源产业大会将发布四大报告、三项评估结果

    在2018年3月21日-22日召开的"2018云计算开源产业大会(全球云计算开源大会)"上,中国信息通信研究院将发布<中国私有云发展调查报告>.<中国云计算开源发 ...

  4. WMT 2022国际机器翻译大赛发榜,微信翻译斩获三项任务冠军

    近日,WMT 2022国际机器翻译大赛的榜单停止提交结果并发布排名.其中,微信翻译团队在对话翻译和生物医学领域翻译的激烈竞争中脱颖而出,斩获三项冠军,分别是对话翻译比赛的英德和德英翻译冠军,以及生物医 ...

  5. “铁人三项”运营、技术、资本无短板,BW期货交易平台要逆天爆发?

    前段时间"交易即挖矿"的交易所大乱战,算是给币圈所有人都上了生动的一课:追热点的交易平台是如何快速"倒闭"的. 有网友统计,能数得上号的"倒闭&quo ...

  6. 美通企业日报 | 亚马逊AWS三项举措推进量子计算技术;海航渝富重组西部航空...

    今日看点 亚马逊AWS宣布三项关键举措,作为公司推进量子计算技术计划的一部分:AWS 推出量子计算服务Amazon Braket,新推出的 Amazon Braket 服务让客户能够探索.评估和试验量 ...

  7. 国泰君安国际获《彭博商业周刊》颁发三项大奖

    香港--(美国商业资讯)--国泰君安国际控股有限公司(「国泰君安国际」.「公司」或「集团」,股份代号:1788.HK)欣然宣布,公司在<彭博商业周刊中文版>主办的「金融机构大奖2020」评 ...

  8. 浏览器安全检查己通过_百度主动推送三项合一功能

    百度主动推送三项合一功能 作者:68喜 功能模块:搜索关键词记录推送熊掌号当天推送+熊掌号历史推送+普通主动推送 */ //错误显示屏蔽 error_reporting(E_ERROR | E_WAR ...

  9. AI EARTH再立功,达摩院包揽遥感AI领域三项冠军

    人类赖以生存的地球表面积大约为5.1亿平方公里,而陆地面积仅占29.2%,这些土地历经数十亿年的演变及人类生活的改造,又被分割成耕地.森林.草地.水域及建筑等等,现在,AI正在成为管理陆地资源的新途径 ...

最新文章

  1. 翻转矩阵(数组右移问题)
  2. php多选框怎么传值,tp3.2如何处理多选框传参和判断状态
  3. shell中uniq与sort -u 两种去重的对别
  4. 搬家Testing.
  5. vs python opencv配置_python如何配置opencv
  6. 阿里mysql锁_【mysql】mysql中的锁机制
  7. 快速掌握用python写并行程序_自己python程序的并行修改
  8. 微信小程序弹出框详解
  9. 目标检测 SSD论文理解
  10. 电力系统潮流计算c语言程序,电力系统潮流计算C语言程序.doc
  11. 【Python】日期处理-中国法定节假日
  12. 计算机高配方案,电脑主机i5 9400F升10400/GTX1660Super高配吃鸡方案推荐
  13. C# 输入一个正整数N,判断N是奇数还是偶数,输出1~N的奇数和或是偶数和,三种不同方法分别实现
  14. 昆石VOS3000_2.1.6.0.0一键安装教程
  15. 用MySQL创建数据库和数据库表(linux终端操作)
  16. 当你面临选择,所谓经验可能一文不值
  17. vin端口是什么意思_振荡器基础1——为什么振荡器需要正反馈?什么是LC自激振荡器?...
  18. 计算机桌面屏幕怎么设置全屏,如何让电脑显示器屏幕显示全屏
  19. ROS软路由如何配置PPTP实现不同WIFI不同地址
  20. 西湖大学开学:新生每月5000元补助,AI博士研究永生课题

热门文章

  1. 威斯康星麦迪逊计算机专业排名,恭喜L同学获得威斯康星大学麦迪逊分校计算机专业(专业排名TOP10)EA录取...
  2. 中南大学计算机学硕毕业要求,中南大学研究生发表学术论文的规定
  3. 服务器里的文件怎么删除
  4. 编程之美---数字之魅
  5. C++每日一练:打家劫室(详解动态规划法)
  6. scrapy爬取知乎问题实战
  7. 微信小程序实现星星评分
  8. 树莓派3B+新麦克风调试
  9. 蓝牙耳机型号有哪些?口碑最好的蓝牙耳机
  10. 了解 Tornado 框架