大v:JII00321

我们从下面5个方面系统聊聊:1)Kaggle是个什么东东?2)什么人会使用Kaggle?3)在Kaggle上做项目对你找工作有什么用?4)零基础如何入门Kaggle?(具体聊聊在做kaggle项目的时候遇到哪些问题,问题出现的时候我是如何思考的?最后又是如何解决的?)5)一个入门的例子:手把手教会你入门Kaggle

1.Kaggle是什么?
Kaggle 是一个流行的数据科学竞赛平台。由 Goldbloom 和 Ben Hamner 创建于 2010 年(官网地址:Your Home for Data Science)。为什么这两个家伙要创立这样一个平台呢?

数据科学社区一直有这样一个难题:对于同一个问题,可以有多个模型来解决,但是研究者不可能在一开始就了解哪些模型是最好的。
Kaggle就是为了解决这样的问题诞生的,它试图通过众包的形式来解决这一难题。纳尼,数据科学还能众包,那啥是众包呢?

众包是一对多的关系,假如猴子我有一个问题,我可以把这个问题发布到网站上,然后很多人看到了这个问题,其中有10个人给出了这个问题的答案,这样我就有10个答案了 (对应机器学习中的模型)。我选出排名前3的答案,拿出100万奖励这3个人。现在的猪八戒网站,滴滴打车,知乎本质上都是众包模式。(知乎的点赞模式其实就是一种奖励:社交认同感)
扯远了,回到Kaggle上来。在这个平台上,企业和研究者可在其上发布数据和问题,并提供奖金给能解决问题的人。多个数据分析相关的能人志士在其上进行竞赛以产生最好的模型来解决问题。进而使数据科学成为一场运动。
这就好比,金庸小说里的华山论剑,吸引了江湖各大有武功的人前来。同样的,Kaggle就是数据科学领域的“华山论剑”,吸引了来自数据分析,机器学习,深度学习等领域的人。
Kaggle 官方表示,该社区目前在全世界范围内有超过 85 万的数据科学家用户。2017年3月谷歌收购了Kaggle。谷歌云机器学习与人工智能首席科学家李飞飞说:人工智能的发展需要数据民主化以及越来越多的数据和模型,这是我们对 Kaggle 高度重视及收购的原因。

2.什么人会使用Kaggle?
参赛者主要分为下面两种:
1)一种是以奖金和排名为目的,包括靠奖金为生的职业Kaggler。这些人有丰富的数据分析,机器学习工作经验的业内人士。
2)一种就是以提升相关技能和背景为目的业余爱好者甚至在校学生了。这类型人有一定技术能力,但经验欠缺,是想从中进行学习和锻炼的“长江后浪”。3.在Kaggle上做项目对你找工作有什么用?1)用Kaggle项目经验弥补你没有工作经验的不足
之前有很多转行数据分析的朋友经常问的一个问题是:猴哥,我是转行,没做过相关的项目啊,根本没有经验,怎么整?
其实公司看你的项目经验,并不是说你要工作过,而是想通过你做的具体事情来了解,你是否有某方面的能力。
让别人知道你能力的最好办法不是你说了什么,而是你做了什么。各位老铁,感谢互联网时代吧,你做了什么是可以借助互联网留下痕迹。
所以解决办法很简单,把Kaggle上的项目经验写在你的简历上可以很直观的展现自己的能力,同时作为你的项目经验。2)Kaggle的Profile是你能力的证明
Kaggle竞赛另一个有趣的地方在于每个人都有自己的Profile(个人资料),上面会显示所有你自己参与过的项目、活跃度、实时排位、历史最佳排位等,看上去非常有成就感。

同时,Kaggle作为数据科学业内享有盛名的平台,在业界拥有极高的认可度。所以如果你是想寻找相关行业的工作,当你把这个Kaggle Profile的地址放到你的求职简历里,会被优先录取。
正如有个创始人招聘这么说过:写上参加过Kaggle比赛,我会看简历。得过一次10%,我会给电话面试。得过2次或者以上10%,我会给on site面试。得过一次前10,我们会谈笑风生。(在 Kaggle 上一次比赛的结果除了排名以外,还会显示三挡: Prize Winner,10% , 25% 。所以刚刚接触 Kaggle 的人很多都会以 25% 或是 10% 为目标。)
现在你已经知道在Kaggle上做项目对你人生的重要意义了。那么接下来的问题就来了。4.零基础如何入门Kaggle?4.1掌握一门数据分析语言
Python和R都可以,如果是新手,建议从Python开始,不知道如何开始的,可以看这个教程:数据分析入门(Python) | 猴子社群第2期闯关游戏怎么玩?4.2 从练习项目开始
Kaggle上的项目竞赛分成下面4个最常见的类别
1)Featured:这些通常是由公司、组织甚至政府赞助的,奖金池最大。
2)Research:这些是研究方向的竞赛,只有很少或没有奖金。它们也有非传统的提交流程。
3)Recruitment:这些是由想要招聘数据科学家的公司赞助的。目前仍然相对少见。
4)Getting Started(练习项目):这些竞赛的结构和 Featured 竞赛类似,但没有奖金。它们有更简单的数据集、大量教程。
如果你从未独立做过一个数据分析相关的项目,就从Getting Started(练习项目)开始入门。练习项目不仅难度低,并且还有很多社区创造的教程,你可以用来对比改善自己的测试结果,从中进行提高。比如经典的泰坦尼克号项目

4.3 我的排名低,怎么办?
有些初学者担心低排名出现在他们的个人资料(Profile)中,结果一直没有开始。但是,排名低真的没什么关系,重要是的你已经开始有做数据分析、机器学习相关的能力。没人会因此贬低你,因为每个人在一开始都是初学者。
罗马不是一天建成的,你可以按下面这个过程不断学习新的知识,循序渐进的提高排名:
第1步:先提交一个最基本的解决方案,熟悉基本的流程
第2步:学习新知识,优化方案进入排名前 50%
第3步:继续学习新知识,优化方案进入排名前 25%
第4步:继续学习新知识,优化方案进入排名前 10%5.一个入门的例子:手把手教会你入门Kaggle5.1第一步当然是注册一个Kaggle账号
按下图步骤操作即可

注册后会收到一封确认邮件,如果没有收到看看垃圾邮箱中有没有,我的就被放到垃圾邮箱中了。5.2 为了给大家说明如何入门一个kaggle项目,大v:JII00321

kaggle账号_kaggle是什么?对找工作的帮助!如何入门kaggle?相关推荐

  1. kaggle账号_Kaggle 数据挖掘比赛经验分享

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 腾讯广告算法大赛 作者 | 陈成龙 Kaggle 于 2010 年创立,专注数据科学,机器学 ...

  2. 30岁自学python找工作-30岁新手入门python!尝试人生另一种可能

    上篇笔记之后,很多人私信我有关学习提高的一些方法和资料.今天先来认真讲一下python入门[询问度最高] • �心态调整,我最想说的话: 1. 不要神化编程,觉得它是一个遥不可及的事情.其实编程.英语 ...

  3. 为什么Kaggle对找工作有帮助?如何入门?没有项目经验怎么办?

    目录: 一:Kaggle是什么? 二:什么人会使用Kaggle?参赛者主要分为下面两种 1.一种是以奖金和排名为目的,包括靠奖金为生的职业Kaggler 2.一种就是以提升相关技能和背景为目的业余爱好 ...

  4. 励志:他读书时挣了五十万,找工作时收获阿里腾讯快手等ssp offer

    公子龙是我的好朋友,他之前在中科院获取了计算机硕士学位,现在是一名大厂的算法工程师.大多数人的学生生活,是在枯燥的课程和任务中度过的,但他却有所不同,乐于折腾,收获了不一样的精彩.他喜欢去公司实习,创 ...

  5. 他读书时挣了五十万,找工作时收获阿里腾讯快手等ssp offer

    今天介绍一位dalao,他之前在中科院获取了计算机硕士学位,现在是一名大厂的算法工程师.大多数人的学生生活,是在枯燥的课程和任务中度过的,但他却有所不同,乐于折腾,收获了不一样的精彩.他喜欢去公司实习 ...

  6. 深度学习框架排行榜:找工作学TensorFlow,PyTorch搜索量逼近Keras

    深度栗 编译整理 量子位 报道 | 公众号 QbitAI 深度学习的世界,风云变幻. 五年前,还是Theano称霸的天下,如今完全不一样的了. 所以,一个叫Jeff Hale的数据科学家,想全方位观察 ...

  7. 找工作面试会遇到哪些坑(校招篇)

    前言 我在JD工作已经有四个多月了,加班一直都比较多,不是因为工作量太大,而是因为自己不会的东西太多.电商行业的确是一个很锻炼人的地方. 2018年4月份,我写的那篇文章<裸辞两个月,海投一个月 ...

  8. 什么是 Python ?聊一聊Python程序员找工作的六大技巧

    最近我一直在思考换工作的事情.因此,这段时间我会看一些题目,看一些与面试相关的内容,以便更好地准备面试.我认为无论你处于什么阶段,面试中都会有技术面试环节.无论是初级职位还是高级职位,都需要通过技术面 ...

  9. 春招大厂上岸学长带你有效春招找工作

    秋招差不多结束有一段时间了,陆陆续续还有一些公司在进行补招,在过去的三个月当中许多同学收获了比较满意的工作,也有同学收获甚微,甚至颗粒无收.不过没关系,只要还没毕业,大家还有机会争取到更好的工作机会, ...

最新文章

  1. 利用fnd_conc_global.set_req_globals设置子请求的Parent Request ID
  2. Linux上搭建Hadoop2.6.3集群以及WIN7通过Eclipse开发MapReduce的demo
  3. WCF - WAS Hosting
  4. 【UOJ 276】无向图最小环
  5. (解题报告)L1-032 Left-pad (20分)——15行代码AC
  6. 初学多线程使用中踩过的坑
  7. 数据库数据规范化看不懂_数据库管理系统中的规范化
  8. 快速删除node_modules文件夹!!!
  9. 软件开发过程中最重要的是人?还是领导者?
  10. 非平稳序列的随机性分析(SAS)
  11. 暑期读书月开幕式暨天一寻宝活动
  12. hsqldb mysql_HSQLDB的研究与性能测试(与Mysql对比)
  13. 新概念英语第二册课文电子版_新概念英语第二册:课文+音频+教学视频合集(可下载)...
  14. html水晶按钮图片,利用CSS3 Gradients创建无图片水晶按钮
  15. 典型的人工神经网络由很多层构成,但不包括
  16. Teams Tab App 分析
  17. 列出MSSQL所有数据库名、所有表名、所有字段名
  18. 性能测试时那些「难以启齿」的问题-CPU相关
  19. 保理业务系统-产品介绍
  20. HDU - 7125 Master of Shuangpin

热门文章

  1. 微波感应模块电路图_关于人体感应灯,你不知道的“冷”知识
  2. win7 path环境变量被覆盖了怎么恢复_系统小技巧:还原Windows10路径环境变量
  3. pytorch 模型同一轮两次预测结果不一样_2020年的最新深度学习模型可解释性综述[附带代码]...
  4. linux 时间戳 微妙,unix时间点_毫秒和微妙_time模块
  5. Python保存dict字典类型数据到Mysql,并自动创建表与列
  6. tushare调用API获取金融相关数据
  7. django model中的DateField()转为时间戳
  8. android obd编程,Android蓝牙连接汽车OBD设备
  9. android tv 帮助,android TV端各类焦点问题
  10. java不等长二维数组_Java中关于二维数组的理解与使用