作者:Thomas

翻译:王雨桐

校对:丁楠雅

本文约2000字,建议阅读10分钟

本文为刚刚接触数据科学的新人,提出五个职场准备的建议。

数据科学已经成为21世纪最热门的工作领域,但如何才能成为数据科学家呢? 作为一名有抱负的数据科学家,或是准备从事数据科学工作的学生,你应该做好哪些准备? 需要什么技能?不要担心! 本文将会回答以上所有问题,并提供相关的资源链接,帮助你开启新的职业生涯!

数据科学是一个跨学科的领域,这意味着数据科学家要了解多个领域的知识,并成为不同领域的专家。 数据科学家必须在以下方面具备坚实的基础:

1. 计算机科学

2. 统计研究(需要扎实的基础)

3. 线性代数

4. 数据处理(数据分析的专业知识)

5. 机器学习

6. 软件工程

7. Python编程

8. R编程

9. 业务领域知识

为了成为一名高水平的数据科学家,下图是你需要掌握的一些知识领域:

除非你像激光束一样,将研究集中在这些领域,否则对上图中的一个或多个主题感到陌生是很正常的。 或者你了解两三个主题,但对其余主题了解甚少。 例如,你可能是一名计算机科学专业的学生,掌握数学知识但不了解统计研究分析所要求的高级统计知识。或者,你可能是一名有一些编程基础的统计学家。

有很多方法可以帮助你开启数据科学的职业生涯。 其中,你必须做的五件事是:

1. 向具有多年经验的前辈学习Python和R

2. 在GitHub上构建数据科学作品集

3. 加入Kaggle并参加数据科学竞赛

4. 练习面试问题

5. 做好基本的网络声誉管理,以提升形象

1. 向具有多年行业经验的前辈学习Python和R


行业经验是无可替代的。 比起一位热心的业余爱好者(如在线提供的许多课程),拥有5年以上数据科学行业工作经验的人将是讲师的不二人选。 学习Python和R是一方面,掌握Python和R是完全不同的事情。如果想在这个行业做得好,需要做到掌握技能,而不仅仅是具备基本能力。一定要确保你的讲师具有可靠的行业经验,因为这种经历会帮助你拿到顶尖的数据科学公司的offer。相比于拥有相关专业博士学位的学者,从拥有行业经验的专家那里会学到最多。

2. 在GitHub上构建数据科学作品集


在GitHub上拥有在线作品集(online portfolio)至关重要!

如果你不对学习的内容进行编程练习,也没有将课程应用于实际数据和现实情景,那么再好的培训都是无效的。你需要做数据科学项目,并且尽量使你的项目具有吸引力。

GitHub作品集应该遵循以下准则:

  • 使用目标公司正在使用的库,语言和工具。

  • 使用公司使用的数据集,最好是实际数据。(如果没有类似scikit-learn提供的学术数据集,可以使用Kaggle来获取练习数据集。)最好的选择是APIs编程构建的数据集,他们大多来自Twitter,Facebook,维基百科和类似的真实场景。

  • 选择具有市场价值的问题。不要选择学术项目,要尝试去解决现实的行业问题。

  • 在问题定义中要强调创造性和原创性,以及项目作品集所回答的问题。

3. 加入Kaggle并参加数据科学竞赛

Kaggle.com就是你的训练场。

如果你准备入手数据科学,立即成为Kaggler吧! 或者,如果你更倾向于开发,请加入TopCoder!(TopCoder也有数据科学发展路径)。 Kaggle是公认的数据科学的发源地,因为Kaggle多年来一直举办数据科学竞赛,并且是国际上所有顶尖数据科学竞赛的集合地。 收到知名公司offer的最简单方法之一就是在Kaggle上获得尽可能高的排名。 更重要的是,你可以将自己的表现与行业中的顶级竞争对手进行比较。

4. 练习面试问题

现在,很多网站都有数据科学岗位面试中使用的问题集。没有企业会让你死记硬背200个面试问题,但他们确实希望你能够在代码(最好是Python)或伪代码中解决基本的数据科学和算法问题。 最好还要了解基本概念,例如交叉验证是什么,维度的诅咒,过拟合的问题以及在实际场景中如何处理它。此外,你还需要能解释主要数据科学算法的内部细节,例如AdaBoost。 线性代数,统计学和一些基本的多变量微积分的知识也可以帮助你在竞争中抢占先机。

5. 管理你的网络声誉

这似乎与数据科学无关,但它是任何求职的基本要求。想想未来的雇主在看到求职者名姓名后的第一件事是什么?他会先百度这个名字。当搜索你的名字时,会出现什么内容?你的网络资料能否承受以下考验?

  • 在网络搜索时,你的名字是否有值得警惕的信号,如任何类型的负面报道或者争议?

  • 搜索姓名的条目是否能准确体现个人资料?

  • 你的Facebook,Twitter和Google个人资料是否有不恰当的内容?(例如私密照片)?

  • 可见的搜索结果能否准确地描述你的技能水平?

如果有以上这些潜在的问题,你可能需要调整自己的网络个人资料。你可以通过博客文章,成熟的网络评论,甚至为自己创建博客,向世界展现积极的自己。在如今的这个在线、数字、互联的世界,这对于求职者来说至关重要。

人才市场上待挑选的产品

在人才市场上,你试图将自己和你的网络信誉销售给从未见过你的人,他甚至没有听过你的名字。因此,互联网资料将成为关键,以确保你在竞争中抢占先机。目前许多培训网站提供的课程,讲师都是业余爱好者或具有不到2年行业经验的人士。所以,不要满足于低价课程,在互联网上,一分耕耘一分收获。如果这是你理想的职业领域,初期投资肯定会有更多的长期回报。

记得保持终身学习的态度。 机器学习和AI是以惊人速度发展的领域。订阅RSS源和在线资源,让你了解领域的最新发展,这是必须要做的事情。随时跟进最新的研究最能体现你的卓越追求,这些可以通过Feedly和Inoreader之类的阅读应用程序轻松完成。学习可能是你在大学里做的事情,但掌握是你一生所追求的目标,别轻易放弃。如果你可以按照文中提到的那样来完善自己,你一定可以获得自己理想的工作。最后,再次强调,一定要特别注意在GitHub上的数据科学作品集,可以帮助你在竞争中脱颖而出!

原文标题:

5 Steps to Prepare for a Data Science Job

原文链接:

https://dimensionless.in/5-steps-to-prepare-for-a-data-science-job/

译者简介

王雨桐,UIUC统计学在读硕士,本科统计专业,目前专注于Coding技能的提升。理论到应用的转换中,敬畏数据,持续进化。

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。

点击文末“阅读原文”加入数据派团队~

点击“阅读原文”拥抱组织

独家 | 5个步骤开启你的数据科学职业生涯!(附链接)相关推荐

  1. 业界 | 5个步骤开启你的数据科学职业生涯!(附链接)

    大数据文摘授权转载自数据派THU 作者:Thomas 翻译:王雨桐 校对:丁楠雅 数据科学已经成为21世纪最热门的工作领域,但如何才能成为数据科学家呢?作为一名有抱负的数据科学家,或是准备从事数据科学 ...

  2. 独家|OpenCV 1.3 矩阵的掩膜操作(附链接)

    翻译:陈之炎 校对:王可汗.林夕本文约1600字,建议阅读5分钟本文为大家介绍了 OpenCV 矩阵的官方教程. 矩阵的掩膜操作(mask)并不难.主要思路为:根据掩膜矩阵(也称为内核kernel)重 ...

  3. python神经网络算法pdf_高清图解:神经网络、机器学习、数据科学一网打尽|附PDF...

    原标题:高清图解:神经网络.机器学习.数据科学一网打尽|附PDF [导读]完全图解人工智能.NLP.机器学习.深度学习.大数据!这份备忘单涵盖了上述领域几乎全部的知识点,并使用信息图.脑图等多种可视化 ...

  4. 独家 | 7招帮你打造完美数据科学GitHub作品集!

    作者:SRISHTI DEORAS 翻译:王雨桐 校对:李洁 本文约1300字,建议阅读4分钟. 本文将提出7点,来帮助你完善自己的github, 从而得到潜在雇主的赏识. 尽管简历是向潜在雇主展示自 ...

  5. 开启数据科学职业生涯的8个基本技巧

    摘要: 本文为数据科学家开创数据科学事业铺平了道路.只要按照这八个小贴士来做,你就能让自己的职业生涯有一个良好的开端. Nick Bostrom(译者注:Nick Bostrom是牛津大学哲学系的教授 ...

  6. 怎样开启成功的“数据分析师”职业生涯(R、Python、机器学习、通信和数据可视化、数据直觉)

    目录 数据分析师是做什么的? 如何成为一名数据分析师:成为一名成功的数据分析师所需的技能 如何成为数据分析师:数据分析师职业的编程技能 ? R语言编程 Python 统计 数学 机器学习 在监督学习 ...

  7. 独家 | 商业分析的职业路线-在数据科学世界里规划你的下一个角色

    作者:TAVISH SRIVASTAVA 翻译:Nicola 校对:丁楠雅 本文共3400字,建议阅读9分钟. 本文将介绍商业分析领域里有哪些主要角色,并提出一个框架帮助你思考你的职业生涯. 简介: ...

  8. 独家 | 利用Python实现主题建模和LDA 算法(附链接)

    作者:Susan Li翻译:陈之炎校对:陈汉青本文约1900字,建议阅读5分钟在这篇文章,我们将LDA应用于一组文档,并将文档按照主题分类. 标签:LDA 算法 主题建模是一种用于找出文档集合中抽象& ...

  9. 独家 | 层级聚类和Python实现的初学者指南(附链接)

    作者:Pulkit Sharma 翻译:陈超 校对:吴振东 本文约4700字,建议阅读15分钟 本文从对比无监督学习和监督学习的特征切入,结合具体的案例来给大家介绍层级聚类的概念.应用场景.主要类型以 ...

最新文章

  1. Java用for循环Map
  2. 大专计算机学语数英理化生吗,学考11-13号报名啦!你知道语数英和政史地/物化生成绩有什么作用嘛?不懂你会后悔的!!...
  3. rewirte 规则
  4. richtextbox自动滚动到最下面_自动滚动式连续真空包装机简介
  5. python常用的装饰器有哪些_python基本装饰器
  6. POJ - 2559 Largest Rectangle in a Histogram(单调栈)
  7. 玩转Mixly – 1、Mixly图形化编程工具介绍
  8. 问题 D: 寻找丢失的LZY
  9. [SUCCESS]前后端分离开发-入门案例 +VSCode安装
  10. jackson解析泛型的正确写法,解决 in unnamed module of loader ‘app‘
  11. Centos6 yum源设置
  12. 网站推广第一周总结和反思
  13. MAC中文版 FCPX V10.6.5 专属视频剪辑后期工具及其插件安装使用教程
  14. 微信开发工具报错:UNKNOWN ERROR:tunneling socket could not be established,cause=getaddrinfo ENOTFOUND socks
  15. XC3072锂电池充电IC(耐高压,带OVP,带防反接)
  16. Makefile 与 GCC G++ 入门
  17. 属性动画、帧动画、补间动画
  18. javac的命令(-Xbootclasspath、-classpath与-sourcepath等)
  19. 面试必备:聊聊sql优化的15个小技巧
  20. 用uni-app进行小程序的开发

热门文章

  1. Nginx基于IP,端口,域名配置虚拟主机
  2. 有关try..catch..finally处理异常的总结
  3. Forefront_TMG_2010-TMG建立站点间***
  4. nginx重新编译安装mysql_Centos 6.5编译安装Nginx+php+Mysql
  5. 苹果无线耳机使用方法_安卓党可以使用 AirPods 吗?实测结果.....
  6. python 获取窗口句柄_Python文件读写最详细的讲解
  7. html点击播放生日快乐歌曲大全,播放生日快乐歌曲.doc
  8. android canvas 保存图片,ionic3 html5 video 抓图保存到手机相册,解决Android手机不支持Canvas drawImage问题...
  9. sqoop连接hive和mysql_用Sqoop进行Hive和MySQL之间的数据互导
  10. rⅰd的意思_Q345R(HIC)和Q345R(R-HIC)化学成分抗氢板