导读:解读7大热门职业。

编译:Mika,来源:datacamp

来源:CDA数据分析师(ID:cdacdacda)

根据《韦氏词典》,数据指的是用作推理、讨论或计算基础的事实信息。

基于这个定义,我们可以进一步得出:数据可以理解为是收集到的任何信息,可以使用、进一步处理和分析以获得见解。而且通常与计算机联系在一起,因为数据通常是在计算机中生成和存储的,然而数据存在的时间比我们想象的要长得多。

01 数据的历史

人类存储和分析数据的最早例子可以追溯到公元前18000年,当时人们发现史前人类使用计数棒进行初步计算。这些旧石器时代部落的人在木棍和骨头上刻上刻痕,以记录人类的活动,比如交易和监控物资。到公元前2400年,在巴比伦发明出了用于计算的算盘。

纵观历史,数据收集、处理和分析的不断发展是通过石板、粘土、纸莎草、木头和纸卷上的大量文字来体现的。最终,随着更多形式的数据被发现,处理、收集、存储和分析数据的需求也在不断发展。

随着人类社会的进步,对数据处理的要求也越来越高。

19世纪,在美国开始人口普查进行。人口普查中的数据点数量呈指数增长,美国人口普查局估计,收集和分析人口普查中的所有数据需要几年甚至几十年的时间。

这是个很大的问题,因为只有在下一次人口普查即将开始时,才会完成对当前人口普查数据的汇编和分析。

幸运的是,一位名叫赫尔曼·霍勒里斯的年轻工程师和发明家开发了霍勒里斯制表机。这是一种机电式制表机,将收集和分析人口普查数据所需的时间从几年缩短到仅仅几个月。正因为如此,霍勒里思被视为现代自动计算之父,后来因创立IBM而闻名。

快进到20世纪,计算机出现了。随着功能更强大的计算机的出现,对数据存储的要求也越来越高。

德国-奥地利工程师弗里茨·普夫勒默发明了一种在磁带上磁性存储信息的方法。他的一些发明原理至今仍被用于数字数据存储。

在这个时代,“商业智能”一词越来越流行,因为对新兴软件以及用于分析商业和运营绩效的系统的需求迅速增加。

1989年,蒂姆·伯纳斯·李创建了万维网(又称互联网),数据革命发生了真正的变化。这导致了全世界人民之间的自动信息共享。这意味着今天有更多的数据被共享、创建和存储,从而产生了收集、使用和分析数据的新方法。

02 向“大数据”过渡

由于20世纪90年代互联网的惊人增长以及个人电脑和计算设备的稳定发展,在线设备的数量以及由此产生的数据量迅速增长。

虽然大数据的概念早在20世纪90年代就已经存在,但直到2005年罗杰·穆加拉斯才正式给它贴上标签。他将其描述为"使用传统商业智能工具几乎无法管理和处理的大量数据"。

大数据是一个用来描述大量数据的术语,包括结构化数据和非结构化数据,这些数据每天都会淹没企业。它包括信息量、创建和收集信息的速度,以及所覆盖数据点的种类或范围。

考虑到大数据的规模和复杂性,收集、组织和分析它以发现模式和其他有用信息的过程已经成为帮助许多组织做出商业决策的一部分。这反过来又催生了数据科学——一个跨学科领域,它使用科学方法、流程、算法和系统从大量数据中发现模式,并使商业领袖能够获得见解。

03 什么是数据科学?

根据IBM的说法,数据科学是一种多学科方法,可以从当今组织收集和创建的大量且不断增加的数据中提取可操作的见解。

该领域通常需要计算机科学和纯科学技能,因为数据科学家在其方法中应用科学方法,并使用预测分析和人工智能从数据中提取见解。

如今,“数据科学”经常被企业和组织用作处理大量数据的通用术语,无论是准备、清理、分析数据还是可视化数据以揭示模式。

以下我们列出了可从事的七种数据相关职业:

1. 数据科学家

数据科学家需要能够应用数学、统计学和科学方法。

使用多种工具和技术来清理和准备数据;进行预测分析和人工智能;并解释如何利用这些结果来为商业问题提供数据驱动的解决方案。数据科学家需要的技能比数据分析师多得多。

2. 数据分析师

数据分析师收集、处理和执行统计数据分析,为组织得出有意义的结论。

数据分析师将大型数据集转化并处理成可用的形式,如报告或演示。他们还通过研究重要的模式来帮助决策过程,并从数据中收集洞察力,然后有效地传达给组织领导,以帮助商业决策。

3. 数据工程师

数据工程师负责准备、处理和管理收集和存储的数据,用于分析或操作用途。

像传统的工程师一样,数据工程师建立和维护数据 "管道",将数据从一个系统连接到另一个系统,使数据科学家能够获得信息。正因为如此,数据工程师被要求了解数据科学中使用的几种编程语言,如Python、R和SQL。

4. 数据架构师

数据架构师主要是设计和创建数据管理系统的蓝图,然后由数据工程师建立。

类似于传统的建筑师,数据架构师是 "远见者",因为他们负责可视化和设计一个组织的数据管理框架。此外,数据架构师改善现有系统的性能,确保数据库管理员和分析师能够使用这些系统。

5. 商业智能(BI)开发人员

商业智能开发者是专门的工程师,他们使用软件工具将数据转化为有用的见解,以帮助商业决策。

他们负责简化技术信息,让公司里的其他人都能轻松理解。简而言之,他们创建和运行包含他们使用商业智能工具找到的数据的报告,并将信息转化为更通俗的术语。

6. 统计员

鉴于统计学是数据科学的主要基础之一,许多统计学家可以轻松地过渡到数据科学领域。

统计学家主要负责数据的收集和处理。他们决定需要什么数据以及如何收集数据。此外,他们设计实验,分析和解释数据,并报告结论。

7. 机器学习工程师

机器学习工程师是另一组专业工程师,他们专注于研究、构建和设计人工智能和机器学习系统,以实现预测模型的自动化。

基本上,他们开发的算法使用输入数据并利用统计模型预测输出,同时在新数据可用时不断更新输出。

下面我们看看以上这些数据科学职业的最受欢迎程度。下图显示了2021年12月8日美国的职位空缺情况。

数据架构师是最受欢迎的数据科学职业道路,因为他们在创建其他数据科学专业人员随后使用的数据管理系统方面非常重要。

接下来是机器学习工程师,考虑到利用人工智能预测许多科技公司结果的重要性。

需求最少的是统计人员,主要是因为许多传统的统计学家现在正在成为数据科学家。统计学家从纯统计学转向数据科学相对简单是,他们已经拥有成为一名成熟的数据科学家所需的基础知识。

04 数据科学的发展速度并不慢

毫无疑问,数据科学如今非常流行,但更好的问题是,它在未来还会如此流行吗?根据就业预测,情况似乎的确如此。

美国劳工统计局2020-2030就业预测的数据显示,数据科学职业,包括统计学、数据科学以及数据工程等其他基于数学和科学的职业,从2020年到2030年的百分比变化来看,将呈现出非常高的增长率。统计学家总体排名第14位,而数据科学家和其他数学科学职业在数据中包含的790个职位中总体排名第31位。

尽管统计学家和数据科学家在总劳动力中所占的份额与其他职业相比很小,但随着数据科学职业道路变得越来越流行,这些数字预计将在未来几年增加。

下图显示了统计学家、数据科学家和其他数学科学职业与其他预计增长率较高的职业的对比情况。

05 当之无愧的高收入职业

数据相关职业备受欢迎的一个主要原因在于其收入高。

下图显示了纽约市10种不同职业--包括数据科学家和数据分析师的工资范围。这些数据来自Teleport,该网站汇总了不同城市的生活条件,如工资的数据。

根据Teleport的数据,数据科学家的年薪中位数在纽约市排名第四,为114105美元,仅次于企业高管和医护人员。事实上,在马尼拉等其他一些城市,数据科学家的排名高达第二,仅次于企业高管。

数据分析师的薪资也很可观,数据分析师的年薪中位数为61818美元,仍然相当于纽约市的平均家庭收入。

06 就业市场不断增长

数据科学受欢迎的另一个主要原因是,如今的企业将数据科学的原理整合到日常运作中。下图显示了工作中涉及数据科学的前10个行业,其中涉及到8000家公司的样本数据。

毫不奇怪,包括谷歌、苹果和优步等科技公司占据了榜首。毕竟,大数据的激增是由互联网的诞生引起的,互联网与软件和技术密切相关。数据科学实际上是使用各种工具和技术处理大量信息。

接下来是金融服务公司,这是金融科技公司崛起带来的。作为“金融”和“技术”的门户,金融科技公司将技术和创新整合到其服务和产品中,以改善其对客户的交付,扰乱传统金融服务。由于它涉及处理大量数据,如客户信息,金融服务公司看到了数据科学工具的潜力,可以帮助简化和优化流程,改进服务。

07 结语

数据科学是一条非常有发展的职业道路,而且没有放缓的迹象。在未来的许多年里,它将继续塑造和影响企业和组织的运作方式。

至于你应该走哪条特定的数据科学职业道路,这主要取决于你的个人优势和总体兴趣。重要的是,上述任何职业都是值得的。

参考链接:

https://www.datacamp.com/blog/an-analysis-of-the-top-7-trending-data-science-careers-to-pursue

延伸阅读

数据分析领域七大热门职业相关推荐

  1. 解读 | 数据分析领域七大热门职业

    CDA数据分析师 出品 来源:datacamp 编译:Mika 根据<韦氏词典>,数据指的是用作推理.讨论或计算基础的事实信息. 基于这个定义,我们可以进一步得出:数据可以理解为是收集到的 ...

  2. 预测未来 盘点大数据分析领域五大趋势

    ZDNet至顶网服务器频道 12月22日 新闻消息:目前,大数据分析是一个非常热门的行业,一夜间,似乎企业的数据已经价值连城.企业都在开始尝试利用大数据来增强自己的企业业务竞争力,但是对于大数据分析行 ...

  3. 大数据热门职业薪酬榜 Hadoop人才居首

    文章讲的是大数据热门职业薪酬榜 Hadoop人才居首,随着越来越多企业开始投身于大数据技术的革新洪流,对于IT专业人士的市场需求也水涨船高.时至今日,具备收集.整理.分析以及构建不同来源数据技能的人才 ...

  4. 数据分析领域不同职位de薪酬职能差异

    大数据时代,互联网时代,电商时代,什么东西越来越重要,不用说都知道是大数据.大数据的分析应用,可以为一个公司.一个企业.一个地区的未来发展规划起到一针见血的作用.随着大数据的火热,关于数据分析师的职业 ...

  5. 看!数据分析领域中最为人称道的七种降维方法

    http://dataunion.org/20803.html 感谢王穆荣的投稿,转载请注明出处:数盟社区 近来由于数据记录和属性规模的急剧增长,大数据处理平台和并行数据分析算法也随之出现.于此同时, ...

  6. 数据分析不再是热门职位,而是必备技能

    很多人会觉得说,数据分析是一门职位,那么最近这几年,这个职位热度很高,所以总有人说,现在学数据分析是不是已经太晚了,没有机会了,竞争太激烈了.如果单纯从数据分析师的职位来说,这么说是对的. 但现实是, ...

  7. 编程语言哪家强?4种数据分析领域语言优缺点对比

    来源:大数据DT(ID:hzdashuju)本文约2600字,建议阅读5分钟"哪门语言更好"?本文介绍了4种数据分析领域语言的优缺点. 编程语言的好坏及排行之争由来已久." ...

  8. AI时代即将出现的3个热门职业

    https://www.toutiao.com/a6656800530200789508/ 2019-02-12 01:45:52 随着人工智能的发展,很多人类的工作都会被机器取代.但是,新技术也创造 ...

  9. Vineyard 加入 CNCF Sandbox,将继续瞄准云原生大数据分析领域

    作者 | Vineyard 团队 来源 | 阿里巴巴云原生公众号 ​ Vineyard 是一个专为云原生环境下大数据分析场景中端到端工作流提供内存数据共享的分布式引擎,我们很高兴宣布 Vineyard ...

最新文章

  1. linux下memcached安装以及启动
  2. 详解云原生机器学习平台的优势
  3. 关于mysql的“+0”操作
  4. Source Insight中的多行注释
  5. flash cs3 代码提示 应该加强
  6. SLAM: Ubuntu14.04_Kylin安装ROS-Indigo
  7. Java自动化测试框架-02 - TestNG之理论到实践 - (详细教程)
  8. python自我复制的程序_Python自我
  9. win10安装Visual Studio Code(VSCode)
  10. QTP11 5发布,改名UFT
  11. C# string.Format json格式字符串报错”输入字符串的格式不正确“
  12. 【项目|ICT】决赛记录
  13. 教您在MathType输入三角形符号
  14. 股票实时行情接口如何获得快照历史数据?
  15. 学习笔记:Github(1)站在巨人的肩膀上
  16. 如何删除电脑上一些恶意安装软件?
  17. 关于一些Ubuntu网络问题的解决办法
  18. linux内核mtd驱动程序与sd卡驱动程序,Linux内核MTD驱动程序与SD卡驱动程序.docx
  19. 下载在线阅览的pdf文件
  20. 研究员发现针对 Windows 用户的 Raspberry Robin 蠕虫

热门文章

  1. Linux笔记-centos7编译安装svn 1.14.1
  2. Qt|OpenGL对obj文件的认识以及如何去解析(opengl+qt构造地球模型)
  3. centos8 装docker 问题
  4. hibernate保存mysql乱码_hibernate保存数据到mysql时的中文乱码问题
  5. oracle数据库要参考的书,[Oracle] 几本重要的电子图书下载-数据库专栏,ORACLE
  6. vrp 节约算法 c++_滴滴技术:浅谈滴滴派单算法
  7. python operator __gt___Python operator.gt方法代码示例
  8. 二分法python上机实验报告_二分查找-Python刷题笔记
  9. 数据结构之外部排序:失败树
  10. C++设计模式-Flyweight享元模式