与其他一些相关工程职位一样,数据科学家的影响力与互联网同进同退。数据工程师和数据分析师与数据科学家携手共同完成这幅“大数据时代”巨作。

三者之间的定义又是如何区分的呢?

数据科学家是什么样一个存在呢?

通常情况下,数据科学家有数学或物理方面的高等学位。有博士学位的情况并不少见,硕士学位仅是一个前提条件。数据科学家精通统计建模以及如何构建与定制高级数学算法。这既在他们专业范围内,也是他们所擅长的地方。我听到过有人这样形容一个数据科学家“软件工程技能牛过多数人的酷炫统计学家”。

我结合加工的说:所谓数据科学家,是指运用统计分析、机器学习、分布式处理等技术,从大量数据中提取出对业务有意义的信息,以易懂的形式传达给决策者,并创造出新的数据运用服务的人才。

数据工程师如何定义呢?

数据工程师一般被定义成“深刻理解统计学科的明星软件工程师”。如果你正为一个商业问题烦恼,那么你需要一个数据工程师。这些伙计就是那些能提供可建模数据所需平台的人。他们的核心价值在于他们借由清晰数据创建数据管道的能力。

数据科学家

数据工程师对演算法有相当好的理解。因此,数据工程师理应能运行基本数据模型。商业需求的高端化催生了演算高度复杂化的需求。很多时候,这些需求超过了数据工程师掌握知识范围,这个时候你就需要打电话寻求数据科学家的帮助。

数据分析师如何理解呢?

数据分析师能洞悉一个方程式的商业意义。他们知道如何提出正确的问题,非常善于数据分析,数据可视化和数据呈现。不管是给另一个数据分析师还是C级执行做演讲,数据分析师都是数据提取,模式识别以及从大量数据中洞察问题方面的能手。

如果你或者你的公司正考虑顺应这股大数据浪潮的发展,你应该从明确你想利用大数据解决所面临的商业问题处下手。接着找出你真正的需求:是数据采集,检索,仓储还是数据分析?然后编写相应的职位描述并做好准备。

从事这三者都要具备哪些技能呢?

数据科学家所需的技能如下:

计算机科学

一般来说,数据科学家大多要求具备编程、计算机科学相关的专业背景。简单来说,就是对处理大数据所必需的Hadoop、Mahout等大规模并行处理技术与机器学习相关的技能。

数学、统计、数据挖掘等

除了数学、统计方面的素养之外,还需要具备使用SPSS、SAS等主流统计分析软件的技能。其中,面向统计分析的开源编程语言及其运行环境“R”最近备受瞩目。R的强项不仅在于其包含了丰富的统计分析库,而且具备将结果进行可视化的高品质图表生成功能,并可以通过简单的命令来运行。

数据可视化(Visualization)

信息的质量很大程度上依赖于其表达方式。对数字罗列所组成的数据中所包含的意义进行分析,开发Web原型,使用外部API将图表、地图、Dashboard等其他服务统一起来,从而使分析结果可视化,这是对于数据科学家来说十分重要的技能之一。

数据工程师需具备的技能

数学及统计学相关的背景

对于大多数互联网大公司来说,对于数据工程师的要求都是希望是统计学和数学背景的硕士或博士学历,只有具备一定的理论知识,才能理解模型、复用模型甚至创新模型,来解决实际问题。

计算机编码能力

实际开发能力和大规模的数据处理能力是作为大数据工程师的一些必备要素,因为许多数据的价值来自于挖掘的过程,你必须亲自动手才能发现金子的价值。

对特定应用领域或行业的知识

数据工程师这个角色很重要的一点是,不能脱离市场,因为大数据只有和特定领域的应用结合起来才能产生价值。所以,在某个或多个垂直行业的经历能为应聘者积累对行业的认知,对于之后成为数据工程师有很大帮助,因此这也是应聘这个岗位时较有说服力的加分项。

数据分析具备的技能

懂业务

从事数据分析工作的前提就会需要懂业务,即熟悉行业知识、公司业务及流程,最好有自己独到的见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的使用价值。

懂管理

一方面是搭建数据分析框架的要求,比如确定分析思路就需要用到营销、管理等理论知识来指导,如果不熟悉管理理论,就很难搭建数据分析的框架,后续的数据分析也很难进行。另一方面的作用是针对数据分析结论提出有指导意义的分析建议。

懂分析

指掌握数据分析基本原理与一些有效的数据分析方法,并能灵活运用到实践工作中,以便有效的开展数据分析。基本的分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等。高级的分析方法有:相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、对应分析法、时间序列等。

懂工具

指掌握数据分析相关的常用工具。数据分析方法是理论,而数据分析工具就是实现数据分析方法理论的工具,面对越来越庞大的数据,我们不能依靠计算器进行分析,必须依靠强大的数据分析工具帮我们完成数据分析工作。

懂设计

懂设计是指运用图表有效表达数据分析师的分析观点,使分析结果一目了然。图表的设计是门大学问,如图形的选择、版式的设计、颜色的搭配等等,都需要掌握一定的设计原则。
本文转自d1net(转载)

如何区分数据科学家,数据工程师与数据分析师相关推荐

  1. 数据科学家 数据工程师_发展数据科学家和工程师

    数据科学家 数据工程师 by David Venturi 大卫·文图里(David Venturi) 发展数据科学家和工程师 (Developing Data Scientists and Engin ...

  2. 【数据科学家】什么是数据科学家? 一个关键的数据分析角色和一个利润丰厚的职业...

    数据科学家的角色因行业而异,但有一些共同的技能.经验.教育和培训可以帮助你在数据科学职业生涯中占据一席之地. 什么是数据科学家? 数据科学家是分析数据专家,他们使用数据科学从大量结构化和非结构化数据中 ...

  3. 不会做特征工程的 AI 研究员不是好数据科学家!上篇 - 连续数据的处理方法 本文作者:s5248 编辑:杨晓凡 2018-01-19 11:32 导语:即便现代机器学习模型已经很先进了,也别

    不会做特征工程的 AI 研究员不是好数据科学家!上篇 - 连续数据的处理方法 雷锋网(公众号:雷锋网) AI 科技评论按:眨眼间我们就从人工特征.专家系统来到了自动特征.深度学习的人工智能新时代,众多 ...

  4. 【数据科学家】什么是数据科学?

    什么是数据科学? 数据科学(Data Science)是一门新时代的交叉学科,目的是使用科学的理论.方法从结构或非结构数据中获取知识与洞见.随着" 数据化"浪潮,我们的照片.爱好. ...

  5. 数据科学家分享:“大数据全栈技术与商用平台架构设计之路”

    各位好: 回首10年多的科研工作历程,也是中国经济高速发展的10多年,中国高铁.核电.航空.互联网.云计算.大数据.人工智能等领域无不铭刻着"中国名片",这就是科技是第一生产力的实 ...

  6. 数据科学家赚多少?数据全分析与可视化 ⛵

  7. 如何区分理解数据科学家与机器学习工程师

    数据科学家Vs机器学习工程师 原文: What are machine learning engineers? 来源: https://tech.co/12-ways-advantage-big-da ...

  8. 如何区分大数据下的三大利器:数据科学家,数据工程师与数据分析师

    与其他一些相关工程职位一样,数据科学家的影响力与互联网同进同退.数据工程师和数据分析师与数据科学家携手共同完成这幅"大数据时代"巨作.他们共同努力拟定数据平台要求,基础和高级算法, ...

  9. 攀登数据科学家和数据工程师之间的隔墙

    来源 | 数据派 THU 机器学习的教育和研究重点往往集中在数据科学过程的模型构建.训练.测试和优化等方面.要使这些模型投入使用,需要一套工程专长和组织结构,对于其中的标准尚不存在.有一个架构可以指导 ...

最新文章

  1. [安全攻防进阶篇] 六.逆向分析之OllyDbg逆向CrackMe01-02及加壳判断
  2. remove()与empty()的区别
  3. 日语输入法 android8.0,讯飞输入法发布 AndroidV8.0.6855 专注提升输入效率
  4. httpservletrequest 设置请求头_请求和常用对象
  5. 量子计算机概念谁提出来,目前的量子计算机从根本上来说是一个伪概念
  6. 电力电子课设日志(已完结)
  7. 怎么用软件测试iPad,Apple:如何在iphone、ipad上安装一些常用命令行命令
  8. 使用SpotBugs/FindBugs进行代码检查
  9. elasticsearch简介 搜索引擎全文搜索引擎
  10. 前苏格拉底时期的古希腊哲学流派
  11. 企业内部知识共享平台的好处-以Confluence为例
  12. 华为p30pro鸿蒙悟空,华为新广告《悟空》火了,竟是华为P30Pro拍的?
  13. 换博客拉 http://vergilwang.iteye.com/
  14. 思科和H3C交换机单端口环路解决方案
  15. Netty内存池 (5w长文+史上最全)
  16. 腾讯云搭建vsftpd服务器
  17. 惯性导航的定位原理是什么?
  18. xgboost:防止过拟合的方法收缩和特征列、采样
  19. NLP学习笔记 02 句法和文法
  20. 报错:cannot run program--createprocess error=2,系统找不到指定的文件

热门文章

  1. jms.jar 2.0_JMS API概述:JMS 1.x和JMS 2.x
  2. 开课吧Web:学习Web前端技术有哪些好处?
  3. 腾讯九次面试C++,如今面试题了如指掌
  4. Python基础笔记(三) dict、set、函数
  5. IPv6协议漏洞将威胁核心路由器安全
  6. 数据库改名系列(数据库名,逻辑名,物理文件名)
  7. Socket 编程实战
  8. 一个网络传输框架——zeroMQ 调研笔记
  9. 30多岁的程序员仍然奋斗在一线
  10. apache cgi python