大数据职业发展方向

说明: 以下的我,不是我,是原作者。

我从业的两段经历

大数据的方向有很多的,即使没有真正经历过,平时也会耳濡目染,在各大杂志公众号新闻上听说过,什么大数据人工智能,大数据分析挖掘,大数据架构师等职位。

我以我的两段从业经历来说明一下大数据的方向吧。

我的前公司是一家互联网企业,大数据部门是从0开始起步的。

我们的数据总监是来自百度的资深专家。

一开始是从0开始搭建 CDH 集群,接着采集服务器日志,采集关系型数据库数据到 hadoop 上。

等数据渐渐多了起来,我们开始着手做一个企业数据仓库,整合各个业务线的数据,最终产出各种报表和分析数据给老板和各个业务线的产品经理。此时产生了第一个小组,数据仓库组。

然后数据越来越多,需求也越来越多,我们便开始招数据分析人员,去接第三方的数据分析需求,并产出各条业务线生产运营分析报告。此时产生了第二个小组,数据分析组。

当时我们也有社交的场景,会员在平台上会发文章,写评论,当然必不可少的会打广告。打广告的方式也是五花八门,玩文字梗的,谐音梗的,图片上打广告的。此时需要专门从事 NLP 和图形识别的小组,去拦截平台广告。由此成立了第三个小组,AI组。

随着社交场景的持续发展,平台内容也在逐渐增多,此时需要做一个推荐系统去构建用户的画像,给用户推荐他们喜欢的内容,维持用户的黏性。此时产生了第四个小组,推荐组。

后面数据越来越多,老板也看到了其中的价值,需要从海量的数据中挖掘有意义的东西,比如从海量的球赛数据,赔率数据中去分析球赛结果,提高平台的整体返奖率。由此有了第五个小组,数据挖掘组。

这便是我的第一份大数据经历,可以大致看到大数据的几个大方向,数据开发,数据分析和挖掘,人工智能和机器学习,推荐系统。

大数据架构方向

大数据架构方向,更多注重的是Hadoop、Spark、Flink 等大数据框架的实现原理、部署、调优和稳定性问题,以及它们与Flume、Kafka、DataX等数据流工具以及可视化工具的结合技巧。

再有就是一些工具的商业应用问题,如Hive、Cassandra、HBase、Elasticsearch、ClickHouse等。

能够将这些概念理解清楚,并能够用辩证的技术观点进行组合使用,达到软/硬件资源利用的最大化,服务提供的稳定化,这是大数据架构人才的目标。

以下是大数据架构方向研究的主要方面。

(1)架构理论:关键词有高并发、高可用、并行计算、MapReduce、Spark 等。

(2)数据流应用:关键词有Flume、Kafka、Flink,Druid等。

(3)存储应用:关键词有HDFS、ES,ClickHouse等。

(4)软件应用:关键词有Hive、HBase、Spark等。

(5)微服务应用:构建平台各种业务系统,如平台系统,调度系统,数据权限系统,api 系统等

大数据分析方向

大数据分析方向的人才更多注重的是数据指标的建立,数据的统计,数据之间的联系,数据的深度挖掘和机器学习,并利用探索性数据分析的方式得到更多的规律、知识,或者对未来事物预测和预判的手段。

以下是大数据分析方向研究的主要方面。

(1)数据库应用:关键词有RDBMS、NoSQL、MySQL、Hive等。

(2)数据加工:关键词有ETL、Python等。

(3)数据统计:关键词有统计、概率等。

(4)数据分析:关键词有数据建模、数据挖掘、机器学习、回归分析、聚类、分类、协同过滤等。

此外还有一个方面是业务知识。

其中,数据库应用、数据加工是通用的技术技巧或者工具性的能力,主要是为了帮助分析师调用或提取自己需要的数据,毕竟这些技巧的学习成本相对较低,而且在工作场景中不可或缺,而每次都求人去取数据很可能会消耗过多的时间成本。

数据统计、数据分析是分析师的重头戏,一般来说这两个部分是分析师的主业,要有比较好的数学素养或者思维方式,而且一般来说数学专业出身的人会有相当的优势。

最后的业务知识方面就是千姿百态了,毕竟每家行业甚至每家公司的业务形态都是千差万别的,只有对这些业务形态和业务流程有了充分的理解才能对数据分析做到融会贯通,才有可能正确地建立模型和解读数据。

大数据开发方向

大数据开发方向的人才更多注重的是服务器端开发,数据库开发,呈现与可视化,人机交互等衔接数据载体和数据加工各个单元以及用户的功能落地与实现。

以下是大数据开发研究的主要方面。

(1)数据仓库开发:关键词有RDBMS、NoSQL、MySQL、Hive等。

(2)数据流工具开发:关键词有Flume、Heka、Fluentd、Kafka、ZMQ等。

(3)数据前端开发:关键词有HightCharts、ECharts、JavaScript、D3、HTML5、CSS3等。

(4)数据获取开发:关键词有爬虫、分词、自然语言学习、文本分类等。

大数据职业理解_大数据职业发展方向相关推荐

  1. 大数据职业理解_大数据带给我们职业三大根本改变

    那么,大数据为什么成为所有人关注的焦点?大数据带来了什么样的本质性改变?为此,我们与中国计算机学会大数据学术带头人.中国人民大学信息学院院长杜小勇教授进行了访谈. 大数据(Big data)通常用来形 ...

  2. 大数据职业理解_数据分析师真有那么好?其实正在面临3大职业困境

    最近几年,大数据行业的迅猛发展带动了数据分析师需求量的增加.数据分析师迅速成为了求职市场上的香馍馍. 造成一些圈外人认为数据分析就是企业的灵丹妙药,通过数据分析能解决一切问题.产品改版,营销策略,市场 ...

  3. 大数据职业理解_学习大数据,你的职业是如何规划的?

    作为IT类职业中的"大熊猫",大数据人才(数据工程师,数据分析师,数据挖掘师,算法工程师等).在国内人才市场可谓是一颗闪耀的新星.由于刚刚出于萌芽阶段,这个领域出现很大的人才缺口. ...

  4. 大数据职业理解_到底什么是大数据,大数据职业的具体工作内容是什么?

    综合网络解释加上自己的理解给出了大数据的定义. 大数据就是数据规模达到海量级.极快的速度流转.数据类型和来源多种多样.价值密度低而且能够反映事物真实性的数据就是大数据. 大数据的工作内容包括以下几个方 ...

  5. 人力资源数据分析师前景_人力资源数据分析师——大数据下的精英岗位

    人力资源数据分析师的工作而是通过横截面上数据的整体性分析,和纵向数据的历史演变和未来趋势,对公司人力资源情况有一个宏观的把握. 劳人研究生会,公众号:劳人研究生会劳有所学-职业介绍|人力资源数据分析师 ...

  6. python开发和大数据开发工程师_大数据开发工程师的岗位职责

    大数据开发工程师负责该领域的业务需求讨论,完成技术方案及数据开发.下面是学习啦小编整理的大数据开发工程师的岗位职责. 大数据开发工程师的岗位职责1 职责: 1.负责所分管团队的团队建设和日常管理工作; ...

  7. 大数据治理工程师_大数据治理关键技术解析(转自EAWorld)

    在企业数据建设过程中,大数据治理受到越来越多的重视.从企业数据资产管理和提升数据质量,到自服务和智能化的数据应用,大数据治理的内容在不断地发展和完善,其落地实施的过程中会遇到各种各样的难题和挑战.本篇 ...

  8. Hadoop! | 大数据百科 | 数据观 | 中国大数据产业观察_大数据门户

    深度好文丨读完此文,就知道Hadoop了! 来源:BiThink 时间:2016-04-12 15:14:39 作者:陈飚 "昔我十年前,与君始相识." 一瞬间Hadoop也到了要 ...

  9. 大数据 挑战 机会_大数据可视化面临哪些挑战

    数据可视化在大数据场景下面临诸多新的挑战,包括数据规模.数据融合.图表绘制效率.图表表达能力.系统可扩展性.快速构建能力.数据分析与数据交互等. 数据规模 大数据规模大.价值密度降低,受限于屏幕空间, ...

  10. 大数据的理解,大数据是什么,大数据能干什么?

    一.概念: · 一种规模大到在获取.存储.管理.分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模.快速的数据流转.多样的数据类型和价值密度低四大特征. 大数据的本质就是一大堆 ...

最新文章

  1. 程序员技术练级攻略--原作者:陈皓
  2. Java JDBC数据库 之 DBUtil 封装类
  3. 永久开启完整版Google Play
  4. python实现深度优先搜索_python中的深度优先搜索算法
  5. 如何用ABP框架快速完成项目(面向项目交付编程面向客户编程篇) - 广州.net微软技术俱乐部12月份活动报名帖...
  6. Windows编程之互动与动画
  7. LeetCode 66. Plus One
  8. 苏宁官方辟谣“员工猝死”:因个人身体原因晕倒
  9. 2021年中国一次性卫生设备市场趋势报告、技术动态创新及2027年市场预测
  10. 腾讯发力研发文化升级,宣布加入Linux基金会TODO 工作组
  11. VS2013下使用QT和MFC的错误解决方案
  12. linux下node-webkit安装vlc插件
  13. jeesite图片上传并显示
  14. 京东运营体系组织架构曝光,自建物流秘密在这里
  15. vant 做表格_vue实现简单表格组件
  16. git 将多条提交合并为一条
  17. CRM系统部署阶段和实施战略
  18. “打开文件所在位置”提示“找不到应用程序”的解决方案
  19. 三年程序员生涯的感悟、总结和憧憬
  20. storj主网挖矿指南

热门文章

  1. JVM运行原理及优化
  2. 导向滤波算法原理与代码
  3. html背景色坐标,【已解决】Html的Canvas设置全局背景色
  4. ESXi主机从6.7升级到ESXi 7.0.3后无法识别Emulex LPe12000 HBA卡
  5. 引领IT大迁徙 Emulex持续优化应用交付
  6. Element 中表格表头添加搜索图标和功能使用
  7. Linux怎么有两个vmdk文件,「Linux」- 挂载 VMDK 文件
  8. 锐捷交换机配置snmp版本_锐捷交换机如何配置接口IP地址
  9. java飞扬的小鸟,三国战纪,网络飞车游戏知识总结
  10. 1017 怪盗基德的滑翔翼(最长上升子序列扩展)