成为一个大数据开发工程师的学习步骤?
大数据的学习是有条件限制的,首先你需要是一名普通的工程师,如果你是Java工程师的话更好,但如果你是小白的话,那就只能成为一名工程师的后再来学习大数据。
一、认识大数据
大数据本质其实也是数据,不过也包括了些新的特征,
- 数据来源广;
- 数据格式多样化(结构化数据、非结构化数据、Excel文件等);
- 数据量大(最少也是TB级别的、甚至可能是PB级别);
- 数据增长速度快。
而针对以上新的特征需要考虑很多问题:
例如,数据来源广,该如何采集汇总?采集汇总之后,又该存储呢?数据存储之后,该如何通过运算转化成自己想要的结果呢?
对于这些问题,我们需要有相对应的知识解决。
二、大数据所需技能要求
Python语言:编写一些脚本时会用到。
Scala语言:编写Spark程序的最佳语言,当然也可以选择用Python。
Ozzie,azkaban:定时任务调度的工具。
Hue,Zepplin:图形化任务执行管理,结果查看工具。
Allluxio,Kylin等:通过对存储的数据进行预处理,加快运算速度的工具。
必须掌握的技能:
Java高级(虚拟机、并发)、Linux 基本操作、Hadoop(HDFS+MapReduce+Yarn )、 HBase(JavaAPI操作+Phoenix )、Hive(Hql基本操作和原理理解)、 Kafka、Storm/JStorm、Scala、Python、Spark (Core+sparksql+Spark streaming ) 、辅助小工具(Sqoop/Flume/Oozie/Hue等)
高阶技能6条:机器学习算法以及mahout库加MLlib、 R语言、Lambda 架构、Kappa架构、Kylin、Alluxio
三、学习规划
第一阶段(基础阶段)
- Linux学习
Linux操作系统介绍与安装、Linux常用命令、Linux常用软件安装、Linux网络、 防火墙、Shell编程等。 - Java 高级学习(《深入理解Java虚拟机》、《Java高并发实战》)
掌握多线程、掌握并发包下的队列、掌握JVM技术、掌握反射和动态代理、了解JMS。 - Zookeeper学习
Zookeeper分布式协调服务介绍、Zookeeper集群的安装部署、Zookeeper数据结构、命令。
第二阶段(攻坚阶段)
Hadoop、Hive、HBase、Scala、Spark、Python
第三阶段(辅助工具工学习阶段)
Sqoop、Flume、Oozie、Hue这些工具的学习
作者:Fickr孙启诚
链接:https://www.zhihu.com/question/24761255/answer/231162941
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
一、大数据工程师的技能要求
一、大数据工程师的技能要求
附上二份比较权威的大数据工程师技能图(图侵删)
总结如下:
必须技能10条:
01.Java高级(虚拟机、并发)
02.Linux 基本操作
03.Hadoop(此处为侠义概念单指HDFS+MapReduce+Yarn )
04.HBase(JavaAPI操作+Phoenix )
05.Hive(Hql基本操作和原理理解)
06.Kafka
07.Storm
08.Scala需要
09.Python
10.Spark (Core+sparksql+Spark streaming )
高阶技能6条:
11.机器学习算法以及mahout库加MLlib
12.R语言
13.Lambda 架构
14.Kappa架构
15.Kylin
16.Aluxio
成为一个大数据开发工程师的学习步骤?相关推荐
- 成为一个大数据开发工程师的学习步骤--文字版
本博客搬运自我知乎所出视频成为一个大数据开发工程师的学习步骤? - 知乎大数据的学习是有条件限制的,首先你需要是一名普通的工程师,如果你是Java工程师的话更好,但如果你是小-https://www. ...
- 如何成为阿里巴巴大数据开发工程师?你要学习很多东西
大数据大数据,个个都在喊 但究竟什么是大数据开发,如何成为一个大数据开发工程师?加米谷大数据请添加链接描述的这篇文章告诉你如何成为阿里巴巴也需要的大数据工程师. 大数据通用处理平台 1.Spark 2 ...
- 大数据开发工程师基本功修炼之史上最全Linux学习笔记(建议)
我正在参加年度博客之星评选,请大家帮我投票打分,您的每一分都是对我的支持与鼓励. 2021年「博客之星」参赛博主:Maynor大数据 (感谢礼品.红包免费送!) https://bbs.csdn.ne ...
- 一个优秀的大数据开发工程师的日常是怎么样的?
大数据开发工程师,看起来很高端.但很多时候都是脱离不了开发的层面,基本上大部分人都是api的调用者.除了少部分人是为了大数据开发的底层服务. 那么,作为优秀的大数据开发工程师是怎么样的体验呢,可以先聊 ...
- 大数据开发工程师学习路线分享
大数据是对海量数据存储.计算.统计.分析等一系列处理手段,处理的数据量是TB级,甚至是PB或EB级的数据,是传统数据处理手段无法完成的,大数据涉及分布式计算.高并发处理.高可用处理.集群.实时性计 ...
- 大数据开发工程师到底是干嘛的?日常做什么呢?
最近后台收到很多私信,内容大都差不多,总结下来就是: 目前在学习大数据专业,想提前了解一下大数据开发工程师的工作职责是怎么的?需要提前准备些什么?大数据分了哪些岗位? 笔者已从事数据开发工作三年有余, ...
- 数据仓库工程师、大数据开发工程师、BI工程师、ETL工程师之间有什么区别?
商务智能.商务智能工程师是商业智能行业的工程师.从需求分析师到数据仓库架构师.ETL工程师.数据分析工程师.报表开发工程师.数据挖掘工程师等,都可以称为BI工程师. ETL工程师:从事系统编程.数据库 ...
- 大数据开发工程师要求高么?有前景么
Python近段时间一直涨势迅猛,在各大编程排行榜中崭露头角,得益于它多功能性和简单易上手的特性,让它可以在很多不同的工作中发挥重大作用. 正因如此,目前几乎所有大中型互联网企业都在使用 Python ...
- 大数据开发工程师是做什么的?
大数据开发工程师要负责数据仓库建设.ETL开发.数据分析.数据指标统计.大数据实时计算平台及业务开发.平台建设及维护等工作内容.熟练掌握数据仓库.hadoop生态体系.计算及二次开发.大数据平台工具的 ...
最新文章
- Educational Codeforces Round 39 B Weird Subtraction Process
- vanpopup 高度_解决VantUI popup 弹窗不弹出或无蒙层的问题
- js如何改变HTML属性,javascript – 如何动态设置HTML lang属性?
- Activiti工作流入门
- 小米线刷包需要解压么_【连载】刷机教程之小米手机通用线刷教程
- Java商品信息查询
- CSS3实现小黄人动画
- vs2015-OpenGL绘制三角形
- Java容器-面试题
- wav格式的音频文件 16位转化成8位的
- 支付宝小程序日期选择组件datePicker封装
- centos----tftpd配置
- 让迁移不再开盲盒,让云也能省钱丨Hackathon 项目背后的故事第一期回顾
- nginx php多域名配置文件,配置文件,nginx_nginx多站点配置,无法通过域名访问,使用ip访问会跳转到其中一个站点,配置文件,nginx - phpStudy...
- 自信心受挫,该如何让项目团队成员重新振作起来
- Dedecms 火车采集器免登陆发布接口,自动生成上下篇、栏目页、首页
- python入门小项目 | 开发一个《小猫抓鱼》小游戏
- 2017京东校招终结者问题
- 【ZGC】为什么初始标记需要STW(stop the world) ?
- 双十一大促季,客服资源该如何合理配置
热门文章
- 个.十.百.千.万.亿.兆,后面是什么单位?
- python 遍历_python遍历列表
- java内省有什么作用_Java内省
- 关注我就能达到大师级水平,这话我终于敢说了
- swift编程语言基础教程 中文版
- RocketMQ(超级无敌认真好用,万字收藏篇!!!!)
- Vue表单验证为正整数
- win7升级为Win10 10586版本,出现应用商店打不开的解决办法
- Transformer Pytorch代码实现以及理解
- Visio 画括号等