继续介绍大数据系列岗位要求,大数据运维可能是“技术含量最高”的职位之一,这里说的大数据运维主要是指hadoop生态体系方面的运维,在一些小公司或者传统行业的大公司也会使用oracle、db2等技术栈,在互联网行业数据量稍微大点的公司基本都是使用hadoop技术栈,像在电信或者银行领域基本上是oracle/db2、hadoop同时使用。

该文章默认是指hadoop生态技术体系,这个职位之所以说可能是“技术含量最高”,主要有2方面的因素:一,数据量和计算量的大小与运维同学的能力是呈现指数关系,当数据量不大的时候一个现学现卖的同学都可以搞得定,当数据量像BAT的量级时,这就是需要摩拜的技术大神;二,跟运维同学本身的自我要求有关,如果仅仅是看网上的教程或者使用cdh的一键安装确实没什么难度,特别是数据量不是很大的情况下,但是一个高自我要求的同学,去研究hadoop生态体系,看各种文档以及源码,这个还是非常有难度的,这是大神成长的必经之路。老套路先从几个大厂的岗位要求说起。

有赞

1、精通基于Linux系统的常用服务配置,快速部署;熟悉RHEL或CentOS系统,理解RHEL系统规范,了解epel的rpm打包规范

2、熟悉OS工作原理,掌握常用系统性能诊断工具;对CPU、MEM、IO、NET四大子系统内核参数以及程序性能优化有实战经验者优先

3、熟悉Hadoop生态常用开源项目的部署升级、扩容缩容、性能和管理优化、问题排查等(主要包括Hadoop/Zookeeper/HBase/Hive、Spark、Presto/Kafka、Flume/DataX、Sqoop/Storm、Flink等)

4、熟悉JVM,熟悉大数据周边并有实践经验者优先(主要包括 数据系统:MySQL,Redis,Elasticsearch,NewSQL等;机器学习:TensorFlow等)

5、熟练使用shell及python,并有一定开发经验;有过相关运维管理平台或自动化部署系统开发经验者优先

6、良好的沟通合作能力,热爱技术并善于钻研。能主动思考,有解决疑难问题的毅力和决心

盈盈集团

1、熟悉Hadoop、HBase、Kafka、Hive、Spark等组件的工作原理,并有3年以上Hadoop生态系统维护经验;

2、搭建、调优并维护过spark、Hive、Storm、Kafka、Redis等服务;

3、熟悉Linux开发环境,熟练掌握Java/scala/python等任一编程语言,编码能力优秀

4、能够阅读开源组件源码,手动编译、安装过patch、更改过组件源码且应用于生产环境者优先;

5、熟悉分布式系统设计范型,有大规模系统设计和工程实现者优先;

6、有CDH安装部署及运维经验者优先

7、本科及以上学历者优先

橙鹰

1、熟悉 nginx/haproxy 负载均衡,能基于 nginx 做一些插件开发

2、有mysql 数据库使用和维护经验,有使用 pg 优先

3、熟悉 php,lua 编程语言的优先

4、熟悉并参于过开源系统如zabbix,ganglia,kong网关的优先

5、具有良好的心理素质,能承受一定的压力。

6、具有良好的沟通能力,乐于分享,与团队成员分享最佳实践,共同进步。

个推

1、掌握Linux操作系统的配置,管理及优化,能够独立排查及解决系统层的各类问题;

2、熟悉Hadoop/HBase/Hive/Spark/Kafka/Zookeeper等开源项目的安装与调试,升级扩容和优化;

3、至少精通 Perl/Python/Shell脚本语言中的一种;

4、具备较强的逻辑思维能力、学习创新能力、数据分析能力,以及良好的沟通技巧和团队合作能力,性格开朗有较强抗压能力;

5、全日制本科以上学历,计算机相关专业;

6、5年以上运维经验;

网易

1、本科及以上学历,计算机相关专业;

2、2年以上系统运维或开发经验,熟悉Hadoop/Spark/HBase等大数据系统,有大数据平台运维或开发经验者优先;

3、熟悉Linux操作系统,熟悉Java,熟练使用Shell/Perl/Python/Ruby中至少一种语言;

4、良好的学习能力、逻辑分析、问题排查能力;

5、良好的团队合作者,善于沟通,较强的抗压能力。

能力三核模型分析

大数据运维能力三核

综合结果如下

知识

1、本科及以上学历(3)

2、计算机相关专业(2)

3、熟悉Hadoop、HBase、Kafka、Hive、Spark等组件的工作原理(1)

硬技能

1、熟悉/精通linux操作系统(4)

2、熟悉hadoop/hbase/hive/spark/kafka/storm等大数据开源系统部署、升级、扩容、优化等(4)

3、熟练掌握java/python/shell/perl/php等至少一种开发语言(5)

4、2年以上运维经验(3)

5、有CDH安装部署及运维经验(1)

6、有相关运维管理平台或自动化部署系统开发经验(1)

才干or 软技能

1、良好的沟通能力(4)

2、良好的团队合作能力(3)

3、良好的学习能力(4)

4、良好的解决问题能力(2)

5、良好的抗压能力(3)

6、良好的逻辑思维能力(2)

岗位职责

1、负责大数据平台部署、维护、管理、优化、规划等,包括但不限于Hadoop、Hdfs、HBase、Hive、Spark、Storm、Kafka等系统(5)

2、保障大数据平台稳定性和可靠性(4)

3、开发监控报警平台(3)

4、建设自动化部署及运维工具(2)

5、给业务提供技术支持及优化(2)

个人经验

是否需要设立大数据运维这个职位跟是否自建大数据平台直接相关,上面5家公司至少都是中型公司,从岗位职责来看都是自建大数据平台的。而是否自建大数据平台,什么时候自建,什么时候用第三方云平台(比如阿里的数加),则是一个仁者见仁智者见智的问题。个人经验建议下面3个场景符合之一则暂时不用自建:1)公司创业阶段;2)数据量规模不大;3)数据建设刚起步阶段,想快速见效阶段。当然老板的眼界和魄力不同,则另外一说。当公司老板决定建立大数据团队的那一刻,就决定了这是一笔不菲的投入,不管是自建数据平台还是使用第三方云平台(友情提醒创业老板们)。

对于决定自建数据平台的公司来说,大数据运维这个职位基本也就确定了的。现在大数据运维职位在一般公司内还处于模糊阶段,比如岗位要求都是写要熟悉或者精通Hadoop、Hdfs、HBase、Hive、Spark、Storm、Kafka等技术栈,一个普通的工程师短时间内很少能研究这么多系统,况且这些系统的技术更新迭代又非常的快,既然这种人这么少,为啥又都这样要求呢?原因很简单,这就是这个行业发展阶段和认知水平。其实在BAT已经是按照不同系统在细分了,比如有专门负责hbase的同学,有专门负责hive的同学等。

对于有意向该岗位的同学要有极高的自我学习能力和要求,而且不能间断,这是一条不折不扣技术之路。

系列文章

python大数据运维常用脚本_大数据岗位要求之大数据运维相关推荐

  1. oracle 运营维护_Oracle数据库日常运维常用脚本

    大 中 小 Oracle数据库日常运维常用脚本 1 查看所有数据文件 select file_name from dba_data_files union select file_name from ...

  2. 2022年最新运维常用脚本学习

    以下是常用脚本,由简单到复杂,赶紧收藏起来. 目录 一.日志备份 二.监控内存和磁盘容量,小于给定值时报警 三.检测当前用户权限 四.自动创建相应的账户及配置密码 五.输入三个数并进行升序排序 六.石 ...

  3. 大数据产品开发流程规范_华为内部资料流出!揭秘华为数据湖:3大特点、6个标准、入湖流程...

    点蓝色字关注"云技术" 导读:数据湖:实现企业数据的"逻辑汇聚". 作者:华为公司数据管理部来源:大数据DT(ID:hzdashuju)01 华为数据湖的3个特 ...

  4. 用python写的登录界面的脚本_记录 制作校园网登陆脚本 python编写 附源码

    5 importos6 importre7 8 classAOA(object):9 #获取本机IP 10 defget_ip(self):11 try:12 s =socket.socket(soc ...

  5. 数据可视化机器学习工具在线_为什么您不能跳过学习数据可视化

    数据可视化机器学习工具在线 重点 (Top highlight) There's no scarcity of posts online about 'fancy' data topics like ...

  6. mysql数据转存到时序数据库_干货丨如何高速迁移MySQL数据到时序数据库DolphinDB...

    DolphinDB提供了两种导入MySQL数据的方法:ODBC插件和MySQL插件.我们推荐使用MySQL插件导入MySQL数据,因为它的速度比ODBC导入更快,导入6.5G数据,MySQL插件的速度 ...

  7. 二维分类教案_幼儿园中班数学教案中班数学教案二维排序——师乐汇幼儿教师教育网...

    中班数学教案:二维排序 一.活动目标: 1. 在分类的基础上初步运用二维排列表进行物品放置. 2. 通过场景设置.温故知新由易到难的课程安排,幼儿能积极参与大胆表达并且根据表格来进行物品放置. 3.在 ...

  8. python大数据运维常用脚本_python大数据运维

    {"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],&q ...

  9. 生物信息学python常用脚本_生物信息学一些基本的常用软件有哪些?

    7月28日更新 :原链接失效了,已经更新. 上次回答的时候基因课的视频教程还是个人兴趣,业余时间录的,免费放到网上. 今年辞职全职做这个事情了,所以收费.只有收费才能保证内容精良和持续输出.每门课程也 ...

最新文章

  1. android释放acitity内存,Android 内存泄漏分析与解决方法
  2. 2017《面向对象程序设计》寒假作业一
  3. 分布式事务篇——第二章:分布式事务解决之2PC剖析
  4. Xamarin.Android 使用Timer 并更改UI
  5. Spring Cloud微服务实战:外卖订餐系统
  6. .NET Core中的认证管理解析
  7. HDFS的特性以及如何保证数据的一致性
  8. 线性表:链栈算法实现
  9. linux服务器时间乱码问题解决
  10. LINUX入侵检测指导
  11. java calendar 时分秒_Java中Calendar类的常用方法(对时间进行计算的类)
  12. 下载的****.ts格式的视频在迅雷播放器中无法播放
  13. 数据结构c语言版秦锋,数据结构(C语言版)黄国瑜.pdf
  14. iOS UITextView字数限制 拼音
  15. 福利福利!来自阿里巴巴的26款超牛Java开源项目!
  16. 【Review】数据结构线性表,数组算法(串模式匹配克鲁德、螺旋矩阵四墙)
  17. Tableau中的LOOKUP函数
  18. 杰理之音箱版本 SDK200 单音 VCOMO 直推,喇叭没声音问题【篇】
  19. 塔米狗企业并购与投融资信息服务平台
  20. bugfix: 待机休眠arm电压保持在1.2v(希望降到1v)

热门文章

  1. 老生常谈:中文输出出现乱码问号的问题
  2. 【Django基础01】_环境搭建和后台管理
  3. 千兆模块还是万兆模块怎么区分
  4. 揭秘360手机助手未经用户同意,自动开启辅助功能的“黑科技”
  5. 面试官:你能说说 Nacos 的实现原理吗?
  6. 黑苹果键盘键盘驱动_苹果糟糕的键盘以及为何可维修性如此重要
  7. 华为交换机常用功能配置
  8. c++ win窗口消息演示
  9. 讯琥科技与VoerEir AB 达成战略合作,受邀加入Linux Foundation 旗下项目Akraino
  10. 浅谈js原型和原型链