java大数据开发是做什么的_3年Java开发转型大数据,如何跳出CRUD舒适区?
自我介绍
我是小张,不是科班出身,大学学的是生物工程,后来也是自学加培训入的行,入行就做了 3年的Java 开发,后来觉得大数据前景更好一些,就想着转型大数据,经过x哥指导后,在去年 7月份成功入职了一家大数据公司。
公司一般,不是大厂,不过目前我感觉还行吧,薪资涨了8K,而且我也算是大龄开发了,即将奔 3 ,工作前两年光顾着玩了,没想着规划,导致落下了很多东西,现在跟着大家一起努力,搞好大数据。
转型前
在做大数据之前,我做了快三年的 Java 后台开发,第一家公司也算是一家中规中矩的公司,没啥复杂业务场景,常年的 CRUD,基本也用不上算法跟数据结构的优化,常规的 Java Api 就足以应付日常需求了。
我想学大数据的想法萌生在去年国庆节那段时间,具体也没啥原因 就是感觉大数据未来可能会更好一些,同时也觉得转大数据有 java 基础会好转些,于是便在去年工作之余自学大数据了,当然 Java 未来也不差,最近火的微服务那一套掌握了也够吃得开了。
为什么转型
其实要说到为什么转型,这个还真没啥理由,可能是有些受当时热门技术的影响和薪资方面的影响吧。
在刷 Boss 招聘的时候,总感觉一般的大数据岗位比一般 java 岗位薪资要高,另外就是前些年的大数据热,各大高校也开了大数据课,时间也是成本啊,万一等新一届的大数据专业的大学生毕业了,到时候我就是再想转可能都没机会转了。
刚开始转型的行动和心理
说到刚开始转型的时候,其实心里特别没底的,最先的就是去网上找了大数据视频,一边看视频,一边学,要知道看视频效率是非常低的,但是没办法,总归人家视频中有一套体系,按着体系来学习总不会差太多,于是便开始了漫长的视频学习,整个视频看完大概花了3~4个月的时间,都是下班 或者 周末时间看的,说实话看完记住的真是不多,当时也没有什么好的办法,好在视频里也有对应的小项目可以做做,一来二去,跟着视频就到了年后。
最开始转型的时候最苦恼的就是没有规划,也没人问,不知道自己处于什么位置,漫无目的的跟着视频走效率也不高。
转型过程
过年的时候一次巧合我刷到了x哥的帖子,那上面公众号说有大数据的学习方法,一开始我是抱着怀疑的态度试试的,因为视频看的差不多了,打算就今年要出去面试了。之后要了份面经,边上班边刷面经,差不多一个月的时间吧,面经上那些简单的面试题算是掌握了,而那些源码级别的问题说实话我到现在也没弄明白。
之前光顾着按部就班地看视频,不知哪些是重点哪些是可以跳过的,看完也觉得似懂非懂,看项目视频的时候抓不到重点,无法与真实场景连接在一起。
要说准备转型的过程中的我觉得比较困难的点还是自己学习的时候没有方向感,没有重点。每个人的经历不一样,学的知识可能有很大差别,找到适合自己的才是最好的,知道自己的进度如何,知识体系差在哪,及时补充,这点非常重要。
面试过程
在去年7 8 月份的时候我面试了几家大数据公司,由于我是从 java 转过来的,侧重点包括了 java 和 大数据 ,面试对 java 基础和大数据的框架考察的比较详细,hadoop 读写、spark分区机制等是常问的面试题。
当然面试也肯定离不开项目,我是把自己工作经历加上了大数据的知识,这边感谢大疯哥帮忙整合项目,给了我一些方向和思路,结合自身项目的业务场景,离线、实时都有涉及。
由于我面的不是大厂,可能考察的知识并不是很深入,x哥规划的知识体系基本上覆盖了考察的知识点,剩下的就是结合业务场景来说说为什么使用某种技术,解决了啥问题之类的了。最后也是比较幸运,找到了比较合适的公司。
转型后日常工作
新入职的这家公司是做舆情分析的,到现在也差不多入职3个月了,我所在的组就叫数据组,主要负责两方面的工作:
1 实时数据的处理与落地,实时这块用的还是比较老的 jstorm+ rabbitMQ 的技术,整个数据处理过程包括 数据采集+数据预处理+NLP属性+搜索引擎,我就处于数据预处理的环节。
技术上相对来说并不是很难,但刚入职还是得多花时间,一般的问题通过百度都能找的到。难就难在处理的业务上,到现在我也还在熟悉业务,业务上有很多语义、舆情上的东西,随着工作的深入,业务熟悉也在加深吧。
2 离线数据的再分析,计算,我们这叫做数据回溯,就是用旧数据做一些 sql统计,没啥复杂的逻辑, hive 常规操作就搞定了,不会像专门搞数仓的那种各种连接,各种函数的。
3 还有就是各种集群的常规维护吧,多少要会点集群维护的东西,我们这是没有专门的数据运维,所以一些集群操作,都是我们组的自己来弄的。
其实,说到日常工作,对我来说还是比较有挑战性,毕竟技术栈都是新的,接下去还要接入一些新框架Flink这些来替代现在的框架。公司业务也很深,不过我觉得业务这东西对现阶段的我来说可能还不是硬实力,但多少得懂点,所以未来我还是想再学学技术,先把技术弄扎实了,到哪都能混下去嘛
经验总结
1.要说经验的话,如果你还是学生的话,抓紧在学校学习的机会,打好基础最重要。要是你是已经工作的兄弟的话,咱本来就没多少时间学习,如果自己学习效率不高的话,赶紧找人给做个适合自己的计划,时间成本也是很高的啊,有人带跟自己憋完全就是两个世界。
2.另外学习要注重平时积累,最好别搞突击战,不管是视频也好,文档也好,耐心跟着进度学下去,平时努力了,结果应该不会太差。
3.别裸辞,能在职学尽量在职,学的差不多再离职集中面试不迟。
4.转型成功不代表一劳永逸,而是新阶段的开始,要做好终生学习的准备。
最后
给大家分享一下我自己的学习路线和自学时收集的一些还不错的学习书籍、视频还有大数据面试题。
学习路线:
Hadoop
- 工作流程(Shuffle)
- 实现全局排序与局部排序
- 实现join操作
- 数据倾斜
- 单机架构
- 工作流程
- 资源如何配置
- 三种调度器
- 单机架构
- 读写流程
- 副本策略
- 单机环境中SNN如何工作
- HA架构
- 故障案例:例如block块损害该怎么修复
- 如何编译支持各类压缩
- HadoopAPI使用
- HDFS
- Yarn
- MapReduce
Zookeeper
- 单机/集群部署
- 过半机制
- 选举制度
Flume
- Source
- Channel
- Sink
- Interceptors
- Channel Selector
- Sink Precessors
- Taildir
- Exec
- Spooling
- Avro
- 自定义
- Memory
- File
- HDFS
- Logger
- Kafka
- Avro
- 自定义
- 架构
- 工作流程
Scala
- List
- Map
- Array
- Set
- case class
- 伴生对象/类
- 数据类型
- 方法和函数
- 循环
- 类和对象
- 集合以及算子
- 模式匹配
- 隐式转换
Spark
- DStream概念
- Source
- Transformations
- Output
- Performance Tuning
- Kafka对接方式以及消费语义
- DF/DS API
- 外部数据源
- Tuning
- 概念
- Transformations
- Action
- Cache
- 累加器和广播变量
- Shuffle源码实现
- 内存模型
- 支持CDH
- Building
- 架构以及工作流程
- RDD
- SQL
- Streaming
- Yarn提交作业流程以及如何提交
- Spark调优
Kafka
- 单机/集群部署
- 常用命令
- 核心概念
- offset管理
- 怎么保证数据一致性
- 调优
HBase
- HBase-CDH环境部署/单机部署
- 核心概念
- 逻辑/物理模型
- 架构以及读写流程
- RK设计
- 调优
需要获取书籍、视频的朋友:关注我帮忙转发一下文章,后台私信【资料】即可全部获取
以下是部分截图:
还有一些大数据方面的面试题,我已经整理成了一份文档想要获取的朋友,关注转发后私信【面试资料】即可
java大数据开发是做什么的_3年Java开发转型大数据,如何跳出CRUD舒适区?相关推荐
- 帆软报表在已经搭载服务器上开发_报表案例_数据报表开发_做报表的步骤_报表开发流程-帆软...
都说数据人很苦,可业务人也苦.不得已,我投诉了数据团队. 案例1:做一张报表,换了5个BI 背景:A负责的业务,以前业务指标单独计算.考核,不纳入公司整体业务. 后来业务体量大到足以影响公司大盘业务量 ...
- 大咖分享|蒋梦琴:浅谈数字化转型与数据治理
讲师介绍 蒋梦琴(点神),数澜科技华中交付部门负责人,10余年行业数据经验,兼任大数据资深架构师,擅长数据建模.数据治理.数据仓库.数据技术架构等领域,完成10余个数据中台建设项目.曾在万科集团.恒大 ...
- java 联通短信发送,做联通短信接口(JAVA)的开发遇到个有关问题
Java codepublic static ZxsSGIPSMProxy sgipProxy = null; /** * 用SGIP长连接发送联通短信 * * @param mobile * @pa ...
- java 蛋糕_1263: 你会做蛋糕吗?(Java)
参考博客 Description BobLee是个大吃货,喜欢吃好吃的,也喜欢做好吃的.比如做正方形的蛋糕.比如下图这个5*5的蛋糕. 图中的*号是代表BobLee放在上面的草莓.不仅如此,BobLe ...
- wps数据匹配怎么做_WPS表格如何实现跨工作表的数据引用
使用 vlookup 函数嵌套 INDIRECT 函数来实现跨工作表数据引用是怎样实现的呢?以下是学习啦小编整理的WPS表格实现跨工作表数据引用的技巧,供大家参考,希望大家能够有所收获! WPS表格实 ...
- 【方案开发】做一个血压计方案的设计开发
血压计方案测量准确,语音播报结果,大屏幕,显示更清晰,算法经过大量临床测试,更稳定等特点,另外对于此类方案,由于已经拥有成熟方案,可配合客户需求开发设计,可以在短时间内提供样品,以供客户测试功能.并且 ...
- java调用oracle存储过程_做一点,记一点 ~ Java调用Oracle存储过程
一.需求 传入一个参数,返回一条或多条记录(列表). 二.实现步骤 1. 编写Oracle存储过程. -- 声明包和包体的语句应该分两次执行,即使声明在前定义在后,如果一起执行依然会编译出错 --调用 ...
- 材料学博士转型大数据开发,是一种什么体验?
今天分享经验的是学习群一位即将毕业的材料学博士,他去年年底开始学的大数据,目前已成功入坑,也收了一些大厂的offer.要加学习群的同学可以扫描下方二维码,备注[加群],拉你进学习群. 一.自我介绍 本 ...
- 电网工作2年后考研,8面阿里,成功转型大数据开发
今天分享的是学习群的一个研二女生,她在国企电网工作两年后读研,随后零基础开始接触开发的学习,在春季实习的时候拿了一些大厂的大数据开发offer. 自我介绍 我原来是电气专业的,工作了两年,转的软件工 ...
- 日本留学生算法转型大数据开发?听他怎么说
一次成功的背后都是日月积累的运筹帷幄和脚踏实地的不懈努力. --记算法硕士留学生三个月自学上岸大数据 自我介绍 惯例先简单介绍一下自己的情况,本科是国内双非本的计算机专业,毕业后留学日本某 ...
最新文章
- 二十二、新人成才之路《做人七项原则 做一个节俭惜福的人》
- npm构建脚本_NPM脚本简介
- Java关键字系列(public,protected,private)
- 如何学习——为什么不想听课
- 动态锁定(每个帧特征捕捉实现)Python
- 悟透JavaScript (强烈推荐)
- python中的装饰器decorator
- 会议交流 - CNCC 技术论坛 | NLP中知识和数据怎么选?当然是全都要!——第四届中文信息技术发展战略研讨会...
- OpenCV辅助对象(help objects)(6)_InputArray和OutputArray
- 一汽奔腾b7o价位_全新第三代奔腾B70有何资格对合资品牌降维打击?
- git指令如何葱master转到dev_看完这篇还不会用Git,那我就哭了
- c 并发操作mysql_MySQL并发控制
- android 系统dialog的应用
- ArcGIS Runtime SDK for Android 100开发环境部署
- C语言开发《浪漫流星雨》表白程序,去年已经成功了
- 关于EmmyLua插件创建Lua脚本Require失败的问题
- Nexperia | 采用Trench肖特基二极管,实现功率密度的显著提升
- 怎么给计算机上锁键盘,想把笔记本电脑的键盘锁住,用外置键盘怎样做?
- 延时加载(lazy load)
- 一个更加强大的查壳工具, 更新版本
热门文章
- 埃森哲发布 2015 年五大 IT 趋势预测
- Android boot.img system.img ramdisk.img的解释
- rails debug
- 用c#创建支持多语言的WinForm应用程序 .
- Code snippet of the day : Get Chinese Spell in C#
- 可变序列和不可变序列——python小练
- html页面枚举 暴力,暴力枚举进程模块(示例代码)
- php 不通过表单post,php – 简单表单不通过_POST发送数据
- python qt 按钮实现拖放_[Python自学] PyQT5-控件拖拽、剪切板
- 鸿蒙系统麒麟970芯片支持,受鸿蒙系统影响,众多华为手机或要说再见,包括麒麟970机型!...