“无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。”。

1 写 SQL

(很多入职一两年的大数据工程师主要的工作就是写 SQL )

2 为集群搭大数据环境

(一般公司招大数据工程师环境都已经搭好了,公司内部会有现成的大数据平台,但我这边会私下搞一套测试环境,毕竟公司内部的大数据系统权限限制很多,严重影响开发效率)

3 维护大数据平台

(这个应该是每个大数据工程师都做过的工作,或多或少会承担“运维”的工作)

4 数据迁移

(有部分公司需要把数据从传统的数据库 Oracle、MySQL 等数据迁移到大数据集群中,这个是比较繁琐的工作,吃力不讨好)

5 应用迁移

(有部分公司需要把应用从传统的数据库 Oracle、MySQL 等数据库的存储过程程序或者SQL脚本迁移到大数据平台上,这个过程也是非常繁琐的工作,无聊,高度重复且麻烦,吃力不讨好)

6 数据采集

(采集日志数据、文件数据、接口数据,这个涉及到各种格式的转换,一般用得比较多的是 Flume 和 Logstash)

7 数据处理

7.1 离线数据处理
(这个一般就是写写 SQL 然后扔到 Hive 中跑,其实和第一点有点重复了)
7.2 实时数据处理
(这个涉及到消息队列,Kafka,Spark,Flink 这些,组件,一般就是 Flume 采集到数据发给 Kafka 然后 Spark 消费 Kafka 的数据进行处理)

8 数据可视化

(这个我司是用 Spring Boot 连接后台数据与前端,前端用自己魔改的 echarts)

9 大数据平台开发

(偏Java方向的,大概就是把开源的组件整合起来整成一个可用的大数据平台这样,常见的是各种难用的 PaaS 平台)

10 数据中台开发

(中台需要支持接入各种数据源,把各种数据源清洗转换为可用的数据,然后再基于原始数据搭建起宽表层,一般为了节省开发成本和服务器资源,都是基于宽表层查询出业务数据)

11 搭建数据仓库

(这里的数据仓库的搭建不是指 Hive ,Hive 是搭建数仓的工具,数仓搭建一般会分为三层 ODS、DW、DM 层,其中DW是最重要的,它又可以分为DWD,DWM,DWS,这个层级只是逻辑上的概念,类似于把表名按照层级区分开来的操作,分层的目的是防止开发数据应用的时候直接访问底层数据,可以减少资源,注意,减少资源开销是减少 内存 和 CPU 的开销,分层后磁盘占用会大大增加,磁盘不值钱所以没什么关系,分层可以使数据表的逻辑更加清晰,方便进一步的开发操作,如果分层没有做好会导致逻辑混乱,新来的员工难以接手业务,提高公司的运营成本,还有这个建数仓也分为建离线和实时的)

总之就是离不开写 SQL …

大数据工程师的日常工作内容相关推荐

  1. 大数据工程师的日常工作内容是干嘛?

    本文来源:知乎 大家好,我是脚丫先生 (o^^o) 最近小伙伴们,有问到大数据工程师岗位平常的日常工作都是干嘛的? 大数据或者说想入门大数据,技术肯定是第一重要的,不会大数据的技术谈什么大数据.那么大 ...

  2. 一个大数据工程师的日常工作内容都是什么?

    大数据工程师工作内容取决于你工作在数据流的哪一个环节. 从数据上游到数据下游,大致可以分为: 数据采集 -> 数据清洗 ->数据存储 ->数据分析统计 ->数据可视化等几个方面 ...

  3. 大数据工程师的日常工作是什么?要掌握哪些核心技术?

    很多人都听过大数据工程师,但却很少人知道他们是做什么的?下面就带大家一起来了解一下大数据工程师的日常. 如果你对大数据感兴趣,下面的内容你一定要看看: 大数据工程师是做什么的? 分析历史.预测未来.优 ...

  4. 大数据工程师需要学习哪些内容

    大数据开发对于Java语言的依赖程度比较高,如果想尝试大数据开发,学习过Java语言就很容易上手 Java是目前使用广泛的编程语言之一,具有的众多特性,特别适合作为大数据应用的开发语言. 目前很多大数 ...

  5. 2022年大数据工程师薪资和工作趋势

    如果您对数字.数据和技术有浓厚的兴趣,那么数据工程师的职业就是您的最佳选择! Gartner 2021 年 4 月的一份报告预测,到 2022 年,全球超自动化经济将达到近6000亿美元,而帮助实现这 ...

  6. 大数据职业理解_到底什么是大数据,大数据职业的具体工作内容是什么?

    综合网络解释加上自己的理解给出了大数据的定义. 大数据就是数据规模达到海量级.极快的速度流转.数据类型和来源多种多样.价值密度低而且能够反映事物真实性的数据就是大数据. 大数据的工作内容包括以下几个方 ...

  7. 运维工程师的日常工作内容

    第一式.监控报警报表 ①没有监控就是不知己,不知己每战必殆. ②没有报警就是不能兼听,不兼听就不明. ③没有报表,反正Leader不高兴,其他的也没啥吧,毕竟像杰夫·贝佐斯与张小龙这样的Leader很 ...

  8. 数据科学工作者(Data Scientist) 的日常工作内容包括什么?

    作者:阿萨姆 众所周知,数据科学是这几年才火起来的概念,而应运而生的数据科学家(data scientist)明显缺乏清晰的录取标准和工作内容.即使在2017年,数据科学家这个岗位的依然显得" ...

  9. 大数据工程师如何实现技术成长?

    2017-10-19阅读 5009 大家好,我是Talkingdata的闫志涛,很高兴能参加100offer举办的知乎Live的分享. 本次 Live 主要包括以下内容 在 Talking Data ...

最新文章

  1. Python将classification_report的结论转化为字典(dict)形式并提取模型的灵敏度(sensitivity)、特异度(specificity)、PPV和NPV指标、混淆矩阵图
  2. 第六章 贪心 【完结】
  3. TP框架对数据库的基本操作
  4. 【Android OpenGL ES 开发 (零)】创建一个新的工程
  5. webvie使用--官方api
  6. 衡量高分辨率图片生成效果的指标PSNR/SSIM
  7. 联想G480黑苹果试玩纪录
  8. LayaBox---Dialog弹窗
  9. 基于Nginx,搭建HLS(HTTP Live Streaming)server,点播直播
  10. Lighttools中模拟白光LED
  11. github、npm、Stack Overflow...... 一键加速 【支持多平台】
  12. WPF 方块按钮 仿照360
  13. Unity-ShaderGraph制作2D动画精灵发光
  14. SqlServer中的dbo是什么意思?[转]
  15. [ZZ]AppiumForWindows 菜鸟计划合集
  16. word 模板的位置
  17. css html模板下载插件
  18. 应用程序配置不正确,程序无法启动的问题小结
  19. 【安全攻防系列 Windows实战】教你如何 FTP暴力破解、四大病毒勒索病毒、蠕虫病毒、ARP病毒、挖矿病毒,怎么处理应急场景
  20. 广深IT之行:传统模式与技术创新的融合

热门文章

  1. c语言fwrite 换行
  2. RGB-D图像(深度图像)的Surface编码
  3. 关于微信静默登陆和OAuth2
  4. unity获取脚本组件_获取物件脚本、变数、名称
  5. 哈工大毕设体验记录-使用ZYNQ MPSoC开发板实现的Linux环境千兆以太网C语言UDP协议批量文件存取(上)
  6. Android 获取应用文件的路径即 /data/data/youPackageName/files
  7. 10分钟 GET 新技能 - 协程
  8. 如何设计 Java 框架?– 一个简单的例子
  9. 私彩视频开奖动画直播源码内部核心技术解析及修改可增加后台操控-持续更新文章!
  10. 微信鉴权服务器地址,授权 | 微信开放文档