企业要开展大数据相关业务,首先就需要基于自身的需求,来设计搭建数据系统平台。而大数据系统平台的搭建,需要基于实际需求,来进行系统架构规划。今天我们就从大数据平台开发的角度,来对大数据系统架构模块做一个简单的介绍。

  在实际的业务场景当中,每个公司的需求是不一样的,因此大数据平台开发需要选择适合自己的技术框架,在实际工作当中,这部分工作往往有兼具经验和实力的大数据工程师或者大数据架构师来完成。

  通常来说,一个大数据系统架构通用的模块包括——

  数据收集模块:主要负责收集各种数据源的数据,包括日志文件、网络请求、数据库、消息队列等,并将这些数据转换为文件或者消息向后传递。

  数据转存模块:主要负责将数据定时传递到分布式存储或者实时传递给下游的数据处理程序。

  ETL模块:主要负责数据的清洗、格式和内容的处理和转换、数据分级分拣、加载至数据仓库等。

  数据仓库模块:这是整个架构的核心,数据仓库是数据有组织的集中存储的地方,负责数据的存取和管理。

  元数据管理模块:主要负责记录和约束数据仓库中数据的含义和格式,控制着数据的生命周期和数据质量。

  分析引擎模块:数据分析师交互最多的模块,主要负责执行各种分析语句或代码,完成各种分析任务。

  作业管理与调度模块:负责分析作业的管理和定时调度,包括作业的增删改查、查看修改历史、设置调度定时和执行引擎等。

  资源分配与调度模块:主要负责在多作业同时运行的场景下,有效协调和分配集群的资源,使资源利用率最大化。

  当然,这些模块并不一定每个企业的架构都是如此,始终还是需要基于实际的需求来进行技术选型。

  大数据系统架构工作,对专业技术的深度和广度,以及项目实操经验,都有相应的要求,大数据架构师,也是做开发方向的高级技术岗位。

大数据系统架构模块解析相关推荐

  1. 大数据平台开发:大数据系统架构模块解析

    企业要开展大数据相关业务,首先就需要基于自身的需求,来设计搭建数据系统平台.而大数据系统平台的搭建,需要基于实际需求,来进行系统架构规划.今天我们就从大数据平台开发的角度,来对大数据系统架构模块做一个 ...

  2. 大数据系统架构的通用模块有哪些

    企业要开展大数据相关业务,首先就需要基于自身的需求,来设计搭建数据系统平台.而大数据系统平台的搭建,需要基于实际需求,来进行系统架构规划.下面来对大数据系统架构模块做一个简单的介绍. 通常来说,一个大 ...

  3. 大数据系统架构-MPP数据库架构

    当前的大数据系统架构主要有两种:一种是MPP数据库架构,另一种就是Hadoop体系的分层架构.这两种架构各有优势和适合的场景.另外随着光纤网络通信技术的发展,大数据系统架构正在向着存储与计算分离的架构 ...

  4. 两种主流大数据系统架构的区别,终于有人讲明白了

    导读:从资源管理角度来看,当前的大数据系统架构主要有两种:一种是MPP数据库架构 ,另一种是Hadoop体系的分层架构.这两种架构各有优势和相应的适用场景.本文主要讲这两种架构的区别. 同样都可以处理 ...

  5. 大数据系统架构包含内容涉及哪些?

    大数据系统架构包含内容涉及哪些? [导语]大数据的应用开发过于偏向底层,具有学习难度大,涉及技术面广的问题,这制约了大数据的普及.大数据架构是大数据技术应用的一个非常常见的形式,那么大数据系统架构包含 ...

  6. 大数据系统架构之降龙八式

    大数据系统架构之降龙八式: 第一式之linux 加固:包括安装,防火墙,网络,ssh,ddos,syn攻击等 第二式之linux 调优:包括 内核优化,cpu,内存,虚拟内存,tcp 等 第三式之存储 ...

  7. 阿里首度公开大数据系统架构《大数据之路:阿里巴巴大数据实践》来了

    絮絮叨叨了很久,说阿里数据要出书.每天被催,什么时候写好,什么时候出版.终于,千呼万唤始出版了!!!! 点击阅读详情,即刻试读!!! 曾鸣教授作序 CSDN.ChinaUnix.ITPUB.segme ...

  8. Hadoop大数据系统架构(深入浅出)

    目录 1. Hadoop生态体系 2. Hadoop集群硬件架构 3. Hadoop体系分层功能架构 参考资料 导读: 从资源管理角度来看,当前的大数据系统架构主要有两种:一种是 MPP数据库架构 , ...

  9. “NASA”计划背后,阿里巴巴大数据系统架构概述

    免费开通大数据服务:https://www.aliyun.com/product/odps DT时代,人们比以往任何时候都收集到更多的数据.据IDC报告,预计到2020年,全球数据总量将超过40ZB( ...

最新文章

  1. 头条一面:Spring IOC容器中只存放单例Bean吗?
  2. 土耳其最大光伏电站成功并网
  3. AVL树和红黑树区别
  4. 成功解决pywintypes.com_error: (-2147352567, '发生意外。', (0, 'Kingsoft WPS', '文档保存失败。', '', 3011, -214746725
  5. 彻底搞懂浏览器Event-loop 1
  6. 电脑rar文件打开方式_怎么压缩文件,如何压缩文件?压缩软件哪个好?
  7. memcached在大负载高并发网站上的应用(一)
  8. HDU 5427 A problem of sorting 水题
  9. css 里层元素撑不开外层元素
  10. 记一次docker安装rabbitMq-(简单至极)
  11. 深入理解C语言指针的奥秘
  12. 顺式作用元件包括_顺式作用元件的结构组成
  13. header元素的使用
  14. 海康萤石云 H5移动端和PC端云播放本地监控摄像头
  15. 黑猴子的家:Minimal Install VS Server with GUI VS GNOME Desktop
  16. 程序员副业之如何利用空余时间从博客中赚钱?
  17. hdu4889 spfa(造数据卡spfa
  18. pyaudio usb playback_利用python工具包pyaudio实现录音
  19. Windows 10系统下查看硬盘类型的方法
  20. 零基础自学软件测试,第一份外包工作8K,到现在大厂月薪25K*16薪

热门文章

  1. 分享:开源货币新世界
  2. 程序员面试金典——5.5整数转化
  3. 程序员面试金典——1.3确定两串乱序同构
  4. Caffe中merge卷积和bn层的原理
  5. python 计算流形上两点之间的测地距离
  6. [面试] 删除多余的数组内容
  7. Redis使用详细教程
  8. 【读书】《当我跑步时,我谈些什么》书评:我跑步时,只是跑着
  9. 前端解决第三方图片防盗链的办法 - html referrer 访问图片资源 403 问题
  10. for循环、while循环、break跳出循环、continue结束本次循环、exit退出脚本