系列文章目录


文章目录

  • 系列文章目录
  • 前言
  • 一、功能概述
  • 二、使用步骤
    • 2.1 安装
    • 2.2 监控
    • 2.3 管理
    • 2.4 用户管理
    • 2.5 应用市场
    • 2.6 操作系统
  • 三、总结

前言

做大数据有几年了,这些年耳濡目染了一些大数据管理平台的使用,但是或多或少使用起来,都不怎么方便,所以决定自己来实现一个简单的大数据平台


一、功能概述

大数据应用组件往往很多,可能几百台服务器组成一个Hadoop集群,当部署这些节点时,需要一个节点一个节点的操作,简直不敢想象。同时在这些服务器上可能还部署着Spark、Flink、Hive、Hbase、ES等很多很多的组件,有时一个节点出问题,如果不即使发现处理/可能会引起一系列问题,而如果想关闭一些节点,或迁移某些节点,则需要运维人员手动去操作,当需要操作的节点很多的时候,就很耗费人力资源。为解决此类问题,大数据管理平台就出现了。

一个比较完善的大数据平台,应该包含有如下功能:

具体包括:

  • 能一键安装大数据产品
  • 能管理/监控多台服务器
  • 能监控到各个大数据产品的运行状况
  • 能在主页面上管理各个产品,并对其操作
  • 有个shell,可以远程操作服务器
  • 能安全管理各个用户/用户组/权限/角色等

前4个是基本的功能,第五个待后续更新

二、使用步骤

2.1 安装

已目前业内比较通用的大数据产品,包括zk,hdfs,yarn,hive,hbase,es等,各个产品的部署方式不同,需要的配置文件操作步骤都不相同,所以必须抽象出一个通用的组件来达到可以满足任何新组件的要求。

  • 环境的配置
    linux环境必须统一,因此在部署前必须做环境检查

    • 首先是系统版本
      第一阶段,我们要求系统版本为CentOS7.x
    • CPU/内存
      要求X86架构和最低8G的内存
    • 硬盘
      不做硬性要求,但至少要有足够大的根分区
    • 网卡
      百兆网卡及以上
    • 分区
      不做硬要求
    • 密码
      每个服务器最好都统一
    • 数量
      为组成集群,要求服务器数量至少三台
  • 架构
    我们以master/slave方式部署,为高可用,我们使得每个服务器,既是master,又是slave,即使又宕机,也可以迅速切换。

2.2 监控

  • 我们需要实时的监控各个组件的运行状况,分别用绿/黄/红代表组件的可用度
  • 当组件出现问题时能及时的发出通知
  • 实时展示组件运行中出现的异常日志,并提供搜索功能

2.3 管理

大数据平台,应当可以对组件进行如下操作:

  • 组件整体关闭
  • 组件整体启动
  • 组件某个角色的关闭/启动
  • 组件某个角色更换节点
  • 组件的删除
  • 组件的升级
  • 组件配置文件/参数的修改

2.4 用户管理

应当提供基础的用户登录/权限控制

2.5 应用市场

需提供组件安装包的上传/版本控制/hotfix修复/镜像包构建

2.6 操作系统

如果使用传统的安装方式,不方便应用的隔离,所以我们采用kubernetes + docker的方式,构建一个简单的操作系统,组件的安装/迁移等,都通过k8s的接口来实现

三、总结

本篇文章主要介绍了大数据平台的基本作用和一个必要的功能,通过此概述,我们大概可以了解到一个比较完善的大数据平台,会在工作、学习中大大提高效率

大数据管理平台(一)概述相关推荐

  1. Cloudera Manager大数据管理平台介绍

    简介 Cloudera企业解决方案包括Cloudera Hadoop发行版(Cloudera's Distribution Including Apache Hadoop,简称CDH),Clouder ...

  2. 浪潮云跻身中国政务大数据管理平台市场领导者位置

    近日,IDC正式发布<IDC MarketScape: 中国政务大数据管理平台市场厂商评估,2021>报告,对市场主流代表性厂商进行研究分析.研究结果显示,在战略布局.发展能力.市场份额等 ...

  3. 南沙发布全国首个智慧城市物联网大数据管理平台

    记者从近日举行的2017广州国际照明博览会(光亚展)上获悉,由中科院孵化的南沙企业--中科智城软件有限公司正式发布了其研制成功全国首个"智慧城市物联网大数据管理平台"(以下简称&q ...

  4. ktv管理系统_著作权大数据管理平台开始公测 或将解决KTV行业版权困扰

    因为版权问题,KTV一度被要求下架许多歌曲,这给KTV经营者带来了不小的困扰.随着"著作权大数据管理平台"公测的推进,大数据.人工智能等技术或许将消除这一现象,KTV行业将迎来和谐 ...

  5. 大数据管理平台助力精准扶贫 “建始经验”将在全省推介

    如何在规定时间内实现精准扶贫.精准脱贫,打赢脱贫攻坚战.与全省同步全面建成小康社会?建始县建立精准扶贫大数据管理平台,助力脱贫攻坚的做法,受到肯定.近日,省委办公厅刊发简报推介这一经验,要求各地各部门 ...

  6. 云南省依托大数据管理平台反映扶贫工作 实现精准监督常态化

    据悉,近日云南省创新监督方式,建立全省精准扶贫大数据管理平台,通过扶贫对象.扶贫措施.扶贫成效等功能模块直观反映贫困对象.措施及成效,确保民生监督与脱贫攻坚实现精准对接,实现了政策宣传.精准识别.项目 ...

  7. 国产自研开源大数据管理平台DataSophon Manager安装教程

    简介 DataSophon是近日开源的一款国产自研大数据管理平台,致力于快速实现部署.管理.监控以及自动化运维大数据服务组件和节点的能力,帮助你快速构建起稳定.高效的大数据集群服务. 主要有以下特性: ...

  8. 【ECharts系列|03可视化大屏】大数据管理平台实时展示

    基于echats实现可视化大数据管理平台实时展示. 完整html+css+js+json+font+video:https://download.csdn.net/download/weixin_41 ...

  9. 深入解析DC/OS 1.8 – 高可靠的微服务及大数据管理平台

    http://blog.csdn.net/popsuper1982/article/details/52736084 深入解析DC/OS 1.8 – 高可靠的微服务及大数据管理平台 大家好,欢迎大家参 ...

最新文章

  1. linux内核PID管理--命名空间
  2. 获取客户端IP和MAC地址
  3. php汽车配件管理系统,汽配仓库管理系统_汽配库存管理系统
  4. 为什么多对多关系需要建立中间表_中间表是什么?和报表有什么关系?会带来怎样的问题?又如何解决?...
  5. Vue文件的缩进改为4个空格
  6. 可能用得上的jquery 插件
  7. 计算器小程序java课程设计,java课程设计----计算器小程序报告.doc
  8. 如何使用SQL Server配置管理器
  9. 本地计算机上的MSSQLSERVER服务启动后又停止了。一些服务自动停止,如果它们没有什么可做的,例如“性能日志和警报“服务。...
  10. 人工智能之入门大数据
  11. 【开发工具集】功能强大的网络设置工具——IPOP
  12. VMware卸载不干净导致安装VMware报错(无法安装服务vmware Authorization server请确保你有足够的权限)
  13. Windows 7可以拯救微软Netbook市场
  14. oracle12c数据库命令,oracle 12c 常用命令
  15. Linux kernel panic问题解决方法
  16. Linux运维之道-基础命令
  17. Echart颜色设置
  18. 洲际酒店集团宣布云南迪庆月光城英迪格酒店正式揭幕
  19. Esxi 6.7基于已有数据存储配置虚拟机(Windows类)间共享存储(非RDM)
  20. debian Squeeze 安装Rhythmbox音乐播放器,mplayer,smplayer视频播放器.

热门文章

  1. Discuz!论坛实现帖子回复可见内容功能
  2. 一个芯片工作的基本条件
  3. 中国的数字化转型 China’s digital transformation
  4. 12枚硬币中取1枚假币的问题
  5. RedisTemplate Pipeline 管道使用
  6. win10下C盘分区扩容后, 系统不显示新增磁盘空间的处理办法
  7. 如何使用media-server搭建DASH服务
  8. 毕业季!清北毕业生都去哪了?
  9. ubuntu清理缓存
  10. 要做差异性分析,如何选择正确的统计方法?