简介

Cloudera企业解决方案包括Cloudera Hadoop发行版(Cloudera’s Distribution Including Apache Hadoop,简称CDH),Cloudera Manager(CM)等。概括起来说,Cloudera提供一个可伸缩,稳定的,综合的企业级大数据管理平台,它拥有最多的部署案例,提供强大的部署,管理和监控工具。Cloudera Manager提供Admin Console,这是基于Web的用户界面,使得企业数据管理更加容易方便。Coudera Manager易于升级和安装Hadoop组件,还提供了在几分钟之内建立集群主节点的高可用(High Availability)。它还包括Cloudera Manager API,可用来获取集群运行状态以及配置Coudera Manager。

Cloudera Manager有四大功能:
(1)管理:对集群进行管理,如添加、删除节点等操作。
(2)监控:监控集群的健康情况,对设置的各种指标和系统运行情况进行全面监控。
(3)诊断:对集群出现的问题进行诊断,对出现的问题给出建议解决方案。
(4)集成:对hadoop的多组件进行整合。

Cloudera Manager概述

Cloudera Manager(简称CM)是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控管理的组件,对集群中主机,Hadoop,Hive,Spark等服务的安装和配置做了极大的简化。他是Hadoop集群的软件分发及管理平台,通过它可以快速部署好一个Hadoop集群,并对集群的节点及服务进行实时监控。详情参见:官方链接

Cloudera Manager功能概述

一.状态管理
  (1)Cloudera Manager Server 维护了集群的各种状态。状态可分为两类:模块和运行时,两者都存储于CMS的数据库中。
  (2)模块包含集群,主机,服务,角色,配置。运行时包含进程,命令。

二.配置管理(CM在多个层面定义了配置)
  (1)服务层面
      可定义整个服务实例层面的配置,如HDFS服务的默认副本因子,
  (2)角色组层面
      可定义某个角色组的配置,如DataNode的处理线程数量,可根据DataNodes的不同分组进行不同的配置。
  (3)角色层面
      可覆盖从角色层面继承的配置。这种配置需要谨慎使用,因为会造成角色组中的配置分歧。如因为拍错需求临时启用某个角色实例的DEBUG日志。
  (4)主机层面
      根据监控,软件管理,资源管理的不同有不同的配置。
  (5)CM自身也有很多与管理操作相关的配置。

三.进程管理
  (1)非CM管理的集群使用脚本进行角色进程的启动,但在CM管理的集群中这类脚本不起作用。
  (2)CM管理的集群中,只能使用CM进行角色进程的启停,CM使用开源的进程管理名为supervisord,其会启动进程,重定向日志,通知进程失败,为进程设置正确的用户ID等等。CM支持自动重启一个崩溃的进程。如果一个进程在启动会频繁崩溃,还会被大声非健康标记。
  (3)停止CMS和CM代理不会使正在运行的进程被中止。

四.软件包管理
  CM支持两种软件分发格式:packages和parcels。
  (1)package
      是一种二进制分发格式,包含编译的代码和元数据如包描述,版本,依赖项。包管理系统评估此元数据以允许包搜索,执行升级,确保包的所有依赖关系得到满足。CM使用本地操作系统支持的包管理程序。
  (2)parcel
      也是一种二进制分发格式,包含CM需要使用的附加元数据。其余package的却别有:可安装同一个parcel的多个版本,并激活其中一个;parcel可安装到任何路径;通过parcel安装,CM会自动下载并激活和每个节点操作系统版本匹配的parcel包,解决某些操作系统版本不一致问题。

五.主机管理
  (1)CM提供了多种功能以管理Hadoop集群的主机。第一次运行CM管理控制台时,可搜索主机并添加到集群,一旦选中了主机就可以为其分配CDH角色。CM会在主机上自动部署作为集群托管节点所有软件:JDK,CM agent,CDH,Impala,Solr等等。
  (2)服务部署并运行后,管理员控制台中的“Hosts”区域显示集群中托管主机的总体状态。提供的信息包括主机上的CDH版本,主机所属的集群,运行在主机上的角色的数量。Cloudera管理服务中的主机监控角色执行监控检查并收集主机的统计信息,以允许你监控主机的监控和性能。

六.资源管理
  CM允许使用两种资源管理方式:
  (1)静态资源池
      使用Linux cgroups在多个服务间静态进行资源隔离,如HBase,Impala,Yarn分别使用一定百分比的资源。静态资源池默认不启用。
  (2)动态资源池
      用于某些服务内部的资源管理,如Yarn的各种资源调度器,Impala也可对不同池中的查询动态分配资源。

七.用户管理
  (1)访问CM通过用户账户进行控制。用户账户标识如何对用户进行身份验证,并确定授予用户的权限。
  (2)CM提供了多种用户认证机制。可以配置CM使用CM数据库认证用户,或使用某种外部认证服务。外部认证服务可以是LADP服务器,或者指定的其他服务。CM还支持使用安全断言标记语言(SAML)来实现单点登录。

八.安全管理
  (1)认证:
      认证是指用户或服务证明其有访问某种系统资源的权限。Cloudera集群支持操作系统认证,LDAP,Kerberos等认证方式。LDAP和Kerberos并不是互斥的,很多时候可以一起使用。
  (2)授权:
      授权关注谁可以存取或控制指定的资源或服务。CDH目前支持以下几种权限控制:
        1>.传统的POSIX形式的目录和文件权限控制;
        2>.HDFS扩展的ACL细粒度权限控制;
        3>.HBase可对用户和组设置各种操作的ACL;
        4>.使用Apache Sentry进行基于角色的全下控制;
  (3)加密:
      集群不同层面存储和传输的数据支持不同的加密方式。

九.Cloudera管理服务
  Cloudera Management Service 实现了多种管理特性,包括活动监视,主机监控,服务监控,时间服务,告警发布,报表管理等。

Cloudera Manager基本核心功能

Cloudera Manager作为Hadoop大数据平台的管理工具,能够有效地帮助用户更容易地使用Hadoop。他的核心功能分为四大模块:管理功能,监控功能,诊断功能和集成功能。

一.Cloudera Manager提供的管理功能
  (1)批量自动化部署节点
      CM提供强大的Hadoop集群部署能力,能够批量的自动化部署节点。安装一个Hadoop集群只需添加安装的节点,安装需要的组件和服务角色这三步,大大缩短了Hadoop的安装时间,也简化来Hadoop的安装过程。
  (2)可视化的参数配置功能
      Hadoop包含许多组件,不同组件都包含各种各样的XML配置文件。CM提供界面GUI可视化参数配置功能。
  (3)智能参数验证以及优化
      当用户配置部分参数值有问题时,CM会给出智能错误提示,帮助用户更合理地修改配置参数。
  (4)高可用配置
      CM对关键的组件使用HA部署,如NameNode高可用可以通过CM的Web管理界面,根据向导启用HDFS HA。
  (5)权限管理
      提供不同级别的管理权限,比如只度用户访问Cloudera Manager的界面时,所有服务对应的启停等操作选项都不可用。

二.Cloudera Manager提供的监控功能
  (1)服务监控
      查看服务和实力级别健康检查的结果,对设置的各种指标和系统运行情况进行全面监控。如果任何运行情况测试是不良(Bad),则服务或者角色的状态就是不良(Bad)。如果结果运行状况存在隐患(Concering,没有任意一项目是不良(Bad)),则服务或者角色的状况就是存在隐患(Concerning)。而且系统会对管理员应该采取得到行动提出建议。
  (2)主机监控
      监控集群内所有主机的有关信息,包括主机上目前消耗的内存,主机上运行的角色分配等,不但显示所有集群主机的汇总视图,而且能进一步显示单个主机关键指标详细视图。
  (3)行为监控
      CM提供来列表和图表来查看集群上进行的活动,不仅显示当前正在执行的任务行为,还可以通过仪表盘查看历史活动。
  (4)事件活动
      监控界面可以查看事件,系统管理员可以通过时间范围,服务,主机,关键字等信息过滤事件。
  (5)报警
      通过配置CM可以对指定的时间产生警报,并通过电子邮件或者SNMP的事件得到制定的警报通知。
  (6)日志和报告
      可以轻松点击一个链接查看相关的特定服务的日志条目,并且Cloudera Manager可以将收集的历史日志监控数据统计生成报表。

三.Cloudera Manager提供的诊断功能
  (1)周期性服务诊断
      CM会对集群中运行的服务进行周期性的运行状况测试,以检测这些服务的状态是否正常。如果有异常情况,就会进行告警,有利于更早地让用户感知集群服务存在的问题。
  (2)日志采集及检索
      对于一个大规模的集群,CM提供了日志收集功能,能够通过统一的界面查看集群中每台及其,各项服务的日志,并且能够根据日志级别等不同的条件进行检索。
  (3)系统性能使用报告
      CM能够查看系统性能使用报告,包括集群的CPU使用率,单节点的CPU使用率,单个进程的CPU使用率等各项性能数据,这对于Hadoop集群的性能调试很重要。

四.Cloudera Manager提供的集成功能
  (1)安全配置
      为了方便Hadoop大数据平台与原有身份认证系统如AD,LDAP等的集成,CM只需在界面上配置即可完成。
  (2)Cloudera Manager API
      通过Cloudera Manager API,能够方便地将CM集成到企业原有管理系统集成。
  (3)SNMP集成
      CM也提供了方便的SNMP集成能力,只要简单的配置,就能够将SNMP进行集成,并且将集群中的告警信息进行转发。

Cloudera Manager高级功能

Cloudera Manager的高级功能在免费的Express版本中是不提供的。
  (1)软件升级滚动
      Hadoop版本升级和bug修复,通常会影响业务的连续性。CM提供了滚动升级的功能,支持Hadoop平台进行滚动升级时继续对外提供服务以及应用。
  (2)参数版本控制
      任何时候进行配置修改并保存之后,Cloudera Manager会对该配置生成一个版本。Cloudera Manager支持查看历史配置,并回滚到不同版本,从而为集群恢复,问题诊断等提供了一个可靠的一句和方便的工具。
  (3)备份及容灾系统BDR
      Cloudera为Hadoop平台提供一个集成的,易用的灾备解决方案。BDR为灾备方案提供了丰富的功能,CM和BDR提供了完整的用户画像,实现界面化的数据备份与灾难恢复。
  (4)数据审计
      Cloudera Navigator的审计功能支持对数据的审计和访问。
  (5)安全集成向导
      启用Kerberos集成和外部安全认证集成,如支持通过内部数据库和外部服务进行用户认证。

安装 Cloudera 详情参见: Cloudera安装指南

Cloudera Manager大数据管理平台介绍相关推荐

  1. 留学教育大数据管理平台

    学生大数据管理平台介绍 Univ France法国留学机构-学生大数据管理平台,是基于探码Web大数据采集与分析技术,针对国内留学生研发的法国留学教育的大数据管理平台.系统有2大端口组成,学生信息填报 ...

  2. 国产自研开源大数据管理平台DataSophon Manager安装教程

    简介 DataSophon是近日开源的一款国产自研大数据管理平台,致力于快速实现部署.管理.监控以及自动化运维大数据服务组件和节点的能力,帮助你快速构建起稳定.高效的大数据集群服务. 主要有以下特性: ...

  3. 南沙发布全国首个智慧城市物联网大数据管理平台

    记者从近日举行的2017广州国际照明博览会(光亚展)上获悉,由中科院孵化的南沙企业--中科智城软件有限公司正式发布了其研制成功全国首个"智慧城市物联网大数据管理平台"(以下简称&q ...

  4. ktv管理系统_著作权大数据管理平台开始公测 或将解决KTV行业版权困扰

    因为版权问题,KTV一度被要求下架许多歌曲,这给KTV经营者带来了不小的困扰.随着"著作权大数据管理平台"公测的推进,大数据.人工智能等技术或许将消除这一现象,KTV行业将迎来和谐 ...

  5. 云南省依托大数据管理平台反映扶贫工作 实现精准监督常态化

    据悉,近日云南省创新监督方式,建立全省精准扶贫大数据管理平台,通过扶贫对象.扶贫措施.扶贫成效等功能模块直观反映贫困对象.措施及成效,确保民生监督与脱贫攻坚实现精准对接,实现了政策宣传.精准识别.项目 ...

  6. 大数据管理平台(一)概述

    系列文章目录 文章目录 系列文章目录 前言 一.功能概述 二.使用步骤 2.1 安装 2.2 监控 2.3 管理 2.4 用户管理 2.5 应用市场 2.6 操作系统 三.总结 前言 做大数据有几年了 ...

  7. 深入解析DC/OS 1.8 – 高可靠的微服务及大数据管理平台

    http://blog.csdn.net/popsuper1982/article/details/52736084 深入解析DC/OS 1.8 – 高可靠的微服务及大数据管理平台 大家好,欢迎大家参 ...

  8. 大数据管理平台助力精准扶贫 “建始经验”将在全省推介

    如何在规定时间内实现精准扶贫.精准脱贫,打赢脱贫攻坚战.与全省同步全面建成小康社会?建始县建立精准扶贫大数据管理平台,助力脱贫攻坚的做法,受到肯定.近日,省委办公厅刊发简报推介这一经验,要求各地各部门 ...

  9. 【ECharts系列|03可视化大屏】大数据管理平台实时展示

    基于echats实现可视化大数据管理平台实时展示. 完整html+css+js+json+font+video:https://download.csdn.net/download/weixin_41 ...

最新文章

  1. redis分布式锁-基本概念与实现方式对比
  2. java二位数组biaoda_1 面向对象前部分
  3. python获取文本框里输入的值_如何从Tkinter文本框小工具获取输入?
  4. structs2之多文件上传
  5. Octavia API接口慢问题排查引发的思考
  6. java快速压缩文件夹_如何使用java压缩文件夹本身
  7. 查找某一字符串在目标字符串中所在的位置
  8. 上海电机学院c语言,上海电机学院第1章_C语言概述.ppt
  9. 冰雪、飞禽勾勒出青海湖冬日“水墨画”
  10. k3 审核流程图_3金蝶K3操作流程图详解
  11. 用分组编码解决算术编码的精度要求问题
  12. outlook签名文件编辑_如何在Microsoft Outlook中创建,编辑和应用签名
  13. 精选汇总 | 开心一刻
  14. linux mysql dengl_linux环境搭建(四)--MYSQL
  15. 使用同步锁来实现线程安全---生产者与消费者
  16. java源码 - SpringMVC(9)之 其他Resolver
  17. 常用的服务器响应的状态码
  18. unittest输出测试报告
  19. 汽油运输基于资产监测终端案例分析
  20. 东莞塑料是四大工程材料

热门文章

  1. win8.1 华硕S300CA 触摸板 卡
  2. IBM T400 R28 Ubuntu 9.10无线驱动安装
  3. 罗斯蒙特3051差压变送器
  4. matlab矩阵半张量积,矩阵的半张量积_一个便捷的新工具.pdf
  5. 如何在Win10上安装爬虫框架Scrapy
  6. P2V linux物理主机
  7. linux 利用win网络共享上网
  8. 删除文件和粉碎文件的区别和作用
  9. 气体浓度监测在煤粉制备系统火灾预警中的应用
  10. web应用票据打印实现(三)