http://cwiki.apachecn.org/pages/viewpage.action?pageId=1540344

Cloudera 简介

Cloudera 提供一个可扩展、灵活、集成的平台,可用来方便地管理您的企业中快速增长的多种多样的数据。业界领先的 Cloudera 产品和解决方案使您能够部署并管理 Apache Hadoop 及其相关项目、操作和分析您的数据以及保护数据的安全。

Cloudera 提供下列产品和工具 :

  1. CDH — Cloudera 分发的 Apache Hadoop 和其他相关开放源代码项目,包括 Impala 和 Cloudera Search。CDH 还提供安全保护以及与许多硬件和软件解决方案的集成。
  2. Cloudera Impala — 一种 MPP(大规模并行处理) SQL 引擎,用于交互式分析和商业智能。其高度优化的体系结构使它非常适合用于具有联接、聚合和子查询的传统 BI 样式的查询。它可以查询来自各种源的 Hadoop 数据文件,包括由 MapReduce 作业生成的数据文件或加载到 Hive 表中的数据文件。YARN  资源管理组件让 Impala 能够共存于使用 Impala SQL 查询并发运行批处理工作负载的群集上。您可以通过 Cloudera Manager 用户界面管理 Impala 及其他 Hadoop 组件,并通过 Sentry 授权框架保护其数据。
  3. Cloudera Search — 提供近实时访问已存储的数据或者摄取数据到 Hadoop 以及 HBase 中去。Search 提供了近实时的索引,批量索引,全文检索和 Drill-Down(下钻) 的导航,以及一个简单的,全文检索的接口,需要一些 NoSQL 或者编程基础(技能)。完全集成的数据处理平台,Search 使用了在 CDH 中灵活的,可扩展的以及可靠的存储系统。这样不再需要在基础设施层或者业务层移动大量的数据了,也不需要产生新的任务。
  4. Cloudera Manager — 一个复杂的应用程序,用于部署、管理、监控您的 CDH 部署并诊断问题。Cloudera Manager 提供 Admin Console,这是一种基于 Web 的用户界面,使您的企业数据管理简单而直接。它还包括 Cloudera Manager API,可用来获取群集运行状况信息和度量以及配置 Cloudera Manager。
  5. Cloudera Navigator — CDH 平台的一种端到端数据管理工具。Cloudera Navigator 使管理员、数据经理和分析师能够了解 Hadoop 中的大量数据,以及简化了存储和密钥的管理。Cloudera Navigator 中强大的审核、数据管理、沿袭管理、生命周期管理和密钥管理使企业能够遵守严格的法规遵从性和法规要求。

本入门指南提供 Cloudera Manager、CDH 和 Cloudera Navigator 的常规概述。本指南还包括有关 Cloudera 产品的常见问题,并说明如何获得支持、报告问题和接收有关更新和新版本的信息。

文档概览

以下文档指南将包含在 Cloudera 文档集中 :

指南

说明

Cloudera 简介 Cloudera 提供一个可扩展、灵活、集成的平台,可用来方便地管理您的企业中快速增长的多种多样的数据。业界领先的 Cloudera 产品和解决方案使您能够部署并管理 Apache Hadoop 和相关项目、操作和分析您的数据以及保护数据的安全。
Cloudera 发行说明 本指南包含面向安装人员和管理员的版本和下载信息。它包括发行说明以及有关版本和下载的信息。该指南还提供一个版本列表,显示哪个 Cloudera Manager、CDH 以及(如果适用)Cloudera Search 和 Cloudera Impala 版本支持产品的哪个主要和次要版本。
Cloudera 快速入门指南 本指南介绍如何快速安装 Cloudera 软件并为概念证明 (POC) 或开发创建初始部署。它介绍如何下载和使用 QuickStart 虚拟机,它会提供开始基本安装所需的所有内容。它还介绍如何在包含 4 个主机的群集上创建 Cloudera Manager 5、CDH5 和托管服务的全新安装。快速入门安装仅应用于演示和 POC 应用程序,不推荐用于生产。
Cloudera 安装和升级 本指南提供了 Cloudera 生产部署的软件要求和安装信息以及升级过程。本指南还提供 Cloudera 软件的特定端口信息。
Cloudera 管理 本指南介绍如何配置和管理 Cloudera 部署。管理员可管理资源、可用性以及备份和恢复配置。此外,本指南还介绍了如何实施高可用性,并讨论了集成。
Cloudera 数据管理 本指南介绍如何使用 Cloudera Navigator 执行数据管理。数据管理活动包括审核对驻留在 HDFS 和 Hive Metastore 中的数据的访问、审阅和更新元数据以及发现数据对象的沿袭。
Cloudera 操作 本指南介绍如何监控 Cloudera 部署的运行状况和诊断问题。您可以获得度量和使用情况信息,并查看处理活动。本指南还介绍如何检查日志和报告来解决群集配置和操作的问题以及监控法规遵从性。
Cloudera 安全 本指南适用于想要使用数据加密、用户身份验证和授权技术保护群集的系统管理员。本主题还提供有关 Hadoop 安全计划的信息,并向您介绍如何设置 Gateway 来限制访问。
Apache Impala(incubating)- 交互式 SQL 查询 本指南介绍了 Cloudera Impala、其功能和优点以及它如何与 CDH 配合工作。本主题介绍 Impala 概念,描述如何规划 Impala 部署,并为新用户提供教程以及描述方案和专用功能的更高级教程。您还会找到语言参考、性能优化、有关使用 Impala shell 的说明、故障排除信息以及常见问题。
Cloudera Search 指南 本指南介绍了怎么样去配置和使用 Cloudera Search,本主题包括一些像 ETL(抽取,转换,加载),搭建高可用以及故障排除。
Spark 指南 本指南描述了 Apache Spark,一种常规的分布式计算框架,在批处理和交互式处理上提供了很高的性能。本指南提供了 Spark 应用的教程,比如怎样去开发并且运行 Spark 应用,以及如何将 Spark 与其它 Hadoop 组件的搭配使用。
Cloudera 术语 本指南包含 Cloudera 组件的术语的词汇表。

Cloudera 简介、安装和升级、管理、操作文档相关推荐

  1. ElasticSearch入门简介、安装ES(安装Kibana和IK分词器)使用 Postman连接ES进行测、ESRestAPI(操作索引CRUD操作文档CRUD)、练习

    要理解倒排索引 要能够使用DSL命令操作索引库 要能够使用DSL命令操作文档 要能够使用RestAPI操作索引库.文档 一.ES简介 理解倒排索引的概念和作用 理解es和MySql的区别和使用场景 1 ...

  2. 如何修改DynEd的学生记录服务器,DynEd教师管理端操作文档..docx

    DynEd教师管理端操作文档. DynEd教师管理端Records Manager操作文档DynEd教学理念语言是一种技能传统的英语教学太过注重读写,而疏于听说能力的发展.学生花费了大量的时间来背单词 ...

  3. mallplus多商户商城全流程 操作文档

    下载地址 https://gitee.com/catshen/zscat_sw 用户端 http://www.yjlive.cn:8082/#/ 商户端 http://www.yjlive.cn:80 ...

  4. 狮子鱼社区团购支付时出现appid和mch-id不匹配的解决方法及狮子鱼官方操作文档

    解决方法:这点需要到微信小程序后台设置:微信支付–关联更多商户号:如下图所示: 此处绑定商户号需要先将该小程序认证,认证有两种方法,一种是直接给该小程序交300元给微信官方:如果已经有公众号已经认证过 ...

  5. 赫拉(hera)分布式任务调度系统之操作文档

    文章目录 前言 操作文档 登录和注册 用户 用户组 总结 首页 机器组监控 系统管理 用户管理 用户组 用户 总结 监控管理 机器组管理&worker管理 任务管理 任务详情 任务依赖 上游任 ...

  6. CDH6.2.1CM6.2.1版本部署操作文档

    1简介 1.1Cloudera Data Hub介绍 CDH是最完整.测试最全面和最流行的Apache Hadoop及相关项目发布版本. CDH包含Hadoop核心元素:可扩展存储和分布式计算引擎,同 ...

  7. phpems最低的php版本,PHPEMS安装使用操作文档

    <PHPEMS安装使用操作文档>由会员分享,可在线阅读,更多相关<PHPEMS安装使用操作文档(23页珍藏版)>请在人人文库网上搜索. 1.PHPems在线考试系统使用手册一. ...

  8. gitlab安装以及操作文档

    gitlab安装以及操作文档 系统:centos6.9 x86_64 ip:192.168.122.148 Selinux 关闭 SELINUX=disabled 设定源: 新建 /etc/yum.r ...

  9. 连接HP C7000 OA管理口操作文档

    必备工具:1台便携式笔记本电脑.1根网线 2. 在C7000机箱背面找到 OA管理模块,如图:图标1和2为OA主备管理模块 将网线一端接至左边的OA管理网口,另一端接至便携式笔记本电脑网口,如图下位置 ...

  10. Linux服务器部署邮件服务器详细操作文档

    1. 配置ip地址192.168.1.2  setup配置ip 更改主机名 Vim /etc/sysconfig/network mail.han.com 更改参数vim /etc/selinux/c ...

最新文章

  1. rust狗阳玩的什么游戏_微博搜索
  2. openssl 生成公私钥
  3. Spark- 使用第三方依赖解析IP地址
  4. c语言switch循环语序,C语言初学者常见错误统计.doc
  5. 画出18*18的棋盘以及用不同颜色绘制出同心圆(python实现)
  6. C++ 标准库类型 string
  7. 高斯混合模型(Gaussian Mixture Model)
  8. 计算机管理关机在哪,电脑点了关机为什么却关不了
  9. tomcat发布web项目
  10. android随机摇号代码,抽奖摇号系统随机性算法介绍
  11. 【C语言程序】鸡兔同笼问题
  12. unity安装到一半失败
  13. PHP QQ网页三方登录
  14. java 禁用cookie的解决办法
  15. 百度在线笔试计算机视觉,[转载]2014 百度 计算机视觉笔试
  16. Windows下 VMware XP虚拟机 架设论坛
  17. 线程池 - 还可以这么理解?
  18. 深入探索Android内存优化
  19. JS跳到新页关闭当前页,跳到顶部,添加删除提示等等,自己看吧
  20. 主成分分析PCA+C代码

热门文章

  1. QT框架下的OpenGL使用---实战篇---鼠标选取点对象
  2. 助力CP扬帆出海,华为HiGame邀全国开发者共赢拉美市场
  3. ImportError: cannot import name '_validate_lengths'
  4. 【技术教程】网盘扩容技术原理+爆盘免删修复原理解析!扩容爆盘如何免删修复?
  5. linux启动lighttpd服务,Linux下Lighttpd的安装配置
  6. scheme 中文教程
  7. 《问佛》------------一篇精辟人生哲理短文(转)
  8. 【CodeChef-LYRC】Music Lyrics【AC自动机】
  9. 数据库原理与应用实验九 视图的使用
  10. Oracle 10g client(instantclient)环境配置