本文出自:CDH(Cloudera)与hadoop(apache)对比http://www.aboutyun.com/thread-9225-1-1.html(出处: about云开发)
 

问题导读:

1.Hadoop有几个版本

2.CDH有几种安装方式

3.CDH在安装认证方面做了什么改变?

Cloudera的CDH和Apache的Hadoop的区别,目前而言,不收费的Hadoop版本主要有3个(均为国外厂商),分别是:Apache(最原始的版本,所有发行版均居于这个版本进行改进),Cloudera版本(Cloudera's Distribution Including Apache Hadoop,简称CDH),Hortonworks版本(Hortonworks Data Platform,简称"HDP"),对于国内而言,绝大多数选择CDH版本,CDH和Apache版本主要区别如下:

(1)CDH对Hadoop版本的划分非常清晰,只有两个系列的版本,分别是cdh3和cdh4,分别对应第一代Hadoop(Hadoop1.0)和第二代Hadoop(Hadoop2.0),相比而言,Apache的版本则混乱得多;比Apache hadoop在兼容性、安全性、稳定性上有增强。

(2)CDH3版本是基于Apache hadoop0.20.2改进的,并融入了最新的patch,CDH4版本是基于Apache hadoop2.x改进的,CDH总是并应用了最新Bug修复或者Feature的patch,并比Apache hadoop同功能版本提早发布,更新速度比Apache官方快。

(3)安全CDH支持Kerboros安全认证,apache hadoop则使用简陋的用户匹配认证

(4)CDH文档清晰,很多采用Apache版本的用户都会阅读CDH提供的文档,包括安装文档、升级文档等。

(5)CDH支持Yum/Apt包,Tar包,RPM包,CM安装,Cloudera Manager三种安装方式,Apcache hadoop只支持Tar包安装。

注:CDH使用推荐的Yum/Apt包安装时,有以下几个好处:

1.联网安装、升级,非常方便

2.自动下载依赖软件包

3.Hadoop生态系统包自动匹配,不需要补寻找与当前Hadoop匹配的Hbase,Flume,Hive等软件,Yum/Apt会根据当前安装Hadopp版本自动寻找匹配版本的软件包,并保证兼容性。

4.自动从黄建相关目录并软连接到合适的地方(如conf和logs等目录);自动创建hdfs,mapred用户,hdfs用户是HDFS的最高权限用户,mapred用户则负责mapreduce执行过程中相关目录的权限。

转载于:https://www.cnblogs.com/jingblogs/p/5498928.html

CDH(Cloudera)与hadoop(apache)对比相关推荐

  1. 利用 Cloudera 实现 Hadoop (二)

    安装 规划好了就开始安装Hadoop,如前言中所说使用Cloudera的Hadoop发布版安装Hadoop是十分方便的,首先当然是在每台主机上一个干净的操作系统(我用的是Ubuntu 8.04,用户设 ...

  2. 利用 Cloudera 实现 Hadoop (一)

    前言 Hadoop 是一个实现了 MapReduce 计算模型的开源分布式并行编程框架.MapReduce的概念来源于Google实验室,它是一个简化并行计算的编程模型,适用于大规模集群上的海量数据处 ...

  3. 2022 年 best 大数据认证:康奈尔大学,Intellipaat,SAS, USDI, Cloudera CCA175 Hadoop

    对于 IT 专业人士来说,这是一个充满机遇的时代. 目录 为什么要成为认证数据专家? 数字时代的顶级大数据认证 助理大数据分析师 (ABDA) 助理大数据工程师 高级大数据工程师 康奈尔大学 1. 理 ...

  4. Cloudera CDH 、Hortonworks DHP和MapR比较

    2019独角兽企业重金招聘Python工程师标准>>> 目前啊,都知道,大数据集群管理方式分为手工方式(Apache hadoop)和工具方式(Ambari + hdp 和Cloud ...

  5. Hadoop回顾:(一)Hadoop生态系统简介

    首先我们先了解一下Hadoop的起源.然后介绍一些关于Hadoop生态系统中的具体工具的使用方法.如:HDFS.MapReduce.Yarn.Zookeeper.Hive.HBase.Oozie.Ma ...

  6. Hadoop生态系统

    首先我们先了解一下Hadoop的起源.然后介绍一些关于Hadoop生态系统中的具体工具的使用方法.如:HDFS.MapReduce.Yarn.Zookeeper.Hive.HBase.Oozie.Ma ...

  7. Hadoop生态系统-一般详细

    首先我们先了解一下Hadoop的起源.然后介绍一些关于Hadoop生态系统中的具体工具的使用方法.如:HDFS.MapReduce.Yarn.Zookeeper.Hive.HBase.Oozie.Ma ...

  8. cdh 安装_CDH的介绍和部署

    CDH:全称Cloudera's Distribution Including Apache Hadoop. CDH版本衍化 hadoop是一个开源项目,所以很多公司在这个基础进行商业化,Cloude ...

  9. 大数据开发之Hadoop---初始Hadoop

    曾经的你骄横跋扈,如今你审视人生,重新来过,重新选择,相比同龄你可能晚了一些,遥看人生路路,你没有输,劳动可以改造一个人,坚持劳动,就可以改变人心!无论是脑力劳动还是体力劳动. ----------- ...

  10. 数据分析之Hadoop详解

    1.1 什么是Hadoop - Hadoop的概念: Apache™ Hadoop® 是一个开源的, 可靠的(reliable), 可扩展的(scalable)分布式计算框架 允许使用简单的编程模型跨 ...

最新文章

  1. Docker的安装和使用说明——Docker for Windows
  2. Android Studio项目结构
  3. java监听某端口和ip_Java 通过Socket监听指定服务器(IP)的指定端口,及向指定服务器的指定端口发送信息...
  4. C++ 顺序容器入门
  5. SQLServer LIKE 通配符
  6. HTML网页使用CDN的jquery.qrcode.min.js生成页面二维码(直接可以复制使用)
  7. 一个柱状图里两种数据_分享一些数据分析常用的统计图图表
  8. mailbox 编程_往死里写——从站mailbox实现 | 学步园
  9. Linux下压缩工具gzip和归档工具tar及其实战shell应用
  10. python画图包-Python 绘图包 Matplotlib Pyplot 教程
  11. 【三支火把】--- 关于BIOSUEFI查阅资料网站总结
  12. h5页面如何切图_切图与CSS入门
  13. 免费英文文献下载攻略
  14. 云服务器ECS/EC2_转载
  15. 三坐标测量软件DMIS语句解释
  16. HashMap常见面试考题
  17. C语音:输入两个整数,要求输出其中值较大者。要求用函数来找到大数。
  18. 机器学习 入门详细解析(二)决策树、随机森林
  19. 浏览器访问网址过程详解
  20. 计算机应用文摘版面费,数值计算与计算机应用发表论文期刊级别

热门文章

  1. linux下python安装包_Linux服务器中安装python包管理工具pip
  2. aws s3 獲取所有文件_Url从Amazon S3获取文件
  3. jsf刷新页面_JSF页面生命周期管理
  4. android toast_Android Toast
  5. CloudEra Hadoop VMWare单节点环境设置
  6. 在如今的Web前端环境下,如何提升自己的竞争力?
  7. 开课吧Java课堂:是什么TreeMap类
  8. Java 静态代理、Java动态代理、CGLIB动态代理
  9. JavaScript中的“黑话”
  10. IJCAI最佳论文公布 华人斩获最佳学生论文奖!