引言

Hadoop自从出现到现在被广泛应用,经理了很多个版本的衍化,甚至各个公司都在原生apache hadoop的基础上进行了一些改造以及特性优化,有些是完善了一整套的集群部署工具,在这衍化的过程中出现了Apache hadoop官方版本,还有很多第三方版本,例如Cloudera,Hortonworks,IBM,华为等提供的版本。那么这么多的版本,我们在进行学习开发或者生产环境部署的时候应该如何选择呢?

一、Apache Hadoop

Apache Hadoop是apache提供的官方版本,以yarn框架的出现为标志分为Hadoop第一代和Hadoop第二代,第一代的Hadoop包含三个大版本:0.20.x 、0.21.x 、0.22.x,其中除了0.20.x(后来演变为了1.0.x版本)是稳定的版本之外,其他的皆为不稳定版本。第二代Hadoop跟第一代相比有了明显的不同,包含了HDFS Federation和 YARN系统。
Apache Hadoop下载地址:http://hadoop.apache.org/releases.html

二、CDH(Cloudera Distribution Hadoop)

Cloudera公司的发行版,市场上称之为CDH(Cloudera Distribution Hadoop),截止目前为止已经到了CDH6,目前较常用的是CDH3以上的版本,CDH3对应于hadoop 1.0,而CDH4和CDH5对应于hadoop2.0.Cloudera,版本层次明确,代码也是完全开源,并且集群部署工具比较完善以及教程等相对较多,社区活跃。
各版本下载地址:

  • CDH3:http://archive.cloudera.com/cdh/3/
  • CDH4: http://archive.cloudera.com/cdh4/cdh/4/
  • CDH5:http://archive.cloudera.com/cdh5/cdh/5/
  • CDH6:https://archive.cloudera.com/cdh6/

Hortonworks

Hortonworks提供的hadoop发行版称为HDP(Hortonworks Data Platform),也是全开源的系统。HDP除了包含常见的项目外还包含了Ambari,一款开源的安装和管理系统。一个元数据管理系统HCatlog,还包含HBase、Hive、Pig等一整套大数据解决方案技术。
Hortonworks在管理工具和集群部署方面有其独特优势。

IBM

IBM不提供只针对Hadoop的发行版,而是在原生hadoop的基础上进行了增强,例如增强了安全认证、作业调度等,采用Pig,Hive,HBase等技术开发了IBM的InfoSphere BigInsights大数据平台,一般面向IBM企业用户。

华为

华为在国内大数据领域也是走在前列的,其在Apache Hadoop的基础上利用本身的硬件能力进行了一些增强,例如故障自动Failover,增强HA功能等,其发布的版本为FusionInsight Hadoop。

总结

众多版本应该如何选择?综上所述,Apache Hadoop原生版本以及Cloudera CDH版本无论在开源或者社区活跃度,学习资料等方面都位列前茅,如果是用来研究学习建议选择这两个版本,基于目前两者更新的版本已经较多的情况,建议直接选择Hadoop2.0之后的版本或者CDH4之后的版本进行学习。如果是用于生产环境部署,则可根据情况选择稳定的版本,或者选择Hortonworks可以使用ambari等管理工具较为方便地进行部署。

hadoop系列-hadoop版本选择相关推荐

  1. Android应用.三星i9000系列(1).版本选择与USB连接电脑

    Android应用.三星i9000系列指南(1).版本选择与USB连接电脑 草木瓜 20110401 一.序 五年前的Moto E680虽然还能勉强使用,但SD卡已不灵便,触摸屏也经常罢工,     ...

  2. SpringCloud系列之版本选择

    SpringBoot版本   进入Spring官网,查看当前SpringBoot版本:   当前最新版本是2.5.4 GA,如果单纯使用SpringBoot框架,那么选择2.5.4 GA就行. GA即 ...

  3. Hadoop系列-Hadoop常用命令(五)

    Hadoop 常用命令 所有的 Hadoop 命令均由 bin/hadoop 脚本引发.不指定参数运行hadoop脚本会打印所有命令的描述. 用法: hadoop [--config confdir] ...

  4. JAVA学习笔记系列4-Eclipse版本选择

    下载Eclipse需要根据安装的JDK的版本来决定是安装32位还是64位,不是根据操作系统选的. 转载于:https://www.cnblogs.com/feiyafei/p/9935274.html

  5. 【大数据技术】操作系统和Hadoop版本选择

    1.操作系统选择 Hadoop产品是由Java语言开发的,所以推荐的是Linux操作系统,理由很简单开源免费,推荐的操作系统CentOS. CentOS是一个基于Red Hat 企业级 Linux 提 ...

  6. hadoop商业版本选择对比

    记得刚接触到hadoop的时候跟大部分人一样都会抱怨hadoop的安装部署问题,对于一个新手来说这这的是个头疼的问题,可能需要花费一整天的时间才能把分布式环境安装配置好.在刚接触hadoop的一段时间 ...

  7. Hadoop版本选择探讨

    由于Hadoop版本混乱多变,因此,Hadoop的版本选择问题一直令很多初级用户苦恼.本文总结了Apache Hadoop和Cloudera Hadoop的版本衍化过程,并给出了选择Hadoop版本的 ...

  8. Hadoop系列之九:Hadoop集群伪分布式模式的实现详解

    1.Hadoop依赖软件 Hadoop基于Java语言开发,因此其运行严重依赖于JDK(Java Development Kit),并且Hadoop的许多功能依赖于Java 6及以后的版本才提供的特性 ...

  9. Hadoop——(Hadoop框架,Hadoop的优缺点,Hadoop1.x和2.x的版本区别,Hadoop架构,Hadoop目录结构)

    文章目录 大数据的简介 Hadoop框架 Hadoop的优缺点 Hadoop1.x和2.x的版本区别 Hadoop架构 Hadoop目录结构 正常工作的Hadoop集群中Hadoop都分别需要启动哪些 ...

  10. hadoop系列(一)概念、组件介绍、安装环境、配置

    hadoop系列(一)概念.组件介绍.安装环境.配置 一.大数据概念 概念 大数据:解决海量数据的采集.存储.分析计算的能力 大数据特点 Volume(大量) Velocity(高速) Variety ...

最新文章

  1. zoj 1010 (线段相交判断+多边形求面积)
  2. Python中装饰器的理解和实现
  3. 了解LSTM和GRU
  4. 工作篇-佛山三水恒大-2020.11.13
  5. c 读取mysql 并显示_c/c++ mysql读取操作实现简单操控电脑
  6. Effective JavaScript Item 40 避免继承标准类型
  7. nginx日志切割脚本
  8. 系统学习数字图像处理之形态学分析补充(灰度级处理)
  9. 关于模板类中,子类无法访问父类成员问题的解决方法
  10. 【我评】——关于《中國化風格的淺析》
  11. 得分——UVa1585
  12. 渐近记号Θ、Ο、o、Ω、ω详解
  13. html+css鼠标悬停发光按钮![HTML鼠标悬停的代码]使用HTML + CSS实现鼠标悬停的一些奇幻效果!
  14. 设置Excel表格“只读模式”的两种方法
  15. CentOS7转发非3306端口到3306端口
  16. 小白的基因测序学习之路——#001有关基因的那些事
  17. 时序数据库与传统数据库的优势
  18. 春种秋收—朴素的道理
  19. Secure Boot什么意思?BIOS中Secure Boot灰色无法更改解决方法详解
  20. icomoon 下载及使用

热门文章

  1. 介绍几款可以在手机上用来学习编程的软件
  2. 【VLAN配置及具体解析(基于接口的VLAN划分-access、trunk和hybrid,基于Mac地址的VLAN划分)】-20211201
  3. 企业网络项目投标范文
  4. 举例 微积分 拉格朗日方程_(完整word版)拉格朗日方程的应用及举例08讲
  5. java 启动resin,Resin 启动时报错!解决方法
  6. 【历史上的今天】3 月 8 日:游戏机之父诞辰;搜索技术之父出生;MIT 公开演示旋风计算机
  7. android layoutinflater原理分析,Android 之 LayoutInflater 全面解析
  8. 主编推荐 | 南大周志华、俞扬、钱超最新力作导读
  9. 南京大学计算机系副教授名单,2018年度国际“人工智能10大新星”名单公布:南京大学俞扬副教授国内高校入选者...
  10. vbscript 微软教程网址