Before reading this post, please go through my previous posts to get some Basic knowledge about BigData Hadoop 1.x and 2.x.

在阅读本文之前,请浏览我以前的文章,以获取有关BigData Hadoop 1.x和2.x的一些基本知识。

  1. BigData Hadoop 1.x Architecture and ComponentsBigData Hadoop 1.x体系结构和组件
  2. BigData Hadoop 2.x Architecture and ComponentsBigData Hadoop 2.x体系结构和组件

In this post, we are going to discuss about Difference between Hadoop 1.x and Hadoop 2.x, Hadoop 1.x Architecture Drawbacks or Limitations and How Hadoop 2.x Architecture solves Hadoop 1.x Limitations in detail.

在本文中,我们将详细讨论Hadoop 1.x和Hadoop 2.x之间的区别,Hadoop 1.x架构的缺点或局限性以及Hadoop 2.x架构如何解决Hadoop 1.x局限性。

Apache Hadoop Latest version is 2.7.0.

Apache Hadoop的最新版本是2.7.0

Hadoop V.1.x组件 (Hadoop V.1.x Components)

Apache Hadoop V.1.x has the following two major Components

Apache Hadoop V.1.x具有以下两个主要组件

  1. HDFS (HDFS V1)HDFS(HDFS V1)
  2. MapReduce (MR V1)MapReduce(MR V1)

In Hadoop V.1.x, these two are also know as Two Pillars of Hadoop.

在Hadoop V.1.x中,这两个也称为Hadoop的两个Struts。

Hadoop V.2.x组件 (Hadoop V.2.x Components)

Apache Hadoop V.2.x has the following three major Components

Apache Hadoop V.2.x具有以下三个主要组件

  1. HDFS V.2HDFS V.2
  2. YARN (MR V2)纱(MR V2)
  3. MapReduce (MR V1)MapReduce(MR V1)

In Hadoop V.2.x, these two are also know as Three Pillars of Hadoop.

在Hadoop V.2.x中,这两个也被称为Hadoop的三大Struts。

Hadoop 1.x限制 (Hadoop 1.x Limitations)

Hadoop 1.x has many limitations or drawbacks. Main drawback of Hadoop 1.x is that MapReduce Component in it’s Architecture. That means it supports only MapReduce-based Batch/Data Processing Applications.

Hadoop 1.x具有许多局限性或缺点。 Hadoop 1.x的主要缺点是其体系结构中的MapReduce组件。 这意味着它仅支持基于MapReduce的批处理/数据处理应用程序。

Hadoop 1.x has the following Limitations/Drawbacks:

Hadoop 1.x具有以下局限性/缺点:

  • It is only suitable for Batch Processing of Huge amount of Data, which is already in Hadoop System.它仅适用于Hadoop系统中已经存在的大量数据的批处理。
  • It is not suitable for Real-time Data Processing.它不适用于实时数据处理。
  • It is not suitable for Data Streaming.它不适用于数据流。
  • It supports upto 4000 Nodes per Cluster.每个群集最多支持4000个节点
  • It has a single component : JobTracker to perform many activities like Resource Management, Job Scheduling, Job Monitoring, Re-scheduling Jobs etc.它具有单个组件:JobTracker,可以执行许多活动,例如资源管理,作业计划,作业监视,重新计划作业等。
  • JobTracker is the single point of failure.JobTracker是单点故障。
  • It does not support Multi-tenancy Support.它不支持多租户支持。
  • It supports only one Name Node and One Namespace per Cluster.每个群集仅支持一个名称节点和一个名称空间。
  • It does not support Horizontal Scalability.它不支持水平可伸缩性。
  • It runs only Map/Reduce jobs.它仅运行Map / Reduce作业。
  • It follows Slots concept in HDFS to allocate Resources (Memory, RAM, CPU). It has static Map and Reduce Slots. That means once it assigns resources to Map/Reduce jobs, it cannot re-use them even though some slots are idle.它遵循HDFS中的插槽概念来分配资源(内存,RAM,CPU)。 它具有静态贴图和缩小插槽。 这意味着一旦将资源分配给Map / Reduce作业,即使某些插槽处于空闲状态,也无法重新使用它们。
  • For Example:- Suppose, 10 Map and 10 Reduce Jobs are running with 10 + 10 Slots to perform a computation. All Map Jobs are doing their tasks but all Reduce jobs are idle. We cannot use these Idle jobs for other purpose.

    例如:-假设正在运行10个Map和10个Reduce作业以及10 + 10个插槽以执行计算。 所有地图作业都在执行任务,但所有简化作业都处于空闲状态。 我们不能将这些闲置作业用于其他目的。

NOTE:- In Summary, Hadoop 1.x System is a Single Purpose System. We can use it only for MapReduce Based Applications.

注意:-总之,Hadoop 1.x系统是一个单一目的系统。 我们只能将其用于基于MapReduce的应用程序。

Hadoop 1.x和Hadoop 2.x之间的差异 (Differences between Hadoop 1.x and Hadoop 2.x)

If we observe the components of Hadoop 1.x and 2.x, Hadoop 2.x Architecture has one extra and new component that is : YARN (Yet Another Resource Negotiator).

如果我们观察Hadoop 1.x和2.x的组件,则Hadoop 2.x架构具有一个额外的新组件: YARN(又是另一个资源协商器)

It is the game changing component for BigData Hadoop System.

它是BigData Hadoop系统的改变游戏规则的组件。

  • New Components and API新组件和API
  • As shown in the below diagram, Hadoop 1.x is re-architected and introduced new component to solve Hadoop 1.x Limitations.

    如下图所示,重新构建了Hadoop 1.x并引入了新组件来解决Hadoop 1.x的局限性。

  • Hadoop 1.x Job TrackerHadoop 1.x作业跟踪器
  • As shown in the below diagram, Hadoop 1.x Job Tracker component is divided into two components:

    如下图所示,Hadoop 1.x Job Tracker组件分为两个组件:

  1. Resource Manager:-资源管理器:-
  2. To manage resources in cluster

    管理集群中的资源

  3. Application Master:-应用主管:
  4. To manage applications like MapReduce, Spark etc.

    管理MapReduce,Spark等应用程序

  • Hadoop 1.x supports only one namespace for managing HDFS filesystem whereas Hadoop 2.x supports multiple namespaces.Hadoop 1.x仅支持一个用于管理HDFS文件系统的名称空间,而Hadoop 2.x支持多个名称空间。
  • Hadoop 1.x supports one and only one programming model: MapReduce. Hadoop 2.x supports multiple programming models with YARN Component like MapReduce, Interative, Streaming, Graph, Spark, Storm etc.Hadoop 1.x仅支持一种编程模型:MapReduce。 Hadoop 2.x使用YARN组件支持多种编程模型,例如MapReduce,Interative,Streaming,Graph,Spark,Storm等。
  • Hadoop 1.x has lot of limitations in Scalability. Hadoop 2.x has overcome that limitation with new architecture.Hadoop 1.x在可伸缩性方面有很多限制。 Hadoop 2.x通过新架构克服了这一限制。
  • Hadoop 2.x has Multi-tenancy Support, but Hadoop 1.x doesn’t.Hadoop 2.x具有多租户支持,但是Hadoop 1.x没有。
  • Hadoop 1.x HDFS uses fixed-size Slots mechanism for storage purpose whereas Hadoop 2.x uses variable-sized Containers.Hadoop 1.x HDFS使用固定大小的插槽机制进行存储,而Hadoop 2.x使用可变大小的容器。
  • Hadoop 1.x supports maximum 4,000 nodes per cluster where Hadoop 2.x supports more than 10,000 nodes per cluster.Hadoop 1.x每个集群最多支持4,000个节点,而Hadoop 2.x每个集群最多支持10,000个节点。
  • Hadoop 2.x如何解决Hadoop 1.x局限性 (How Hadoop 2.x solves Hadoop 1.x Limitations)

    Hadoop 2.x has resolved most of the Hadoop 1.x limitations by using new architecture.

    Hadoop 2.x通过使用新架构解决了Hadoop 1.x的大多数限制。

    • By decoupling MapReduce component responsibilities into different components.通过将MapReduce组件职责分离为不同的组件。
    • By Introducing new YARN component for Resource management.通过引入用于资源管理的新YARN组件。
    • By decoupling component’s responsibilities, it supports multiple namespace, Multi-tenancy, Higher Availability and Higher Scalability.通过分离组件的职责,它支持多个名称空间,多租户,更高可用性和更高可伸缩性。

    Hadoop 2.x YARN的好处 (Hadoop 2.x YARN Benefits)

    Hadoop 2.x YARN has the following benefits.

    Hadoop 2.x YARN具有以下优点。

    • Highly Scalability高度可扩展
    • Highly Availability高可用性
    • Supports Multiple Programming Models支持多种编程模型
    • Supports Multi-Tenancy支持多租户
    • Supports Multiple Namespaces支持多个命名空间
    • Improved Cluster Utilization改进的集群利用率
    • Supports Horizontal Scalability支持水平可伸缩性

    That’s it all about Differences between Hadoop 1.x and Hadoop 2.x. We will discuss some more BigData and Hadoop Basics in my coming posts.

    这就是有关Hadoop 1.x和Hadoop 2.x之间差异的全部内容。 在我的后续文章中,我们将讨论更多BigData和Hadoop基础。

    Please drop me a comment if you like my post or have any issues/suggestions.

    如果您喜欢我的帖子或有任何问题/建议,请给我评论。

    翻译自: https://www.journaldev.com/8806/differences-between-hadoop1-and-hadoop2

Hadoop 1.x和Hadoop 2.x,Hadoop 1.x局限性和Hadoop 2.x YARN优点之间的区别相关推荐

  1. hadoop put命令的格式_工作中需熟练掌握的Hadoop命令

    作者信息 Elesdspline 目前从事NLP与知识图谱相关工作. 工作中需熟练掌握的Hadoop命令 导读 工作中经常要用到一些Hadoop命令,这里简单列举一下,熟悉基本的命令操作,工作效率事半 ...

  2. Hadoop hive sqoop zookeeper hbase生产环境日志统计应用案例(hadoop篇)

    Hadoop集群安装部署与配置(2015-01-15) 1.集群环境说明 主机列表 说明: 下文中蓝色部分为实际的执行命令:红色部分是重要的配置信息:"##"后为注释 a. 由于h ...

  3. **Hadoop Ubuntu系统搭建攻略全详细!!!附带Hadoop搭建成功后测试案例**

    Hadoop Ubuntu系统搭建攻略全详细!!!附带Hadoop搭建成功后测试案例 Hadoop搭建教程 一.需要安装的工具: 1.首先确保虚拟机能连上网. 2.更新源列表: sudo apt-ge ...

  4. hadoop再次集群搭建(3)-如何选择相应的hadoop版本

    之前接触过很多很多hadoop版本,现在重新搭建平台,面临选择哪个版本的问题. 当我们决定是否采用某个软件用于开源环境时,通常需要考虑以下几个因素: (1)是否为开源软件,即是否免费. (2) 是否有 ...

  5. 基于Hadoop技术实现的离线电商分析平台(Flume、Hadoop、Hbase、SpringMVC、highcharts)- 驴妈妈旅游项目

    离线数据分析平台是一种利用hadoop集群开发工具的一种方式,主要作用是帮助公司对网站的应用有一个比较好的了解.尤其是在电商.旅游.银行.证券.游戏等领域有非常广泛,因为这些领域对数据和用户的特性把握 ...

  6. 【Hadoop集群】-集群搭建踩的那些坑之hadoop篇

    上篇文章说了在集群搭建的时候首先要开启ssh的公钥验证,只有开启了公钥验证后才能够使用公钥登录,但是在开启并生成公钥后还需要对秘钥文件进行授权处理,一般生成的authorized_keys可能文件的归 ...

  7. Hadoop中HDFS的Shell操作(开发重点)、启动Hadoop集群、基本语法、常用命令实操、命令大全、-help、-mkdir、-moveFromLocal、-copyFromLocal

    文章目录 6.HDFS的Shell操作(开发重点) 6.1基本语法 6.2命令大全 6.3常用命令实操 6.3.1准备工作 6.3.1.1启动Hadoop集群(方便后续的测试) 6.3.1.2-hel ...

  8. greenplum配置高可用_高可用hadoop集群配置就收藏这一篇,动手搭建Hadoop(5)

    01 ssh免密安装 02 jdk安装 03 hadoop伪分布式安装 04 hadoop全分布式 完成了前面四步,现在做hadoop的高可用.其实和之前的lvs的高可用差不多的.如果我们有两个nam ...

  9. 《Hadoop与大数据挖掘》——2.6 TF-IDF算法原理及Hadoop MapReduce实现

    本节书摘来自华章计算机<Hadoop与大数据挖掘>一书中的第2章,第2.6节,作者 张良均 樊哲 位文超 刘名军 许国杰 周龙 焦正升,更多章节内容可以访问云栖社区"华章计算机& ...

最新文章

  1. 一行命令实现录屏,支持热键和鼠标操作,区域、帧率、格式任你选择
  2. jstack-查看Java进程的线程堆栈信息,锁定高消耗资源代码
  3. [译]Stack View 自定义间隙
  4. .net odbc连接mysql数据库,下载安装MySQL数据库ODBC驱动和配置MySQL ODBC数据源
  5. 0x0000007F蓝屏问题摸索解决-没有完成
  6. c#10中的namespace
  7. 如何使用emacs编写c语言程序,并编译运行
  8. 零点追踪(零点及量程补偿)
  9. 通过还款计划表监控还款异常
  10. 利用WinSock进行无连接的通信
  11. python基础代码大全-python零基础入门命令方式汇总大全,快速恶补你的Python基础...
  12. Lambda表达式实现有限状态机
  13. 国军标-Gjb软件设计说明书模板
  14. 使用python 生成二维码 中间带logo
  15. 吐血推荐HZHControls:我见过最美的Winform控件库
  16. 巴菲特致股东的信pdf_2020年巴菲特致股东的信
  17. 逻辑门图解(NOT门 AND门 OR门 XOR门)
  18. 【WPF学习手记】WPF超链接使用
  19. 阿里数据中台维度建模规范、维度模型设计及模型实施方法论
  20. android系统更新原理简介

热门文章

  1. centos 5.x 大硬盘管理
  2. Spring浅入浅出——不吹牛逼不装逼
  3. 设计模式——命令模式
  4. centos7卸载旧jdk安装新jdk1.8
  5. Uncaught SyntaxError: Unexpected token export
  6. (译)如何制作一个类似tiny wings的游戏:第一部分
  7. VS2015断点调试方法
  8. java开发flex_FLEX+Java开发
  9. faster rcnn论文_【论文解读】精读Faster RCNN
  10. linux浮动ip添加 手动,在Linux 双机下自己手动实现浮动ip技术