Hadoop生态系统主要架构图汇总

1 hadoop1.0时期架构

hadoop1.0时期架构

2 hadoop2.0时期架构

hadoop2.0时期架构

3 hdfs架构

hdfs架构

Active Namenode】:主 Master(只有一个),管理 HDFS 的名称空间,管理数据块映射信息;配置副本策略;处理客户端读写请求

Secondary NameNode】:NameNode 的热备;定期合并 fsimage 和 fsedits,推送给 NameNode;当 Active NameNode 出现故障时,快速切换为新的 Secondary NameNode。

Datanode】:Slave(有多个);存储实际的数据块;执行数据块读 / 写

Client】:与 NameNode 交互,获取文件位置信息;与 DataNode 交互,读取或者写入数据;管理 HDFS、访问 HDFS。

4 MapReduce架构

MapReduce架构

MapReduce架构

MapReduce架构

MapReduce架构

5 yarn架构

yarn架构

6 hadoop1.0与hadoop2.0比较图

hadoop1.0与hadoop2.0比较图

7、Hive(基于MR的数据仓库)

由Facebook开源,最初用于海量结构化日志数据统计;ETL(Extraction-Transformation-Loading)工具构建在Hadoop之上的数据仓库;数据计算使用 MapReduce,数据存储使用HDFS
Hive 定义了一种类 SQL 查询语言——HQL
类似SQL,但不完全相同
通常用于进行离线数据处理(采用 MapReduce);可认为是一个 HQL→MR 的语言翻译器

8、Hbase(分布式数据库)

源自 Google 的 Bigtable 论文
发表于 2006 年 11 月
Hbase 是 Google Bigtable 克隆版

作者:小小少年Boy
链接:https://www.jianshu.com/p/061040243935
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

Hadoop生态系统主要架构相关推荐

  1. 大数据晋级之路(4)Hadoop生态系统体系架构及基本概念

    一.基本概念 机架:HDFS集群,由分布在多个机架上的大量DataNode组成,不同机架之间节点通过交换机通信,HDFS通过机架感知策略,使NameNode能够确定每个DataNode所属的机架ID, ...

  2. 阿里巴巴飞天大数据架构体系与Hadoop生态系统

    很多人问阿里的飞天大数据平台.云梯2.MaxCompute.实时计算到底是什么,和自建Hadoop平台有什么区别. 先说Hadoop 什么是Hadoop? Hadoop是一个开源.高可靠.可扩展的分布 ...

  3. 大数据系统架构-Hadoop生态系统

    Hadoop是较早用于处理大数据集合的分布式存储计算基础架构,通过Hadoop,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的为例执行告诉运算和存储.简单来说,Hadoop是一 ...

  4. Hadoop生态系统完整组件及其在架构中的作用

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/cjDaShuJu_Java/article/details/80050858 (1)Hadoop生态 ...

  5. Hadoop 生态系统

    当下 Hadoop 已经成长为一个庞大的生态体系,只要和海量数据相关的领域,都有 Hadoop 的身影.下图是一个 Hadoop 生态系统的图谱,详细列举了在 Hadoop 这个生态系统中出现的各种数 ...

  6. GitChat · 大数据 | 一步一步学习大数据:Hadoop 生态系统与场景

    目录(?)[-] Hadoop概要 Hadoop相关组件介绍 HDFS Yarn Hive HBase Spark Other Tools Hadoop集群硬件和拓扑规划 硬件配置 软件配置 Hado ...

  7. Hadoop概念学习系列之Hadoop 生态系统

    当下 Hadoop 已经成长为一个庞大的生态体系,只要和海量数据相关的领域,都有 Hadoop 的身影.下图是一个 Hadoop 生态系统的图谱,详细列举了在 Hadoop 这个生态系统中出现的各种数 ...

  8. 手把手教你搭建Hadoop生态系统伪分布式集群

    Hello,我是 Alex 007,一个热爱计算机编程和硬件设计的小白,为啥是007呢?因为叫 Alex 的人太多了,再加上每天007的生活,Alex 007就诞生了. 手把手教你搭建Hadoop生态 ...

  9. Hadoop生态系统的详细介绍

    hadoop生态系统的详细介绍 简介 Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算.今 ...

最新文章

  1. 阿里云 物联网产品架构
  2. android 之ListView总结(一个综合实例)
  3. [Contest20171005]Maze
  4. 数据库设计中,多对多关系使用使用逗号分割关联讨论
  5. WT32-SC01是ESP32驱动3.5彩屏开发板方案适合用arduino方式开发吗?因为需要彩屏和电容触摸的驱动的
  6. Java内存模型又回来了
  7. android新建工程横屏,华为MatePad Pro构建的安卓平板横屏生态有何不同?来看看
  8. C语言学习笔记---时间函数clock()和time()
  9. 0322Private strand flush not complete
  10. 《纽约邮报》手机客户端推送系统被黑 黑客发送抒情诗
  11. 2021年3月勒索病毒流行态势分析
  12. VS2010中malloc的使用
  13. 迈信EP100伺服驱动器量产型修改bug全套C源代码
  14. 计算机工业机器人编程,15个你不知道的工业机器人编程冷知识
  15. 芯片和计算机专业的关系,cpu是芯片吗?芯片和cpu是什么关系?
  16. 美赛常用数据库网站大全
  17. secondary namenode详解
  18. 十八、备忘录模式——SL大法,读档的实现
  19. 如何比较两个速度的大小地程序_58安居客小程序平台化与多小程序开发探索与实践...
  20. CreateFont比CreateFontIndirect好用啊~

热门文章

  1. 关于360DOC(个人图书馆)不能复制的解决办法
  2. ORCL数据库导入/导出DMP常用命令
  3. 视频目标跟踪从0到1,概念与方法
  4. 单片机学习之伟福编译器
  5. 怎样建立立体化实战化的安全防御体系
  6. python试卷识别项目_python试卷.doc
  7. linux u盘 specify,linux mount报错:you must specify the filesystem type的解决方法
  8. ASP.NET中的Inherits、CodeFile、CodeBehind的总结比较
  9. 【Coding】从BertForSequenceClassification分类出pooled_output作为final feature
  10. 吴恩达ChatGPT《Building Systems with the ChatGPT API》笔记