1、介绍hadoop的组件

hadoop有三个主要的核心组件:HDFS(分布式文件存储)、MAPREDUCE(分布式的计算)、YARN(资源调度),现在云计算包括大数据和虚拟化进行支撑。

  在HADOOP(hdfs、MAPREDUCE、yarn)大数据处理技术框架,擅长离线数据分析.

  Zookeeper 分布式协调服务基础组件,Hbase  分布式海量数据库,离线分析和在线业务处理。

  Hive sql 数据仓库工具,使用方便,功能丰富,基于MR延迟大,可以方便对数据的分析,并且数据的处理可以自定义方法进行操作,简单方便。  

  Sqoop数据导入导出工具,将数据从数据库导入Hive,将Hive导入数据库等操作。

  Flume数据采集框架,可以从多种源读取数据。

  Azkaban对操作进行管理,比如定时脚本执行,有图形化界面,上传job简单,只需要将脚本打成包,可直接上传。

2、三大组件详细介绍参见博客

1、HDFS原理深入

2、MapReduce概述及MapReduce详细实现

3、MapReduce在Yarn上执行流程

hadoop三大组件相关推荐

  1. Hadoop三大组件之分布式文件操作系统HDFS实现原理及编程

    文章目录 HDFS---分布式文件系统 分布式文件系统简介 HDFS相关概念 HDFS体系结构 HDFS命名空间 HDFS存储原理 HDFS数据读写过程 读的过程-JAVA代码 写入文件-JAVA代码 ...

  2. 2021年大数据Hadoop(二十六):YARN三大组件介绍

    全网最详细的Hadoop文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 本系列历史文章 前言 Yarn三大组件介绍 ResourceManager No ...

  3. Hadoop四大组件

    common.HDFS.MapReduce.YARN common: HDFS:(Hadoop Distributed File System):分布式文件系统. a.文件系统:文件管理+block块 ...

  4. Hadoop生态组件图

    总所周知,Hadoop生态体系非常庞大,里面涵盖了各种大数据组件.随着技术的不断演讲,有点组件已经逐渐退出了历史舞台,比如当前很少使用的组件storm.Tez.Presto等.因此,首先总结hadoo ...

  5. java web三大组件之filter过滤器

    过滤器是java web中相当重要的组成成分,是JavaWeb三大组件之一,它与Servlet很相似.不过过滤器有以下三条特性: 过滤器是用来拦截请求的,而不是处理请求的. 当用户请求某个Servle ...

  6. Hadoop 三大发行版本

    Hadoop三大发行版本:Apache.Cloudera.Hortonworks. Apache版本最原始(最基础)的版本,对于入门学习最好. Cloudera在大型互联网企业中用的较多. Horto ...

  7. 三大组件与三大优势 SUSE发布CaaS平台为哪般?

    在当下,容器技术的热度不亚于夏日的骄阳.容器技术正在创新应用程序的开发和运行方式,然而各大企业并不想自己安装和维护设置复杂.安全性要求又高的容器基础架构,而是把精力集中在那些可为其业务带来价值的应用程 ...

  8. 第一章 java nio三大组件与使用姿势

    本案例来源于<netty权威指南> 一.三大组件 Selector:多路复用器.轮询注册在其上的Channel,当发现某个或者多个Channel处于"就绪状态"后(ac ...

  9. JavaWeb三大组件(Servlet,Filter,Listener 自己整理,初学者可以借鉴一下)

    JavaWeb三大组件(Servlet,Filter,Listener 自己整理,初学者可以借鉴一下) Reference 转载于:https://www.cnblogs.com/Jeremy2001 ...

  10. 【Netty】NIO 简介 ( NIO 模型 | NIO 三大组件 | 选择器 Selector | 通道 Channel | 缓冲区 Buffer | NIO 组件分配 | 缓冲区示例 )

    文章目录 I . NIO 模型 II . NIO 三大组件交互流程 III . NIO 缓冲区 IV . NIO 与 BIO 对比 V . NIO 线程分配 VI . 缓冲区 ( Buffer ) 示 ...

最新文章

  1. Java EE学习心得
  2. new Integer 和 Integer.valueOf 有什么不同
  3. 阿里巴巴400集python教程_阿里巴巴推荐的400集Python视频合集免费学起来,学完万物皆可爬...
  4. 【Eclipse】eclipse在线安装反编译插件
  5. AutoCAD VBA天圆地方的放样展开图
  6. Libevent源码分析
  7. 通过自己的项目实际经验,阐述为什么“恶心玩技术”?玩Java开源B/S的教训(三)...
  8. 医疗项目 开源_医疗保健受开源影响最大的行业之一
  9. linux下service+命令和直接去执行命令的区别,怎么自己建立一个service启动
  10. Movie Thumbnails Maker Mac(MTM)使用指南
  11. Java项目——个人博客系统
  12. java jacob pdf_java利用jacob将word转pdf
  13. jmeter性能测试之录制脚本
  14. cutftp连接server-U中文乱码问题解决
  15. 计算机键盘字母记忆,键盘26个字母口诀是怎样的?
  16. 医院管理系统/案列/APP/小程序/网站
  17. 计算机等级考试陕西省考点名单及报考指南
  18. 举个栗子!Tableau 技巧(116):做一个有趣的锥状柱形图
  19. ArcMap通过服务定义发布服务
  20. 北理工python慕课10次测验的单选题和编程题答案_20春-程序设计及应用(Python)-何俊-2_章节测验,期末考试,慕课答案查询公众号...

热门文章

  1. 从宏杉合作伙伴大会看本土存储厂商的“逆袭”
  2. 浙江利捷分析报告(0612)
  3. Python处理QXDM抓取log
  4. 电脑pdf截长图滚动截图保存图片
  5. SwitchHosts for Mac(mac hosts修改工具)
  6. 第一节 ISM Web工业可视化组态软件简介
  7. php gmssl,gmssl
  8. RIME-使用小心得
  9. php mysql敏感词_用PHP如何实现敏感词过滤
  10. 联想7x04服务器装系统,联想硬盘保护EDU7X的安装方法.doc