Hadoop=HDFS+Yarn+MapReduce+Hbase+Hive+Pig+Zookeeper+Hbase+Hive+Sqoop

1.HDFS:分布式文件系统,适合一次写入,多次读出的场景。一个文件经过创建、写入和关闭 之后就不需要改变。

2.Yarn:分布式资源管理系统,用于同一管理集群中的资源(内存等)

3.MapReduce:Hadoop的编程框架,用map和reduce方式实现分布式程序设计,类似于Spring。

4.Pig:MapReduce的一个抽象,它是一个工具/平台(所以说它并不完全是一门语言),用于分析较大数据集,并将其表示为数据流;

5.Zookeeper:分布式集群管理、master选举、消息发布订阅、数据存储、分布式锁等等。分布式协调服务,用于维护集群配置的一致性、任务提交的事物性、集群中服务的地址管理、集群管理等

6.Hbase:Hadoop下的分布式数据库,类似于NoSQL

7.Hive:数仓工具,Hive进行数据离线批量处理时,需将查询语言先转换成MR任务,由MR批量处理返回结果,所以Hive没法满足数据实时查询分析的需求。

8.Sqoop:用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递

Hadoop中各组件的作用相关推荐

  1. vue中组件的导出导入_5.2 vue中 keep-alive 组件的作用,详细解释keep-alive使用方法...

    问题:vue中 keep-alive 组件的作用 keep-alive:主要用于保留组件状态或避免重新渲染. 比如: 有一个列表页面和一个 详情页面,那么用户就会经常执行打开详情=>返回列表=& ...

  2. 《小白兔到大黑牛》第十四篇Hadoop中五个进程作用

    问题导读: 1.job的本质是什么? 2.任务的本质是什么? 3.文件系统的Namespace由谁来管理,Namespace的作用是什么? 4.Namespace 镜像文件(Namespace ima ...

  3. Hadoop中Context类的作用和Mapper<LongWritable, Text, Text, LongWritable>.Context context是怎么回事【笔记自用】

    问题导读: 1.Context能干什么? 2.你对Context类了解多少? 3.Context在mapreduce中的作用是什么? 下面我们通过来源码,来得到Context的作用: 下面主要对Set ...

  4. Hadoop中Context类的作用

    问题导读: 1.Context能干什么? 2.你对Context类了解多少? 3.Context在mapreduce中的作用是什么? 下面我们通过来源码,来得到Context的作用: 下面主要对Set ...

  5. vue中keepAlive组件的作用及使用方式

    在面试的时候,很多面试官再问vue的时候可能就会提一嘴,你知道keep-alive有什么作用吗? keep-alive是vue内置的一个组件,而这个组件的作用就是能够缓存不活动的组件,我们能够知道,一 ...

  6. 试述hadoop生态系统以及每个部分的具体功能_Hadoop在大数据分析中的意义和作用...

    什么是Hadoop? Apache Hadoop是一个开放源代码软件框架,用于开发在分布式计算环境中执行的数据处理应用程序. 使用HADOOP构建的应用程序可在分布在商用计算机群集上的大型数据集上运行 ...

  7. python中scrapy是什么_python爬虫中scrapy组件有哪些?作用是什么?

    最近苹果12的消息一直活跃,连小编这种不是果粉的人都知道了.虽然苹果是一部性能不错的手机,但是它各个零件却是来源于不同的地方,可见再好的成品也是需要不同零件支撑的.那么,python爬虫中scrapy ...

  8. Hadoop 中zoo_0基础如何入门HADOOP

    原标题:0基础如何入门HADOOP 学习一样东西,肯定先要了解这个东西是什么,那什么是HADOOP呢?我们就来看看什么是HADOOP和如何学习HADOOP及学习内容. 一,什么是HADOOP HADO ...

  9. 【Hadoop】Hadoop生态圈基本组件介绍

    1. HDFS HDFS(Hadoop分布式文件系统)源于Google在2003年10月发表的GFS论文,HDFS是GFS的实现.HDFS通过流式数据访问,适合大数据集访问的应用程序.HDFS有一次写 ...

  10. 【大数据笔记】hadoop基础——各组件介绍

    目录 故事背景 Hadoop 与大数据之间到底是什么关系? 1.数据存储:HDFS,一个分布式文件系统 2. 数据分析:MapReduce 计算引擎 HDFS(Hadoop 分布式文件系统) MapR ...

最新文章

  1. php中OR与|| AND与的区别
  2. 你知道 Redis 可以实现延迟队列吗?
  3. 从Grid R-CNN到Grid R-CNN Plus:基于网格的目标检测演化
  4. 微信小程序引入WeUI
  5. Detectron2学习笔记
  6. 可视化管理_RFID技术实施智能仓储管理可视化
  7. python用pip安装numpy mac_小白入门Python,mac下如何安装pip、ipython
  8. HttpHandler和ashx使用Session 出现未初始化异常
  9. Scala实现冒泡排序、归并排序和快速排序
  10. StringUtils,FileUtils,PropertiesUtils,DataBaseUtils
  11. 展开收起js动画效果
  12. 在框架中用JS设置target(用于location.href)
  13. 雷达卫星测高原理、最新发展情况
  14. Markdown打造高逼格博客
  15. python批量读取landsat8的波段
  16. android apk 微信登入_Android实现使用微信登录第三方APP的方法
  17. 每个前端工程师都应该了解的图片知识
  18. signature=4a882a48c4a4b2b41835e11b6fafa69f,ABB 38SC980002R375
  19. Java线程池与Lambda表达式
  20. CTO创新思维与能力

热门文章

  1. Cheat Enginee(CE)修改器详细教程
  2. 找Devcon.exe的同学看过来
  3. 深入理解JVM虚拟机笔记——类加载机制
  4. 《近世代数》课程感想
  5. python基础案例教程课后答案_Python基础案例教程
  6. php+将json转字符串,php实现json转字符串的方法
  7. 网易云API微信小程序
  8. 如何做中台战略分析模型?
  9. Mac Book Pro中idea常用快捷键
  10. html自动加好友,WeTool微信自动加好友软件