Hadoop中各组件的作用
Hadoop=HDFS+Yarn+MapReduce+Hbase+Hive+Pig+Zookeeper+Hbase+Hive+Sqoop
1.HDFS:分布式文件系统,适合一次写入,多次读出的场景。一个文件经过创建、写入和关闭 之后就不需要改变。
2.Yarn:分布式资源管理系统,用于同一管理集群中的资源(内存等)
3.MapReduce:Hadoop的编程框架,用map和reduce方式实现分布式程序设计,类似于Spring。
4.Pig:MapReduce的一个抽象,它是一个工具/平台(所以说它并不完全是一门语言),用于分析较大数据集,并将其表示为数据流;
5.Zookeeper:分布式集群管理、master选举、消息发布订阅、数据存储、分布式锁等等。分布式协调服务,用于维护集群配置的一致性、任务提交的事物性、集群中服务的地址管理、集群管理等
6.Hbase:Hadoop下的分布式数据库,类似于NoSQL
7.Hive:数仓工具,Hive进行数据离线批量处理时,需将查询语言先转换成MR任务,由MR批量处理返回结果,所以Hive没法满足数据实时查询分析的需求。
8.Sqoop:用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递
Hadoop中各组件的作用相关推荐
- vue中组件的导出导入_5.2 vue中 keep-alive 组件的作用,详细解释keep-alive使用方法...
问题:vue中 keep-alive 组件的作用 keep-alive:主要用于保留组件状态或避免重新渲染. 比如: 有一个列表页面和一个 详情页面,那么用户就会经常执行打开详情=>返回列表=& ...
- 《小白兔到大黑牛》第十四篇Hadoop中五个进程作用
问题导读: 1.job的本质是什么? 2.任务的本质是什么? 3.文件系统的Namespace由谁来管理,Namespace的作用是什么? 4.Namespace 镜像文件(Namespace ima ...
- Hadoop中Context类的作用和Mapper<LongWritable, Text, Text, LongWritable>.Context context是怎么回事【笔记自用】
问题导读: 1.Context能干什么? 2.你对Context类了解多少? 3.Context在mapreduce中的作用是什么? 下面我们通过来源码,来得到Context的作用: 下面主要对Set ...
- Hadoop中Context类的作用
问题导读: 1.Context能干什么? 2.你对Context类了解多少? 3.Context在mapreduce中的作用是什么? 下面我们通过来源码,来得到Context的作用: 下面主要对Set ...
- vue中keepAlive组件的作用及使用方式
在面试的时候,很多面试官再问vue的时候可能就会提一嘴,你知道keep-alive有什么作用吗? keep-alive是vue内置的一个组件,而这个组件的作用就是能够缓存不活动的组件,我们能够知道,一 ...
- 试述hadoop生态系统以及每个部分的具体功能_Hadoop在大数据分析中的意义和作用...
什么是Hadoop? Apache Hadoop是一个开放源代码软件框架,用于开发在分布式计算环境中执行的数据处理应用程序. 使用HADOOP构建的应用程序可在分布在商用计算机群集上的大型数据集上运行 ...
- python中scrapy是什么_python爬虫中scrapy组件有哪些?作用是什么?
最近苹果12的消息一直活跃,连小编这种不是果粉的人都知道了.虽然苹果是一部性能不错的手机,但是它各个零件却是来源于不同的地方,可见再好的成品也是需要不同零件支撑的.那么,python爬虫中scrapy ...
- Hadoop 中zoo_0基础如何入门HADOOP
原标题:0基础如何入门HADOOP 学习一样东西,肯定先要了解这个东西是什么,那什么是HADOOP呢?我们就来看看什么是HADOOP和如何学习HADOOP及学习内容. 一,什么是HADOOP HADO ...
- 【Hadoop】Hadoop生态圈基本组件介绍
1. HDFS HDFS(Hadoop分布式文件系统)源于Google在2003年10月发表的GFS论文,HDFS是GFS的实现.HDFS通过流式数据访问,适合大数据集访问的应用程序.HDFS有一次写 ...
- 【大数据笔记】hadoop基础——各组件介绍
目录 故事背景 Hadoop 与大数据之间到底是什么关系? 1.数据存储:HDFS,一个分布式文件系统 2. 数据分析:MapReduce 计算引擎 HDFS(Hadoop 分布式文件系统) MapR ...
最新文章
- php中OR与|| AND与的区别
- 你知道 Redis 可以实现延迟队列吗?
- 从Grid R-CNN到Grid R-CNN Plus:基于网格的目标检测演化
- 微信小程序引入WeUI
- Detectron2学习笔记
- 可视化管理_RFID技术实施智能仓储管理可视化
- python用pip安装numpy mac_小白入门Python,mac下如何安装pip、ipython
- HttpHandler和ashx使用Session 出现未初始化异常
- Scala实现冒泡排序、归并排序和快速排序
- StringUtils,FileUtils,PropertiesUtils,DataBaseUtils
- 展开收起js动画效果
- 在框架中用JS设置target(用于location.href)
- 雷达卫星测高原理、最新发展情况
- Markdown打造高逼格博客
- python批量读取landsat8的波段
- android apk 微信登入_Android实现使用微信登录第三方APP的方法
- 每个前端工程师都应该了解的图片知识
- signature=4a882a48c4a4b2b41835e11b6fafa69f,ABB 38SC980002R375
- Java线程池与Lambda表达式
- CTO创新思维与能力