mapreduce图示原理深入详解,几张图搞定
单机版:内存受限,磁盘受限,运算能力受限
分布式:
|
|
- 一个mr程序启动的时候,最先启动的是MRAppMaster,MRAppMaster启动后根据本次job的描述信息,计算出需要的maptask实例数量,然后向集群申请机器启动相应数量的maptask进程
- maptask进程启动之后,根据给定的数据切片范围进行数据处理,主体流程为:
- 利用客户指定的inputformat来获取RecordReader读取数据,形成输入KV对
- 将输入KV对传递给客户定义的map()方法,做逻辑运算,并将map()方法输出的KV对收集到缓存
- 将缓存中的KV对按照K分区排序后不断溢写到磁盘文件
- MRAppMaster监控到所有maptask进程任务完成之后,会根据客户指定的参数启动相应数量的reducetask进程,并告知reducetask进程要处理的数据范围(数据分区)
- Reducetask进程启动之后,根据MRAppMaster告知的待处理数据所在位置,从若干台maptask运行所在机器上获取到若干个maptask输出结果文件,并在本地进行重新归并排序,然后按照相同key的KV为一个组,调用客户定义的reduce()方法进行逻辑运算,并收集运算输出的结果KV,然后调用客户指定的outputformat将结果数据输出到外部存储
mapreduce图示原理深入详解,几张图搞定相关推荐
- ForkJoin框架详解 一张图搞明白工作窃取(work-stealing)机制
1 ForkJoin框架 1.1 ForkJoin框架 ForkJoinPool一种ExecutorService的实现,运行ForkJoinTask任务.ForkJoinPool区别于其它Execu ...
- android 视网膜黄斑检查 amsler,自测黄斑病变 | 一张图搞定
原标题:自测黄斑病变 | 一张图搞定 关注 很多人提到黄斑都唯恐避之不及,但你知道吗?人体也有一个重要的"黄斑"部位是必须保护的那就是眼底黄斑区,它跟我们的视觉是密切相关的. 如果 ...
- 【一张图搞定关机程序】让你的代码有趣起来!送兄弟送闺蜜,快乐原来如此简单!(赋全过程和结果,超详细解说)
从这里开始让你的代码有趣起来 事情是这样的 关机程序 实现关机指令 代码实现 如何把程序送出去 故事后续 快乐传递 事情是这样的 你也许不会想到,简单的几行的代码居然可以带来如此多的快乐,那么事情究竟 ...
- Math:利用学生计算器计算一大堆的平均数和方差思维图文教程(一张图搞定!)
Math:利用学生计算器计算一大堆的平均数和方差思维图文教程(一张图搞定!) 目录 利用学生计算器计算一大堆的平均数和方差教程 利用学生计算器计算一大堆的平均数和方差教程 我们的学生计算器其实有很多功 ...
- MapReduce工作原理图文详解
前言: 前段时间我们云计算团队一起学习了hadoop相关的知识,大家都积极地做了.学了很多东西,收获颇丰.可是开学后,大家都忙各自的事情,云计算方面的动静都不太大.呵呵~不过最近在胡老大的号召下,我们 ...
- Odoo权限详解一张图
权限一张图 权限详解文字版 (部分转载并补充) 在Odoo中,使用用户组(res.groups)来管理权限,一个特殊的用户组是 员工/员工(base.group_user) 组,所有的用户都属于这个组 ...
- 可编程led灯带原理_88张图搞定层板灯带的设计、安装、收口及检修!
dop设计(ID:dopdesign)原创 作者丨泽顺 编辑丨那兰 "光之于空间,犹如空气之于生命" 光的存在赋予了空间生命和灵魂.无论是建筑空间还是室内装饰设计,光都是设计当中必 ...
- oauth2 增加token 返回参数_一张图搞定OAuth2.0
公众号:低并发编程(dibingfa) 目录 1.引言 2.OAuth2.0是什么 3.OAuth2.0怎么写 1.引言 本篇文章是介绍OAuth2.0中最经典最常用的一种授权模式:授权码模式 非常简 ...
- 一张图搞定OAuth2.0
1.引言 本篇文章是介绍OAuth2.0中最经典最常用的一种授权模式:授权码模式 非常简单的一件事情,网上一堆神乎其神的讲解,让我不得不写一篇文章来终结它们. 一项新的技术,无非就是了解它是什么,为什 ...
最新文章
- 周志华教授:关于深度学习的一点思考
- Unity3D中如何计算场景中的三角面和顶点数
- ssh 框架引入service_搭建SSH开发框架时autowired注入为空的问题
- Bitwise Exclusive-OR Sequence 异或,dfs,菊花图(2021.11.沈阳)
- BulkLoader类使用
- 专心写即时通讯软件争取CSDN认证专家
- LeetCode 476. Number Complement
- php二分查找例题,PHP实现的二分查找算法实例分析
- pyqt一个text实时显示另一个text的内容_python:基于tkinter打造的股票实时监控声音报警器! 自动监控,声音警报...
- J2EE架构的优点和缺点有哪些
- matlab做聚类分析(简单的直接用clusterdata)
- 基于Multisim14的弱信号放大电路的设计与仿真
- 惯性导航讲解(概念以及主要部件的讲解)
- 【APP加载H5页面加载流程概述及提速方案】
- 程序员的算法趣题Q62: 日历中的最大矩形
- C# 打印自定义纸张设置
- Android开发学习心得 (一) 生如夏花之绚烂,死如秋叶之静美 -- App的生死轮回
- archlinux触摸板设置
- java 读取psd,寻找Java库以使用PSD格式
- Android计步模块(类似微信运动)