什么是shuffle?

从map方法的输出开始,到作为输入数据传给reduce方法的过程叫做shuffle.

shuffle流程是怎样的?

map端

map方法开始产生输出数据时,并不是简单地将它写到磁盘.

每个map任务都会有一个环形内存缓冲区用于存储map的输出数据。在默认情况下,缓冲区的大小为100MB,这个值可以通过mapreduce.task.io.sort.mb属性来调整。一旦缓冲区的内容达到阈值(默认是0.8,或者是80%,属属性是mapreduce.map.sort.spill.percent),一个后台线程便开始把内容溢写(spill)到磁盘里,这个位置由属性mapreduce.cluster.local.dir来指定的。在将数据溢写到磁盘过程中,map的输出数据继续写到缓冲区,但如果在此期间缓冲区被填满,map会被阻塞直到写磁盘过程完成。

在写磁盘之前,线程会根据分区器的逻辑把数据划分为不同的分区(partition)。然后,在每个分区中,后台线程会按键进行内存中排序(QuickSort,默认是字典顺序)。如果指定了一个combiner函数,它就在排序后的输出上运行。运行combiner函数使得map输出结果更紧凑,因此减少写到磁盘的数据和传递给reducer的数据。

每次内存缓冲区达到溢出阈值,就会新建一个溢出文件(spill file),因此在map任务写完其最后一个输出记录之后,可能会有几个溢出文件。在MapTask任务完成之前,多个溢出文件被合并成一个已分区且已排序的输出文件。配置属性mapreduce.task.io.sort.factor控制着一次最多能合并多少个文件,默认值是10。

如果至少存在3个溢出文件(通过mapreduce.map.combine.minspills属性设置)时,则combiner就会在输出文件写到磁盘之前再次运行。combiner可以在输入上反复运行,但并不影响最终结果。如果只有1或2个溢出文件,那么由于map输出规模减少,因而不值得调用combiner产生开销,因此不会为该map输出再次运行combiner。

为了使写磁盘的速度更快,节约磁盘空间,并且减少传给reducer的数据量,在溢写到磁盘的过程中对数据进行压缩往往是个很好的主意。在默认情况下,输出是不压缩的,但只要将mapreduce.map.output.compress设置为true,就可以轻松启用此功能。使用的压缩库由mapreduce.map.output.compress.codec指定。

reduce端

reducer通过HTTP得到输出文件的分区。用于文件分区的工作线程的数量由任务的mapreduce. shuffle.max. threads属性控制,此设置针对的是每一个节点管理器,而不是针对每个map任务。

现在转到处理过程的reduce部分。map输出文件位于运行MapTask的本地磁盘(注意,尽管map输出经常写到MapTask本地磁盘,但reduce输出并不这样)。现在,tasktracker需要为分区文件运行reduce任务。并且,
reduce任务需要集群上若干个map任务的map输出作为其特殊的分区文件。每个map任务的完成时间可能不同,因此在每个任务完成时,reduce任务就开始复制其输出。这就是reduce任务的复制阶段。reduce任务有少量复制线程,因此能够并行取得map输出。默认值是5个线程,但这个默认值可以修改设置mapreduce.reduce.shuffle. parallelcopies 属性即可。

reducer如何知道要从哪台机器取得map输出呢? map任务成功完成后,它们会使用心跳机制通知它们的application master。因此,对于指定作业,applicationmaster知道map输出和主机位置之间的映射关系。reducer中的一个线程定期询问master以便获取map输出主机的位置,直到获得所有输出位置。

由于第一个reducer可能失败,因此主机并没有在第一个reducer检索到map输出时就立即从磁盘上删除它们。相反,主机会等待,直到application master告知它删除map输出,这是作业完成后执行的。

如果map输出相当小,会被复制到reduce任务JVM的内存(缓冲区大小由mapreduce.reduce.shuffle.input. buffer.percent 属性控制,指定用于此用途的堆空间的百分比)(还是为了减少磁盘IO),否则,map输出被复制到磁盘。一旦内存缓冲区达到阈值大小(由 mapreduce.reduce.shuffle.merge.percent 决定)或达到 map 输出阈值(由 mapreduce. reduce. merge. inmem .threshold 控制),则合并后溢出写到磁盘中。如果指定combiner,则在合并期间运行它以降低写入硬盘的数据量。

随着磁盘上的溢写文件数量增多,后台线程会将它们合并为更大的、排好序的文件。这会为后面的合并节省一些时间。注意,为了合并,压缩的map输出(通过map任务)都必须在内存中被解压缩。

复制完所有map输出后,reduce任务进入排序阶段(更恰当的说法是合并阶段,因为排序是在map端进行的),这个阶段将合并map输岀,维持其顺序排序。这是循环进行的。比如,如果有50个map输出,而合并因子是10(10为默认设置,由mapreduce.task. io.sort.factor ,与 的合并类似),合并将进行 5 趟 ,每趟将10个文件合并成一个文件,因此最后有5个中间文件。

在最后阶段,即reduce阶段,直接把数据输入reduce函数,从而省略了一次磁盘往返行程,并没有将这5个文件合并成一个已排序的文件作为最后一趟。最后的合并可以来自内存和磁盘片段。

总结

  • shuffle中map端进行了几次排序?为什么.reduce端进行了几次排序?
  • shuffle中如何做可以减少磁盘IO

MR Shuffle流程 入门相关推荐

  1. spark shuffle流程入门

    shuffle操作 Spark中的某些操作会触发一个称为shuffle的事件.shuffle是Spark重新分发数据的机制,以便在分区之间以不同的方式分组.这通常涉及到在执行器和计算机之间复制数据,从 ...

  2. ERP流程入门_从会计分录理解企业基本流程[转]

    ERP流程入门_从会计分录理解企业基本流程 本贴写给尚未在企业工作过的朋友!了解企业的基本流程的一个方法是看它的会计分录,我们现在来看一个完整的企业基本流程,它的会计分录是如何做的,其中有些帐户名称可 ...

  3. 【Hadoop】MR 切片机制 MR全流程

    1.概念 2.Split机制 3.MR Shuffle过程 4.MR中REDUCE与MAP写作过程 5.MR全貌 转载于:https://www.cnblogs.com/junneyang/p/585 ...

  4. Unity_Shader,作用流程入门程精讲

    Unity_Shader 作用流程入门程精讲 Unity_Shader 渲染流水线 什么是渲染流水线 渲染流水线的各大阶段 应用阶段_程序与数据的读入 几何阶段_顶点着色器 光栅化阶段_片元着色器 简 ...

  5. shuffle流程理解

    shuffle流程理解 什么是shuffle流程? MapReduce确保每个reducer的输入都是按键排序的.系统执行排序,将map输出作为输入传给reducer的过程称为shuffle. 简单来 ...

  6. 图解hadoop的MR计算流程

    图解hadoop的MR计算流程: 1.左边部分是map阶段,右边部分是reduce阶段 1)我们可以看出左边的有四个map task,一般情况下一个map tasl处理一个split的数据,一个spl ...

  7. MR 切片机制 MR全流程

    1.概念 2.Split机制 3.MR Shuffle过程 4.MR中REDUCE与MAP写作过程 5.MR全貌

  8. MR架构、MR工作流程

    一.MR的架构 1.简介:MapReduce是一个软件框架,基于该框架能够容易地编写应用程序,这些应用程序能够运行在由上千个商用机器组成的大集群上,并以一种可靠的,具有容错能力的方式并行地处理上TB级 ...

  9. DirectX12_API流程入门篇

    本部分主要记录下使用D3D12入门所涉及到的API,记录简单使用方式供后期快速查找使用(数据参照龙书实现). 首先看一下DX12中拥有的管线能力: Raster Graphics Pipeline C ...

最新文章

  1. vim 打开中文乱码
  2. arcgis api for javascript 距离与面积量算
  3. Logstash+Redis+Elasticsearch+Kibana+Nginx搭建日志分析系统
  4. python turtle 颜色数字_python的绘图利器--海龟绘图turtle
  5. P3805 【模板】manacher算法
  6. AspectJ基于xml和基于注解
  7. redis java 遍历key_java遍历读取整个redis数据库实例
  8. 一个程序员如何做到结构上胸有成竹
  9. 笔记 我的Linux入门之路,我的LINUX之路----linux目录文件管理
  10. (转) 通过UUID在vSphere虚拟机内外识别硬盘
  11. linux和Windows之间共享文件
  12. iOS: 常用的宏
  13. 文档隐写溯源技术分析
  14. matlab win10 精简版下载,完美解决win10无法运行matlab问题
  15. Linux驱动中断函数参数详解
  16. 一个月10起融资,宠物经济正在掏空年轻人的钱包
  17. pdf太大,pdf怎么压缩的小一点
  18. 怎么把pdf文件压缩到最小?
  19. 麻烦大家给点C#的小程序的练习题做做,小女子谢谢了.......
  20. 新手小白入门编程第3讲 JAVA入门案例

热门文章

  1. 3h精通OpenCV(二)-基本功能
  2. 少和这种人在一起,不管你是谁!
  3. r语言 新增一列数字类型_R语言实战之R语言基础语法精讲(一)
  4. linux nfs限制连接数,linux – 对NFS有一个有效的稳定性参数吗?
  5. java辅助百度贴吧_【图片】【共同上进】新手java代码辅助代写贴,新手福音! 申精!_java吧_百度贴吧...
  6. webstorm设置注释颜色_PDF中的注释怎么用?这里有方法
  7. python ggplot为什么不能取代matplotlib_为什么geom_bar()不会像python ggplot中那样更改填充颜色?...
  8. java连接rabbitmq_Mac / Windows 下安装 RabbitMQ
  9. win10计算机怎么拨号上网,win10拨号连接怎么创建 win10宽带拨号连接如何设置
  10. python爬虫预测_从爬虫到机器学习预测,我是如何一步一步做到的?