hadoop - MR工作的各个阶段的正确顺序？

时间：2018-03-09 05:27:48

标签： hadoop mapreduce yarn hadoop2

我试图了解MR Job经历的各个阶段。我阅读了相同的在线文档。

基于此，我对序列的理解如下：

map（） - ＆gt;分区程序 - ＆gt;排序（在映射机上） - ＆gt;随机 - ＆gt;分拣（在减速机上） - ＆gt; groupBy（Key）（在reducer机器上） - ＆gt;减少（）

这是MR作业执行的正确顺序吗？

答案 0 :(得分：2)

地图的各个阶段减少了工作：

地图阶段：

分区阶段

随机播放阶段

排序阶段

减少阶段

答案 1 :(得分：1)

地图减少作业的时间表

MapTask的时间轴

ReduceTask的时间表

图片来源：https://www.slideshare.net/EmilioCoppa/hadoop-internals