0


MapReduce编程规范

MapReduce编程规范

MapReduce的开发一共有八个步骤,其中Map阶段分为2个步骤,Shuffle阶段4个步骤,Reduce阶段分为2个步骤。

  • Map阶段2个步骤
  1. 设置InputFormat类,将数据切分为Key-Value(K1和V1)对,输入到第二步。
  2. 自定义Map逻辑,将第一步的结果转换成另外的 Key-Value (K2,V2)对,输出结果
  • Shuffle阶段4个步骤
  1. 对输出的Key-Value对进行分区
  2. 对不同分区的数据按照相同的 Key排序
  3. (可选)对分组过的数据初步规约,降低数据的网络拷贝
  4. 对数据进行分组,相同Key的value放入一个集合中
  • Reduce阶段2个步骤
  1. 对多个Map任务的结果进行排序以及合并,编写Reduce函数实现自己的逻辑,对输入的Key-Value进行处理,转为新的Key-Value(K3和V3)输出
  2. 设置OutputFormat处理并保存Reduce输出的Key-vajue数据

本文转载自: https://blog.csdn.net/zhongjianboy/article/details/128960424
版权归原作者 卑微小钟 所有, 如有侵权,请联系我们删除。

“MapReduce编程规范”的评论:

还没有评论