一、Map端的主要工作

为来自不同表或文件的key/value对,打标签以区别不同来源的记录。

然后用连接字段作为key,其余部分和新加的标志作为value,最后进行输出。

二、Reduce端的主要工作

在Reduce端以连接字段作为key的分组已经完成,

我们只需要在每一个分组当中将那些来源于不同文件的记录(在Map阶段已经打标志)分开,

最后进行合并就ok了。

相关文章:

  • 2021-04-25
  • 2022-01-31
  • 2022-02-07
  • 2021-04-25
  • 2021-09-14
  • 2021-12-05
  • 2022-12-23
猜你喜欢
  • 2021-10-29
  • 2022-12-23
  • 2021-07-20
  • 2021-12-13
  • 2021-04-03
  • 2022-01-08
  • 2021-05-06
相关资源
相似解决方案