【发布时间】:2011-11-27 11:27:50
【问题描述】:
在 Hadoop 数据的 shuffle 阶段,映射的数据在集群的节点之间传输 根据减速器的分区。 Hadoop 使用什么协议在 reduce 阶段跨节点执行数据混洗?
【问题讨论】:
标签: hadoop protocols mapreduce distributed-computing
在 Hadoop 数据的 shuffle 阶段,映射的数据在集群的节点之间传输 根据减速器的分区。 Hadoop 使用什么协议在 reduce 阶段跨节点执行数据混洗?
【问题讨论】:
标签: hadoop protocols mapreduce distributed-computing
我第一次真的笑了,但是整个洗牌和合并都是由HTTPServlet完成的。
您可以在匿名类MapOutputServlet 中的Tasktrackers 源代码中看到这一点,它获取一个带有任务和作业ID 的HTTP 请求,然后它将传入的输入流传输到磁盘上的本地文件系统中。
【讨论】: