【发布时间】:2013-04-01 07:02:32
【问题描述】:
假设我们有 3 个映射器(m1、m2 和 m3)和 2 个减速器(r1 和 r2)。
每个 reducer 从每个 mapper 生成的文件中获取其输入分区。
从作业历史中,我可以提取每个reduce任务的总输入, 但我想知道每个映射器对这个 reducer 输入的贡献?
例如reducer r1会收到一个INPUT_r1如:
INPUT_r1 = (从 m1 获取的分区) + (从 m2 获取的分区) + (从 m3 获取的分区)
我想知道映射器中这些分区的大小?
【问题讨论】: