【发布时间】:2018-02-11 18:33:08
【问题描述】:
文件存储在大小为 260 MB 的 HDFS 中,而 HDFS 默认块大小为 64 MB。在对这个文件执行 map-reduce 作业后,我发现它创建的输入分割数只有 4。是怎么计算的。?剩下的 4 MB 在哪里?非常感谢任何意见。
【问题讨论】:
标签: hadoop mapreduce hadoop2 input-split
文件存储在大小为 260 MB 的 HDFS 中,而 HDFS 默认块大小为 64 MB。在对这个文件执行 map-reduce 作业后,我发现它创建的输入分割数只有 4。是怎么计算的。?剩下的 4 MB 在哪里?非常感谢任何意见。
【问题讨论】:
标签: hadoop mapreduce hadoop2 input-split
输入分割并不总是一个块大小。输入拆分是数据的逻辑表示。您的输入拆分可能是 63mb、67mb、65mb、65mb(或可能基于逻辑记录大小的其他大小)...请参阅以下链接中的示例...
【讨论】: