【发布时间】:2015-07-15 16:57:38
【问题描述】:
假设我有 3 个文件要存储在 HDFS 中并希望通过 MapReduce 读取它们。
因此,HDFS 位置/omega/usecase/input 中有 3 个文件,分别为 file1.txt、file2.txt、file3.txt
这3个文件的大小是file1.txt(64MB),file2.txt(32MB),file3.txt(1MB)
还假设默认块大小为 64MB,复制因子为 3
我想知道这 3 个文件会有多少块,以及如果我编写一个读取输入目录 /omega/usecase/input 的 MapReduce 程序将执行多少个映射器
【问题讨论】:
-
Small files and HDFS blocks 的可能重复项
-
那么答案应该是 3 Mappers?对吗?