【发布时间】:2010-07-08 08:12:39
【问题描述】:
我的 map/reduce 输出的值是一个字节可写数组,它被写入输出文件 part-00000(hadoop 默认这样做)。我的下一个地图函数需要这个数组,所以我想把这个数组保存在分布式缓存中。有人能告诉我如何从可能不是文本文件的输出文件(part-00000)中读取并存储在分布式缓存中。
【问题讨论】:
-
一般来说 Hadoop 会输出一个包含很多部分...文件的目录。你不能假设你只有一个输出文件。