【发布时间】:2013-01-31 21:42:59
【问题描述】:
我有一个数据集,我对它进行了多次映射。
假设我有 3 个用于 reduce 函数的键值对,如何修改输出以使我有 3 个 blobfiles - 每个键值对一个?
如果我可以进一步澄清,请告诉我。
【问题讨论】:
-
目前mapreduce管道的输出会自动输出单个key到blobfile(包含所有3个key-value对)。
-
我想我正在寻找的是类似于 Hadoop 中的 MultipleOutputs 类,您可以在其中写入不同的输出。
标签: python google-app-engine mapreduce