【发布时间】:2014-02-12 17:19:07
【问题描述】:
我有一些 csv 格式的数据。
例如 K1,K2,data1,data2,data3
在这里,我的映射器将密钥作为 K1K2 传递给减速器 & 值为 data1,data2,data3
我想将这些数据保存在多个文件中,文件名为 K1k2(或 reducer 获取的密钥)。现在如果我使用 MultipleOutputs 类,我必须在映射器开始之前提及文件名。但是在这里,由于只有从映射器读取数据后,我才能确定密钥。我该怎么办?
PS 我是新手。
【问题讨论】: