【发布时间】:2014-07-22 13:29:21
【问题描述】:
如何在单个 Map Reduce 作业中使用 Scalding(/cascading) 根据键写入多个输出。我当然可以对所有可能的键使用.filter,但这是一种可怕的黑客攻击,会激发很多工作。
【问题讨论】:
标签: scala hadoop mapreduce cascading scalding
如何在单个 Map Reduce 作业中使用 Scalding(/cascading) 根据键写入多个输出。我当然可以对所有可能的键使用.filter,但这是一种可怕的黑客攻击,会激发很多工作。
【问题讨论】:
标签: scala hadoop mapreduce cascading scalding
Scalding 中有TemplatedTsv(0.9.0rc16 及以上版本),与 Cascading TemplateTsv 完全相同。
Tsv(args("input"), ('COUNTRY, 'GDP))
.read
.write(TemplatedTsv(args("output"), "%s", 'COUNTRY))
// it will create a directory for each country under "output" path in Hadoop mode.
【讨论】:
【讨论】:
级联用户组上的This suggestion 建议使用Cascading TemplateTap。不知道如何将其连接到 Scalding。
【讨论】: