【发布时间】:2014-09-09 07:09:48
【问题描述】:
我想在 oozie 工作流中为现有的 mapreduce jar(带有映射器、reducer 有时还包括组合器)文件配置一个 mapreduce 操作,这样只有 reducer/combiner 在输入文件上运行。
【问题讨论】:
标签: hadoop mapreduce workflow oozie oozie-coordinator
我想在 oozie 工作流中为现有的 mapreduce jar(带有映射器、reducer 有时还包括组合器)文件配置一个 mapreduce 操作,这样只有 reducer/combiner 在输入文件上运行。
【问题讨论】:
标签: hadoop mapreduce workflow oozie oozie-coordinator
所有 MapReduce 作业都必须运行映射阶段,但是您可以让映射器通过以下任一方式直接传递数据:
IdentityMapper
Mapper 类【讨论】: