【发布时间】:2014-04-30 22:47:56
【问题描述】:
我试图在 Hadoop 中做一些简单的事情,发现在编写映射器和化简器时,到处都被定义为静态的。我的任务将被分解成几个map 部分和最后一个reduce。如果我想在其他工作中重用我的一个映射器怎么办?如果我将映射器类定义为内部static,我可以在其他工作中使用它吗?同样重要的问题可能需要更多更复杂的映射器,因此在维护时将它们全部放在一个巨大的文件中会变得很糟糕。
有没有办法将映射器和化简器作为常规类(甚至可能在单独的 jar 中)而不是作业本身?
【问题讨论】: