【发布时间】:2014-07-23 10:19:24
【问题描述】:
mapred 任务是一个由 Java 实现的非常简单的“字数统计”(请参阅 http://wiki.apache.org/hadoop/WordCount)。
在最后一行之后,“job.waitForCompletion(true);” 我添加了一些由 Jython 实现的代码。
这意味着 Jythoon 的库仅在 namenode 上需要。 但是,我将 Jython 的所有库添加到一个 jar 中,然后 执行它
hadoop jar wordcount.jar in out
字数统计没有任何问题。
我要解决的问题是我必须为从节点(映射器和化简器)不需要的大量 Jython 库。 jar 几乎是 15M(超过 14M 用于 Jython)。
我可以拆分它们并得到相同的结果吗?
【问题讨论】: