【发布时间】:2015-11-16 22:38:54
【问题描述】:
我想用mrjob 声明一个映射器函数。因为我的mapper函数需要引用一些常量来做一些计算所以我决定把这些常量放到mapper中的Key中(有没有其他方法?)。我在this site 上阅读了 mrjob 教程,但所有示例都忽略了关键。例如:
class MRWordFrequencyCount(MRJob):
def mapper(self, _, line):
yield "chars", len(line)
yield "words", len(line.split())
yield "lines", 1
def reducer(self, key, values):
yield key, sum(values)
基本上,我想要类似的东西:
def mapper(self, (constant1,constant2,constant3,constant4,constant5), line):
My calculation goes here
请建议我怎么做。谢谢
【问题讨论】:
标签: python hadoop mapreduce mrjob