【发布时间】:2015-08-25 13:18:26
【问题描述】:
假设我有如下输入文件
dept_id emp_id salary
1 13611 1234
2 13609 3245
3 13612 3251
2 13623 1232
1 13619 6574
3 13421 234
现在我想找到每个部门的平均工资。像下面的 Hive 查询:
SELECT dept_id, avg(salary) FROM dept GROUP BY dept_id
这将返回输出:
dept_id avg_sal
----------------
1 3904.0
2 2238.5
3 1742.5
现在,我想做的是生成相同的输出,但使用 mapreduce 框架。那么怎么写呢?提前致谢!
【问题讨论】:
-
尝试一下,发布您尝试过的内容,我们会提供帮助。
-
你可以先研究一下map reduce的“字数”...
-
@vefthym 我再次编辑问题
标签: java hadoop mapreduce hive