【发布时间】:2017-11-30 13:30:47
【问题描述】:
我有一个格式的数据集,
student_id|name|subject|marks
2 John English 50
3 mark Maths 50
3 mark English 50
这个数据被加载到 HDFS 中,我需要使用 pig 计算每个学生所有科目的平均值,这样做的 pig 方法是什么。
【问题讨论】:
标签: mapreduce apache-pig