【问题标题】:Apache Pig Student Marks Average CalculationApache Pig 学生成绩平均计算
【发布时间】:2017-11-30 13:30:47
【问题描述】:

我有一个格式的数据集,

student_id|name|subject|marks

2          John English   50

3          mark Maths     50

3          mark English   50

这个数据被加载到 HDFS 中,我需要使用 pig 计算每个学生所有科目的平均值,这样做的 pig 方法是什么。

【问题讨论】:

    标签: mapreduce apache-pig


    【解决方案1】:

    按学生分组并获取平均值。假设您已将数据加载到关系 A。

    B = GROUP A BY (student);
    C = FOREACH B GENERATE group,AVG(A.marks);
    DUMP C;
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-08-25
      • 2015-05-31
      • 1970-01-01
      相关资源
      最近更新 更多