【问题标题】:Filtering a grouped value in Pig过滤 Pig 中的分组值
【发布时间】:2013-06-25 15:36:45
【问题描述】:

我有一个正在分组的关系。我怎样才能像地图一样访问分组值?

data = load 'log.txt' as (id:chararray,name:chararray);
grouped = group data by id;
foreach data {
filtered = filter group by group.id=data.id;
};

我尝试迭代组并过滤结果包的一种方式。但我的情况是我必须迭代一个外部元组,然后必须从分组值中获取相应的包。我尝试了嵌套的 foreach,但出现以下异常,

 expression is not a project expression: (Name: ScalarExpression) Type: null Uid: null)

试了几种组合都没用。

【问题讨论】:

  • 请展示您的实际场景,而不是您已经找到解决方案的更简单的场景。
  • 不清楚你想要达到什么目的。你在过滤什么?为什么需要在 foreach 内部过滤而不是在 foreach 外部过滤?

标签: hadoop apache-pig


【解决方案1】:

根据this,似乎是PIG-1798 报告的错误。

【讨论】:

    猜你喜欢
    • 2012-10-21
    • 2020-12-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多