【问题标题】:Extract element of a tuple in a bag on PIG在 PIG 上的包中提取元组的元素
【发布时间】:2020-11-17 20:40:02
【问题描述】:

我是一名 Java 开发人员,必须关闭 PIG 脚本的火,但我遇到了一个恼人的包问题。

我得到了这个分组结果的包:

{(GET_DIRECTIONS),(GET_DIRECTIONS)}

我只需要 GET_DIRECTIONS,包中的位置无关紧要,因为我最糟糕的情况是一个包含三个元素且值完全相同的包(我知道,我们遇到了设计问题,但我无法做很多事情来解决它)

所以我尝试的第一件事是(没有阅读 apache 文档):

$1.state[0] as state

但它失败了,因为包里没有索引这样的东西,所以阅读文档我尝试了类似的东西:

$1.state.$0 as state

没有失败但仍然得到{(GET_DIRECTIONS),(GET_DIRECTIONS)}

有没有简单的方法提取包中元组的内容?

【问题讨论】:

    标签: hadoop mapreduce apache-pig


    【解决方案1】:

    我明白了,展平作品。

    FLATTEN($1.state) as state

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-06-16
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多