【发布时间】:2014-11-12 13:31:01
【问题描述】:
我正在学习 Apache Pig,但在实现我的愿望时遇到了问题。 我有这个对象(在进行 GROUP BY 之后):
MLSET_1: {group chararray,MLSET: {(key: chararray, text: chararray)}}
仅当某个模式 (PATTERN_A) 出现在文本中并且另一种模式 (PATTERN_B) 没有出现在一个键的文本字段中时,我才想生成键。
我知道我可以使用 MLSET.text 来获取特定键的所有文本值的元组,但是在如何从元组中过滤项目列表时我仍然遇到同样的问题。
这是一个例子:
(key_A,{(key_A,start),(key_A,stop),(key_A,unknown),(key_A,whatever)})
(key_B,{(key_B,stop),(key_B,whatever)})
(key_C,{(key_C,start),(key_C,stop),(key_C,whatever)})
我想获取出现“开始”且未出现“未知”的行的键。在这个例子中,我将只得到 key_C 作为结果。
提前感谢您的帮助!
【问题讨论】:
标签: hadoop apache-pig