【发布时间】:2013-05-02 21:12:45
【问题描述】:
我想按给定字段分组并获得分组字段的输出。下面是我想要实现的一个例子:-
想象一个名为“sample_table”的表,其中包含如下两列:-
F1 F2
001 111
001 222
001 123
002 222
002 333
003 555
我想编写 Hive 查询,它会给出以下输出:-
001 [111, 222, 123]
002 [222, 333]
003 [555]
在 Pig 中,这可以通过以下方式轻松实现:-
grouped_relation = GROUP sample_table BY F1;
有人可以建议在 Hive 中是否有一种简单的方法可以做到这一点?我能想到的是为此编写一个用户定义函数 (UDF),但这可能是一个非常耗时的选项。
【问题讨论】:
标签: sql hadoop hive apache-pig bigdata