【发布时间】:2018-06-18 18:11:17
【问题描述】:
是否有一个 Hive UDF 可以创建具有唯一值的地图? 例如:
col_1 | col_2
-------------
a | x
a | y
b | y
b | y
c | z
c | NULL
d | NULL
这应该返回一个如下的地图
{ a : [x,y], b : [y], c:[z] }
我正在寻找类似于 presto 的 multimap_aggfunction
【问题讨论】:
-
你需要输出一行吗?