【发布时间】:2018-02-06 16:50:35
【问题描述】:
我有一个带有两列的蜂巢表。两列的类型都是字符串。一个是简单的客户端 ID,另一个是命令分隔的项目 ID 字符串。可以有多行具有相同的客户端 ID 但不同的项目 ID 字符串。
我想要一个生成包含两列的表的配置单元查询。一个是客户端 ID,另一个是逗号分隔的字符串,所有唯一的项目 ID。
原表中的数据:
Client Id Item Ids
1 1,2,3,4
2 3,4,6,8
4 4,5,1,3
2 3,4,7,8
3 5,6,8,2
4 7,8,9,4
查询应该生成这个结果
Client Id Item Ids
1 1,2,3,4
2 3,4,7,6,8
4 4,5,1,3,7,8,9
3 5,6,8,2
【问题讨论】:
标签: string hive hiveql explode