【发布时间】:2013-02-01 06:16:10
【问题描述】:
Apache Pig 是否支持 UNGROUP 操作?我想没有。那么有人可以帮我解决这个问题吗? 我有一排表格
1,a-b-c
2,d-e-f
3,g-h
我想把它展开成表格
1,a
1,b
1,c
2,d
2,e
2,f
3,g
3,h
任何帮助表示赞赏。
【问题讨论】:
标签: hadoop mapreduce apache-pig
Apache Pig 是否支持 UNGROUP 操作?我想没有。那么有人可以帮我解决这个问题吗? 我有一排表格
1,a-b-c
2,d-e-f
3,g-h
我想把它展开成表格
1,a
1,b
1,c
2,d
2,e
2,f
3,g
3,h
任何帮助表示赞赏。
【问题讨论】:
标签: hadoop mapreduce apache-pig
您可能应该使用内置 STRSPLIT 将您的第二个字段拆分为多个标记,然后应用 FLATTEN 为每个元素创建 1 行。像这样的:
A = LOAD 'input.txt' as (id, data);
B = FOREACH A GENERATE id, FLATTEN(STRSPLIT(data,'-'));
【讨论】: