【发布时间】:2020-10-21 11:36:20
【问题描述】:
我有两个文件要合并在一起。这两个文件的格式如下 - 第一个文件(f.txt)
Siler 1001
Gold 8009
第二个文件(s.txt)
Apple 100
Banana 200
我希望最终合并的文件看起来像 -
Siler 1001
Gold 8009
Apple 100
Banana 200
我一直在尝试使用以下代码来执行此操作 -
data1 = LOAD 'f.txt' AS name:chararray, num:int;
data2 = LOAD 's.txt' AS name:chararray, num:int;
data3 = UNION data1, data2;
data4 = GROUP data3 BY name;
data5 = FOREACH data4 GENERATE group, data3.num;
STORE data5 INTO 'final.txt';
但是使用代码输出就像 -
Silver {(1001)})
Gold {(8009)}
Apple {(100)}
Banana {(200)}
我希望输出数据看起来像我上面提到的那样。任何建议我如何实现这一目标。
【问题讨论】:
标签: hadoop apache-pig