【发布时间】:2014-02-14 11:33:13
【问题描述】:
我需要一些帮助,如何在 pig 中达到某个领域只记录一条记录。
A = load .... ;
/* 数据如下:
transaction_id、prod_id、日期
1、123、20140102
1、124、20140102
1、125、20140102
2、233、20140107
2、245、20140107
3、255、20140109 */
B = GROUP A BY transaction_id;
C = FOREACH B {
limited = LIMIT A 1;
GENERATE FLATTEN(limited);
};
我希望它返回 3 条记录,但只返回 1 条记录。
我做错了什么?
感谢您提前回复。
【问题讨论】:
-
你能发布一个你得到的实际输出的sn-p吗?
-
感谢您的回复,我发现了问题。真丢脸,但我忘记在加载时更改字段分隔符,这就是为什么它只返回一条记录。
标签: apache-pig