【发布时间】:2013-02-21 18:59:35
【问题描述】:
如果有这样的数据:
A = LOAD 'data' AS (a1:int,a2:int,a3:int);
DUMP A;
(1,2,3)
(4,2,1)
然后在A,A上做一个cross-join:
B = CROSS A, A;
DUMP B;
(1,2,3)
(4,2,1)
为什么第二个 A 从查询中优化出来?
信息:猪 0.11 版
== 更新 ==
如果我对 A 进行排序:
C = ORDER A BY a1;
D = CROSS A, C;
它将给出正确的交叉连接。
【问题讨论】:
标签: apache-pig cross-join