【发布时间】:2020-07-05 20:34:35
【问题描述】:
我想使用 Pig 脚本为过滤的数据集/记录提供像 1、2、... 这样的索引,我正在以设置的格式加载到表中,所以当我添加索引/id 时我无法添加加载。我尝试了 Rank 功能,但它在我的公司环境下不起作用,我不能使用 UDF。目前的代码是这样的,我想给filterTable插入索引。
table1 = LOAD 'tmp' using TransactionLoader(...);
filterTable = FOREACH table1 {
rec = FILTER records BY (record MATCHES '.*\t2\t.*');
GENERATE rec;
};
非常感谢任何帮助,谢谢!
【问题讨论】:
标签: hadoop apache-pig