【发布时间】:2017-08-28 14:20:57
【问题描述】:
要求是在 Pig 中过滤特定日期的记录。所以样本数据如下:
date_time visits count
2017-08-25 02:05:11 12345 5
2017-08-25 02:05:31 23456 7
2017-08-25 02:05:51 34567 1
2017-08-25 02:06:40 13423 3
在上述情况下,我们只需要前 3 个命中。所以过滤条件将是 start_time == 02:05:00 和 end time == 02:06:00
有什么方法可以在 Pig 中实现吗?我浏览了所有内置函数,但它们都是迄今为止特定的。时间部分没有工作。
如果您需要这方面的更多信息,请告诉我。
【问题讨论】:
标签: hadoop filter mapreduce apache-pig