【发布时间】:2017-08-20 22:40:06
【问题描述】:
我在蜂巢表中有如下数据集
date col1 col2 col3
2016-02-01 A X 5
2016-02-03 A X 5
2016-02-04 A X 5
2016-03-01 A X 6
2016-04-01 A X 5
2016-04-02 A Y 5
2016-04-03 A Y 5
我必须对 col 1 和 col2 进行选择性分组,只要 col3 值发生变化,就会形成一个组,例如 col3 值在 row4 中从 5 更改为 6,我必须获取日期列并获取最小值和最大值。 输出应该是这样的。
col1 col2 col3 minDate maxDate
A X 5 2016-02-01 2016-02-04
A X 6 2016-03-01 2016-03-01
A X 5 2016-04-01 2016-04-01
A Y 5 2016-04-02 2016-04-03
我确信 col1 和 col2 上的简单 group by 无法正常工作。 任何人都可以请提出一种方法来实现这一点吗?
【问题讨论】:
标签: sql group-by hive data-analysis bigdata