【发布时间】:2018-04-14 10:18:50
【问题描述】:
我正在使用 Presto 和 Zeppelin。有很多原始数据。 我必须总结这些数据。
我想每 5 秒分组一次。
serviceType logType date
------------------------------------------------------
service1 log1 2017-10-24 23:00:23.206
service1 log1 2017-10-24 23:00:23.207
service1 log1 2017-10-24 23:00:25.206
service2 log1 2017-10-24 23:00:24.206
service1 log2 2017-10-24 23:00:27.206
service1 log2 2017-10-24 23:00:29.302
然后是结果
serviceType logType date cnt
--------------------------------------------------------------
service1 log1 2017-10-24 23:00:20 2
service2 log1 2017-10-24 23:00:20 1
service1 log1 2017-10-24 23:00:25 1
service1 log2 2017-10-24 23:00:25 2
首先,我必须将存储的数据迁移到新表。
其次,我必须对数据进行分组并实时保存到新表中。
sql脚本很难写。
请帮帮我。
我必须使用 python 解释器吗?
【问题讨论】:
标签: sql apache-zeppelin presto