【发布时间】:2019-12-09 14:23:13
【问题描述】:
所以我有一个流分析工作,需要每小时计算一次……比如一个小时内状态为 1 的时间。状态值每 30 秒出现一次。我无法在查询中使用时间戳,因为我也在使用交叉引用命令。问题是一些数据迟到了。所以我想在处理数据之前等待 1 小时。我在想我可以使用
TumblingWindow(Duration(hour, 1), Offset(hour, -1))
所以我想如果查询在早上 8 点运行,它会处理从早上 6 点到 7 点传入的数据。对吗?但我看到的是,查询仍在处理上午 7 点到 8 点的数据。 我对offset的理解不正确吗??
【问题讨论】: