【发布时间】:2017-08-20 03:49:44
【问题描述】:
我可以看到火花流窗口功能仅根据“何时收到数据”进行分组。我想根据数据本身中可用的时间戳字段进行分组。可能吗?
例如 - 数据创建时间戳在下午 1 点作为数据的一部分提供。但 Spark Streaming 在下午 1.05 收到了数据。因此,它应该根据数据中可用的时间戳(下午 1 点)进行分组。
【问题讨论】:
-
查看 Spark 结构化流的水印
标签: apache-spark pyspark spark-streaming