【发布时间】:2018-05-29 18:02:31
【问题描述】:
我有一个名为 A 的 Kafka 主题。
主题A中的数据格式为:
{ id : 1, name:stackoverflow, created_at:2017-09-28 22:30:00.000}
{ id : 2, name:confluent, created_at:2017-09-28 22:00:00.000}
{ id : 3, name:kafka, created_at:2017-09-28 24:42:00.000}
{ id : 4, name:apache, created_at:2017-09-28 24:41:00.000}
现在在消费者方面,我只想获取一小时窗口的最新数据意味着每隔一小时我需要根据 created_at 从主题获取最新值
我的预期输出是:
{ id : 1, name:stackoverflow, created_at:2017-09-28 22:30:00.000}
{ id : 3, name:kafka, created_at:2017-09-28 24:42:00.000}
我认为这可以通过 ksql 解决,但我不确定。请帮帮我。
提前致谢。
【问题讨论】:
-
你的钥匙是什么?
-
认为key可能是message 1、message 2等等......上面提到的是values
-
酷。只是想确保您牢记密钥,因为 Kafka Streams 根据密钥聚合/分组/执行所有操作。
标签: apache-kafka apache-kafka-streams ksqldb