【发布时间】:2022-03-16 21:07:37
【问题描述】:
我在 Kafka 中默认存储了 7 天的最新流数据:
log.retention.hours=168
在部署新版本的 Streams 应用程序时,需要花费大量时间来处理旧数据才能真正使用它。
除了缩短保留期之外,还有什么方法可以让它更快吗?
我想到的是,在处理完所有数据之前,不应将状态存储保存到磁盘。
【问题讨论】:
-
保留用于非紧凑主题。状态存储存储在压缩主题中,并且可以无限期保留,因此,是的,读取它们需要很长时间,而且没有真正的好方法
标签: apache-kafka apache-kafka-streams