【发布时间】:2018-11-12 18:37:22
【问题描述】:
我了解主题是不可变的。
假设您的主题状态不佳。数据部分乱序、重复记录等。清理这些数据的过程是什么?这个过程如何影响下游消费者?
我看到了几种不同的方法来处理这个问题:
消费者不会听第一个主题,而是听经过整理的衍生品。
版本主题并使用重复数据删除逻辑重写数据。然后让消费者改变他们听的主题。但后来我遇到了这样一种情况,即记录要么被缓冲,要么与旧记录交错,而新记录不断涌入。
还有哪些其他方法可以处理这种情况?
【问题讨论】:
标签: apache-kafka stream-processing