【发布时间】:2020-05-17 20:52:27
【问题描述】:
Apache Flink 提供了一种容错机制来持续恢复数据流应用程序的状态。该机制确保即使出现故障,程序的状态最终也会将数据流中的每条记录准确地反映一次。
我需要了解以下链接中的答案: Flink exactly-once message processing
这是否意味着 Flink Sink 会对 Cassandra 等外部系统产生重复事件?
例如:
1 - 我有以下流程:source -> flatMap with state -> sink 和配置的快照间隔为 20 秒。
如果任务管理器在两个快照之间(上一个快照 10 秒后和下一个快照前 10 秒)发生故障(Killed)会发生什么。
我知道 Flink 会从最后一个快照重新开始作业。
在这种情况下,Sink 将重新处理在上次快照和停机时间之间已经处理的所有记录?
【问题讨论】:
标签: apache-flink flink-streaming