【发布时间】:2021-09-14 20:37:26
【问题描述】:
根据Documentation,Sink 连接器确保 Exactly-Once-Delivery。
在连接器任务线程失败的情况下如何确保Exact-Once-Delivery?
它会删除失败的任务线程创建的文件吗?还是将损坏/部分文件留在 HDFS 中?
连接器使用预写日志来确保每条记录仅写入一次 HDFS。此外,连接器通过将 Kafka 偏移量信息编码到 HDFS 文件中来管理偏移量,以便在失败和任务重新启动的情况下,它可以从最后提交的偏移量开始。
请帮帮我。
【问题讨论】:
标签: apache-kafka hdfs apache-kafka-connect confluent-platform