【发布时间】:2016-06-12 08:00:05
【问题描述】:
当 hdfs 不可用时,有没有办法确保数据安全?场景是:kafka-source、flume memory-channel、hdfs-sink。如果flume服务宕机了,是否可以存储topic的分区偏移量,恢复后从正确的位置消费?
【问题讨论】:
标签: apache-kafka flume
当 hdfs 不可用时,有没有办法确保数据安全?场景是:kafka-source、flume memory-channel、hdfs-sink。如果flume服务宕机了,是否可以存储topic的分区偏移量,恢复后从正确的位置消费?
【问题讨论】:
标签: apache-kafka flume
通常(使用默认配置),kafka 存储所有消费者的主题偏移量。如果您使用相同的组 id(消费者属性之一)启动水槽源,kafka 将直接从源的偏移量开始发送消息。但是已经从 kafka 读取并存储在内存通道中的消息将由于 HDFS sink 故障而丢失。
【讨论】: