direct是一对一的模式,相对于receiver模式,简化了并行度,没有使用zookeeper来维护消费者偏移量,默认用spark来维护消费者偏移量,默认保存在内存中,如果设置了checkpoint的话,会保存在checkpoint中。(receiver中是借助于zookeeper来维护消费者偏移量的),是低级API来实现的。

SparkStreaming部分:SparkStreaming+Kafka 的direct模式【图片+文字说明】

消费数据的时候,假如有200条数据,上一次消费到100条,下一次接着第101条数据开始消费,不会有数据丢失。

相关文章:

  • 2021-08-11
  • 2021-12-25
  • 2021-07-16
  • 2021-05-05
  • 2022-01-07
  • 2021-12-19
  • 2022-12-23
猜你喜欢
  • 2021-05-04
  • 2021-08-01
  • 2021-08-02
  • 2021-07-08
  • 2021-11-22
  • 2021-11-07
  • 2022-12-23
相关资源
相似解决方案