【问题标题】:Spark Structured Streaming- Is it possible to write the offset twiceSpark Structured Streaming-是否可以两次写入偏移量
【发布时间】:2023-03-13 09:24:01
【问题描述】:

我正在使用 spark 结构化流来使用来自 kafka 主题的数据并将数据写入另一个 kafka 接收器。

我想存储偏移量两次 - 从主题中读取一次并搅拌偏移量。 其次,将数据写入输出接收器并写入偏移量时,可以通过提供检查点目录位置来实现,

是否可以写订阅主题时消耗的偏移量。

【问题讨论】:

    标签: apache-kafka offset spark-structured-streaming kafka-topic spark-checkpoint


    【解决方案1】:

    您可以使用StreamingQueryListener。您可以通过

    将侦听器添加到您的流中
    spark.streams.addListener(new StreamingQueryListener() {
    
      override def onQueryStarted(event: StreamingQueryListener.QueryStartedEvent): Unit = { 
    
        // insert code here to log the offsets in addition to Spark's checkpoint
    
      }
    
      override def onQueryProgress(event: QueryProgressEvent): Unit = {}
    
      override def onQueryTerminated(event: StreamingQueryListener.QueryTerminatedEvent): Unit = {}
    })
    

    【讨论】:

    • 嗨,迈克,您能提供一个相同的示例代码吗?
    猜你喜欢
    • 2018-04-26
    • 2021-05-22
    • 1970-01-01
    • 2020-09-03
    • 2019-07-30
    • 2020-03-19
    • 1970-01-01
    • 2017-12-31
    • 2016-10-01
    相关资源
    最近更新 更多