【发布时间】:2019-01-07 04:28:10
【问题描述】:
我正在将一个用 scala 编写的流应用程序移植到 python。我想手动提交 DStream 的偏移量。这是在 scala 中完成的,如下所示:
stream = KafkaUtils.createDirectStream(soomeConfigs)
stream.foreachRDD { rdd =>
val offsetRanges = rdd.asInstanceOf[HasOffsetRanges].offsetRanges
// some time later, after outputs have completed
stream.asInstanceOf[CanCommitOffsets].commitAsync(offsetRanges)
}
但我无法在 python 中找到类似的 API。能否请您指导我如何使用 python 客户端手动提交偏移量。
【问题讨论】:
标签: python apache-spark pyspark spark-streaming-kafka