【发布时间】:2021-02-19 13:47:16
【问题描述】:
我需要从多个 Kafka 主题[基于 Avro] 进行流式传输,并将它们放入 Greenplum 中,并对有效负载进行少量修改。
Kaka 主题在配置文件中定义为一个列表,每个 Kafka 主题将有一个目标表。
我正在寻找单个 Spark 结构化应用程序和配置文件中的更新以收听新主题或停止。听主题。
我正在寻求帮助,因为我对使用单个查询与多个查询感到困惑:
val query1 = df.writeStream.start()
val query2 = df.writeStream.start()
spark.streams.awaitAnyTermination()
或
df.writeStream.start().awaitAnyTermination()
在哪些用例中应该使用多个查询而不是单个查询
【问题讨论】:
标签: scala apache-spark apache-spark-sql spark-streaming spark-structured-streaming