【发布时间】:2018-11-15 09:31:01
【问题描述】:
我有一个结构化的流式查询,它下沉到 Kafka。此查询具有复杂的聚合逻辑。
我想将此查询的输出 DF 下沉到多个 Kafka 主题,每个主题都分区在不同的“键”列上。我不想为每个不同的 Kafka 主题设置多个 Kafka 接收器,因为这意味着运行多个流式查询 - 每个 Kafka 主题一个,特别是因为我的聚合逻辑很复杂。
问题:
有没有办法将结构化流式查询的结果输出到多个 Kafka 主题,每个主题都有不同的键列,但不必执行多个流式查询?
如果不是,那么级联多个查询是否有效,这样第一个查询进行复杂的聚合并将输出写入 Kafka,然后其他查询只读取第一个查询的输出并将其主题写入Kafka 从而避免再次进行复杂的聚合?
提前感谢您的帮助。
【问题讨论】:
标签: apache-spark spark-structured-streaming