【发布时间】:2021-07-29 14:48:27
【问题描述】:
我曾多次使用 HDFS 和 Kafka,我注意到 Kafka 比 HDFS 更可靠。 因此,现在使用 Spark-structured-streaming ,我很惊讶检查点仅适用于 HDFS。 使用 Kafka 进行检查点会更快、更可靠。 那么是否可以在没有 HDFS 的情况下使用 spark 结构化流? 我们必须将 HDFS 仅用于 Kafka 中的流数据,这似乎很奇怪。 或者是否可以告诉 Spark 忘记 ChekpPointing 并在程序中管理它?
火花 2.4.7
谢谢
【问题讨论】:
标签: spark-structured-streaming