【发布时间】:2017-07-29 03:20:57
【问题描述】:
我正在阅读有关 spark 及其 real-time stream 处理的信息。我很困惑如果 spark 本身可以从 twitter 或 file 等源读取流,那么为什么我们需要kafka 将数据提供给spark?如果有人向我解释如果我们将spark 与kafka 一起使用会获得什么优势,那就太好了。谢谢。
【问题讨论】:
-
您不需要它——它们有不同的用途。 Kafka 提供了一个统一的消费源。
标签: apache-spark streaming apache-kafka spark-streaming