【发布时间】:2019-08-08 00:08:58
【问题描述】:
我是大数据领域的新手,我需要制作一个演示,使用 spark 流从 Kafka 主题流式传输数据,然后进行一些聚合和过滤,然后保存这些数据。我正在使用 spark 2.3 我需要知道 Kafka 必须使用 spark-2.3 文档中的 0.8 或 10 的哪个版本 ->
https://spark.apache.org/docs/2.3.0/streaming-kafka-integration.html 提及
0.8 已弃用,10 稳定但在流式卡夫卡-0-10-集成中->
https://spark.apache.org/docs/2.3.0/streaming-kafka-0-10-integration.html
提到 0.8 是稳定的,10 是实验性的,我使用的是 Kafka 2.1。
所以我必须使用其中的哪一个
【问题讨论】:
标签: apache-spark apache-kafka spark-streaming jave