【问题标题】:How to install kafka module in pyspark如何在pyspark中安装kafka模块
【发布时间】:2020-10-26 10:32:09
【问题描述】:

导入 KafkaUtils 时遇到问题: 没有名为 'pyspark.streaming.kafka' 的模块,但我不知道如何安装 kafka 模块。

我使用 python 3.6.8、spark 2.2.0 和 kafka_2.12-2.5.0

【问题讨论】:

标签: pyspark apache-kafka spark-streaming


【解决方案1】:

事实证明,KafkaUtils 已被弃用,取而代之的是 Spark Structured Streaming。这意味着您有两条前进的道路:

  1. 重新设计您的应用程序以改用结构化流式处理(请参阅https://spark.apache.org/docs/2.2.0/structured-streaming-kafka-integration.html 了解入门知识)。

  2. 将您的 Spark 版本降级为仍将 KafkaUtils 作为分发的一部分的版本(您会发现 KafkaUtils 不需要单独安装)。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2011-02-10
    • 2011-02-23
    • 2016-03-24
    • 2012-08-17
    • 2021-05-22
    • 2010-09-14
    • 2013-02-01
    • 1970-01-01
    相关资源
    最近更新 更多