【发布时间】:2020-05-27 22:27:40
【问题描述】:
我需要将 pyspark 脚本创建的日志推送到 kafka。我正在做 POC,所以在 Windows 机器中使用 Kafka 二进制文件。我的版本是 - kafka - 2.4.0、spark - 3.0 和 python - 3.8.1。我正在使用 pycharm 编辑器。
import sys
import logging
from datetime import datetime
try:
from pyspark import SparkContext
from pyspark.streaming import StreamingContext
from pyspark.streaming.kafka import KafkaUtils
except ImportError as e:
print("Error importing Spark Modules :", e)
sys.exit(1)
遇到错误
导入 Spark 模块时出错:没有名为“pyspark.streaming.kafka”的模块
我在这里缺少什么?缺少任何图书馆吗? pyspark 和火花流工作正常。如果有人可以在这里提供一些指导,我将不胜感激。
【问题讨论】:
标签: apache-spark pyspark apache-kafka spark-streaming