【发布时间】:2021-01-28 15:52:10
【问题描述】:
我是 spark 的天真用户。我安装了 spark 并使用 anaconda install pyspark,然后在下面给出的 jupyter notebook 中运行基本代码。然后我打开 spark WebUI,但是我看不到任何正在运行或已完成的作业。任何 cmets 都表示赞赏。
from pyspark.sql import SparkSession
spark = SparkSession.builder\
.master("local")\
.appName("NQlabtop")\
.config('spark.ui.port', '4050')\
.getOrCreate()
sc = spark.sparkContext
input_file=sc.textFile("C:/Users/nqazi/NQ/anscombe.json")
map = input_file.flatMap(lambda line: line.split(" ")).map(lambda word: (word, 1))
counts = map.reduceByKey(lambda a, b: a + b)
print("counts",counts)
sc = spark.sparkContext
data = [1, 2, 3, 4, 5]
distData = sc.parallelize(data)
请参阅下面的 Spark WebUI 图像。我不确定为什么我看不到任何作业,因为我认为它应该显示已完成的作业。
【问题讨论】:
-
在文件末尾添加“input()”。
标签: apache-spark pyspark webui