【发布时间】:2019-10-30 17:32:15
【问题描述】:
当我在 cmd 中运行示例代码时,一切正常。
>>> import pyspark
>>> l = [('Alice', 1)]
>>> spark.createDataFrame(l).collect()
[Row(_1='Alice', _2=1)]
但是当我在pycharm中执行代码时,我得到一个错误。
spark.createDataFrame(l).collect()
NameError: name 'spark' is not defined
当我将 Pycharm 链接到 pyspark 时可能有问题。
【问题讨论】:
-
您是否缺少定义
spark:from pyspark.sql import SparkSession; spark=SparkSession.builder.getOrCreate()的部分?什么版本的火花? -
spark 版本:2.4.4 但是在CMD中,我也没有定义spark。
-
您不必在 pyspark shell 中定义它们——它们会自动为您定义