【发布时间】:2019-06-18 21:34:45
【问题描述】:
使用 findspark.find() 时,我得到了安装 spark 的路径,但尝试 findspark.init(path) 时,我使用 jupyter notebook 得到列表索引超出范围错误
我已确保我的 SPARK_HOME 和 PATH 变量也已正确设置
下面的代码输出 spark home 路径
import findspark
findspark.find()
使用上述 spark home 路径的输出进行初始化
import findspark
findspark.init(path)
抛出列表索引超出范围错误
133 # add pyspark to sys.path
134 spark_python = os.path.join(spark_home, 'python')
--> 135 py4j = glob(os.path.join(spark_python, 'lib', 'py4j-*.zip'))[0]
136 sys.path[:0] = [spark_python, py4j]
137
IndexError: list index out of range
我不明白它如何输出正确的路径,但无法初始化spark
【问题讨论】:
标签: python-3.x pyspark jupyter-notebook