【发布时间】:2018-09-12 12:27:33
【问题描述】:
我已经为这个问题苦苦挣扎了四天,即使在 Stackoverflow 中,我也查看了几个处理相同问题的网页,但没有找到解决方案。
我安装了 Spark-2.3.0 、Scala 2.12.5 和 Hadoop-2.7.1(用于 winutils master),然后设置了相应的环境变量。我安装了 findspark,然后在我的 Jupyter Notebook 中启动了 pyspark。问题是当我运行时:
sc = pyspark.SparkContext('local')
我收到以下错误:
java gateway process exited before sending the driver its port number
我应该提到我正在使用 Java-1.8.0 并且我在我的环境变量中进行了设置:
PYSPARK_SUBMIT_ARGS="--master local[2] pyspark-shell"
如果您知道如何解决此问题,我将不胜感激。谢谢!
【问题讨论】:
-
您是否尝试使用此行
sc = pyspark.SparkContext('local')创建新的火花上下文?而这一切仅仅是为了在 jupyter 中运行 spark 吗? -
是的,我想创建一个 spark 上下文以便使用 pyspark 进行开发。
标签: apache-spark pyspark jupyter-notebook