【发布时间】:2020-02-07 17:21:11
【问题描述】:
我在 ec2 上创建了一个 spark 集群,之后,我在主节点上安装了 Jupyter 并启动了 jupyter,之后我使用
创建了 sparkcontextfindspark.init(spark_home='/home/ubuntu/spark')
import pyspark
from functools import partial
sc = pyspark.SparkContext(appName="Pi")
当我尝试运行任何作业时,spark 仅使用主机的核心,所有从机都在运行并连接到主机,但我仍然无法使用任何从机的核心,任何人请帮忙。
【问题讨论】:
-
您需要将主网址设置为
spark://... -
在创建 sparkcontext 时?
-
是的,至少是必要的
-
很好,我将其发布为寻求更广泛帮助的答案
标签: python-3.x apache-spark pyspark jupyter-notebook ipython