【发布时间】:2014-06-09 00:12:21
【问题描述】:
这是别人在另一个论坛上的问题的副本,从未得到回答,所以我想我会在这里重新提问,因为我有同样的问题。 (见http://geekple.com/blogs/feeds/Xgzu7/posts/351703064084736)
我已经在我的机器上正确安装了 Spark,并且在使用 ./bin/pyspark 作为我的 python 解释器时,我能够使用 pyspark 模块运行 python 程序而不会出错。
但是,当我尝试运行常规 Python shell 时,当我尝试导入 pyspark 模块时,我收到此错误:
from pyspark import SparkContext
它说
"No module named pyspark".
我该如何解决这个问题?我需要设置一个环境变量来将 Python 指向 pyspark 头文件/库/等吗?如果我的 spark 安装是 /spark/,我需要包含哪些 pyspark 路径?还是只能从 pyspark 解释器运行 pyspark 程序?
【问题讨论】:
-
他们说更改环境变量“不是超级有效,因为它很快就会被 bin/spark-submit 覆盖”。 Maybe you can learn something from this exchange
标签: python apache-spark pyspark