【发布时间】:2015-11-19 17:14:13
【问题描述】:
我是 SPARK 的新手,并试图在 Windows 中使用它。我能够使用带有 hadoop 的预构建版本成功下载并安装 Spark 1.4.1。在以下目录中:
/my/spark/directory/bin
我可以运行 spark-shell 和 pyspark.cmd 并且一切正常。我正在处理的唯一问题是我想在 Pycharm 中编码时导入 pyspark。现在我正在使用以下代码来使事情正常进行:
import sys
import os
from operator import add
os.environ['SPARK_HOME'] = "C:\spark-1.4.1-bin-hadoop2.6"
sys.path.append("C:\spark-1.4.1-bin-hadoop2.6/python")
sys.path.append("C:\spark-1.4.1-bin-hadoop2.6/python/build")
try:
from pyspark import SparkContext
from pyspark import SparkConf
except ImportError as e:
print ("Error importing Spark Modules", e)
sys.exit(1)
我想知道是否有更简单的方法可以做到这一点。我正在使用 Windows 8 - Python 3.4 和 Spark 1.4.1
【问题讨论】: