【发布时间】:2015-08-29 17:56:20
【问题描述】:
安装了 apache-maven-3.3.3,scala 2.11.6,然后运行:
$ git clone git://github.com/apache/spark.git -b branch-1.4
$ cd spark
$ build/mvn -DskipTests clean package
最后:
$ git clone https://github.com/apache/incubator-zeppelin
$ cd incubator-zeppelin/
$ mvn install -DskipTests
然后运行服务器:
$ bin/zeppelin-daemon.sh start
运行一个以%pyspark 开头的简单笔记本时,我收到一个关于找不到py4j 的错误。刚刚做了pip install py4j (ref)。
现在我收到此错误:
pyspark is not responding Traceback (most recent call last):
File "/tmp/zeppelin_pyspark.py", line 22, in <module>
from pyspark.conf import SparkConf
ImportError: No module named pyspark.conf
我尝试将我的SPARK_HOME 设置为:/spark/python:/spark/python/lib。没有变化。
【问题讨论】:
标签: python apache-spark pythonpath pyspark apache-zeppelin