【问题标题】:How to run Spark with Jupyter Notebook (Anaconda3, Ubuntu)如何使用 Jupyter Notebook (Anaconda3, Ubuntu) 运行 Spark
【发布时间】:2017-03-17 05:03:22
【问题描述】:

我确实下载了 anaconda3、spark1.6.1、java、git 等...

我设置了这样的环境

$ nano .bashrc
export PATH="/home/moon/anaconda3/bin:$PATH"

export SCALA_HOME=/usr/local/src/scala/scala-2.12.1
export PATH=$SCALA_HOME/bin:$PATH

export SPARK_PATH=~/spark-1.6.1-bin-hadoop2.6
export PATH=$SPARK_PATH/bin:$PATH    

export ANACONDA_ROOT=/usr/home/moon/anaconda3
export PYSPARK_PYTHON=$ANACONDA_ROOT/bin/python3

export PYSPARK_DRIVER_PYTHON="jupyter"
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"

$. .bashrc

$cd spark-1.6.1-bin-hadoop2.6
$bin/pyspark

然后我可以连接 jupyter notebook (python3)
但我不能运行 spark ex) sc , sc.textFile

spark 和 jupyter 怎么集成

【问题讨论】:

标签: python-3.x apache-spark pyspark jupyter-notebook jupyter


【解决方案1】:

请在下面添加。

 PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook"    ./bin/pyspark

还请检查以下内容: Apache Spark: How to use pyspark with Python 3

我遇到了一些与 anaconda python 3 的兼容性问题,我切换到 anaconda python 2.7

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2020-11-23
    • 2020-10-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-10-29
    • 1970-01-01
    • 2019-04-09
    相关资源
    最近更新 更多