【发布时间】:2018-09-12 22:05:47
【问题描述】:
我正在尝试使用 Hue 在 Oozie 上运行一个简单的 python 脚本。我正在使用安装的 anaconda 包裹,因此我还添加了 Cloudera 管理器、火花配置(用于 spark-conf/spark-env.sh 的火花服务高级配置片段(安全阀))
if [ -z "${PYSPARK_PYTHON}" ]; then
export PYSPARK_PYTHON=/opt/cloudera/parcels/Anaconda/bin/python
fi
运行作业时,我遇到了 python 错误 ImportError:没有名为 pandas.io.json 的模块 ,这意味着 PYSPARK_PYTHON 似乎没有从 anaconda 中获取。
我尝试添加一个参数
PYSPARK_PYTHON=/opt/cloudera/parcels/Anaconda/bin/python
关于通过色调的火花动作,但似乎不起作用。
如果我通过 CLI 运行脚本并 spark-submit 它可以工作。 如果我通过 Hue 在 Oozie 上运行其他 python 脚本(没有来自 anaconda 的包)它可以工作。
我错过了什么? :/
【问题讨论】:
标签: apache-spark pyspark oozie