【发布时间】:2021-07-26 07:13:34
【问题描述】:
我知道Change Apache Livy's Python Version 和How do i setup Pyspark in Python 3 with spark-env.sh.template。
但是,这些都不起作用。 Livy 继续使用 Python 2.7无论如何。
这是在 EMR 集群上运行 Livy 0.6.0。
-
我已将hadoop用户、我的用户、root和ec2-user中的
PYSPARK_PYTHON环境变量更改为/usr/bin/python3。通过ssh登录EMR 主节点并运行pyspark按预期启动python3。但是,Livy 一直在使用 python2.7。 -
我将
export PYSPARK_PYTHON=/usr/bin/python3添加到/etc/spark/conf/spark-env.sh文件中。 Livy 一直在使用 python2.7。 -
我将
"spark.yarn.appMasterEnv.PYSPARK_PYTHON":"/usr/bin/python3"和"spark.executorEnv.PYSPARK_PYTHON":"/usr/bin/python3"添加到下面列出的所有项目中。 Livy 一直在使用 python2.7。- sparkmagic
config.json和config_other_settings.json文件在启动 PySpark 内核 Jupyter 之前 - sparkmagic
%manage_sparkJupyter 小部件中的会话属性。 Livy 一直在使用 python2.7。 -
%%spark configcell-magic 之前的 line-magic%spark add --session test --url http://X.X.X.X:8998 --auth None --language python
- sparkmagic
注意:这在另一个运行 Livy 0.7.0 的 EMR 集群中没有任何问题 我已经检查了另一个集群上的所有设置,但找不到不同之处。我不必在其他集群上做任何这些,Livy 默认使用 python3。
我究竟如何让 Livy 使用 python3 而不是 python2?
【问题讨论】:
标签: pyspark amazon-emr livy