【发布时间】:2018-11-09 06:17:32
【问题描述】:
我正在使用 HDP 版本:2.6.4
能否提供一步一步的说明如何将库安装到 spark2 下的以下 python 目录?
sc.version(spark 版本)返回
res0: String = 2.2.0.2.6.4.0-91
spark2解释器名称和值如下
zeppelin.pyspark.python: /usr/local/Python-3.4.8/bin/python3.4
python 版本和当前库是
%spark2.pyspark
import pip
import sys
sorted(["%s==%s" % (i.key, i.version) for i in pip.get_installed_distributions()])
print("--")
print (sys.version)
print("--")
print(installed_packages_list)
--
3.4.8 (default, May 30 2018, 11:05:04)
[GCC 4.4.7 20120313 (Red Hat 4.4.7-18)]
--
['pip==9.0.1', 'setuptools==28.8.0']
更新1:using pip install [package name]实际上会导致两个问题
1) HDP 指向 python2.6 而不是 python3.4.8
2) pip3 由于某种原因不存在
因此,我正在考虑安装 miniconda 并将 Zeppelin 指向那里并在 conda 中安装所有包以防止 python 2.6 和 3.4.8 之间发生冲突
【问题讨论】:
-
使用
python3 -m pip install <package>。 snarky.ca/why-you-should-use-python-m-pip
标签: python pyspark hortonworks-data-platform apache-zeppelin