【发布时间】:2016-10-27 22:16:43
【问题描述】:
我需要在 Amazon EC2 上运行 Apace Spark 脚本。脚本使用诸如 numpy、pandas 等库。问题是我安装了 numpy
/usr/local/lib64/python2.7/site-packages,默认情况下此文件夹不在 PYTHONPATH 中。因此,当我export PYTHONPATH=$PYTHONPATH:/usr/local/lib64/python2.7/site-packages 时,通常 python 会检测到它(import numpy 不会出现问题),但是当我尝试将其导入 pyspark shell 时 - 它显示:
>>> import numpy
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ImportError: No module named numpy
>>> exit()
有没有办法改变pyspark的PYTHONPATH?
【问题讨论】:
-
Joe 的回答 +1,我不会对你的问题使用 -1,但很高兴知道这是否有效,以改进 SO。另外,我不能只编辑一个字符,但它是 Google 的“Apache”而不是“Apace”哈哈 :) 这个问题在 Google 的搜索结果中显示得非常高,如果您删除它或完成它会有所帮助吗?
标签: python amazon-ec2 apache-spark