【发布时间】:2015-04-04 17:18:10
【问题描述】:
我正在提交一个导入 numpy 的 python 文件,但我收到了 no module named numpy 错误。
$ spark-submit --py-files projects/other_requirements.egg projects/jobs/my_numpy_als.py
Traceback (most recent call last):
File "/usr/local/www/my_numpy_als.py", line 13, in <module>
from pyspark.mllib.recommendation import ALS
File "/usr/lib/spark/python/pyspark/mllib/__init__.py", line 24, in <module>
import numpy
ImportError: No module named numpy
我想我会为 numpy —python-files 提取一个鸡蛋,但我无法弄清楚如何构建那个鸡蛋。但后来我突然想到 pyspark 本身使用 numpy。引入我自己的 numpy 版本会很愚蠢。
您有什么想法可以在这里做适当的事情吗?
【问题讨论】:
标签: numpy apache-spark pyspark