【发布时间】:2018-10-30 16:27:41
【问题描述】:
我正在尝试将 pyspark 代码从 jupyter 笔记本迁移到 python 脚本。但是,当我尝试使用
from pyspark.sql import SparkSession
我收到一个错误No module named 'pyspark'
我试图在系统中找到所有
python3和python2,将它们作为shell 运行,并尝试在每个shell 中导入pyspark。但是,我在每个 shell 中都有相同的No module named 'pyspark'当我尝试
import findspark和python3/python2时,我得到了No module named 'findspark'-
echo $PYTHONPATH和echo $SPARK_HOMEreturn 空字符串 -
我试图找到所有
spark-submit并使用它们而不是python3运行我的脚本。但是,argparse使用时出现错误File "/export/home/osvechkarenko/brdmp_10947/automation_001/py_dynamic_report.py", line 206 if args.print: ^ SyntaxError: invalid syntax当我在 python3 中使用我的脚本(没有
pyspark)时,它运行良好。
【问题讨论】:
-
你能提供工作
pyspark.__file__的输出吗?这有助于我们确定您的哪些环境有效。
标签: python pyspark jupyter-notebook