【发布时间】:2020-08-17 11:06:33
【问题描述】:
我正在尝试解决 python 包 PySpark 的问题。我开发了一个具有以下结构的python包。
sample_package/
|-config/
|-sample.ini
|-main.py
|-__init__.py
在我的main.py 中,我有一个代码 sn-p,它从config/ 目录中读取配置文件,如下所示
import ConfigParser, os
def sample_func():
config = ConfigParser.ConfigParser()
configfile = os.path.join(os.path.dirname(__file__), 'config', 'sample.ini')
config.read(configfile)
return config.sections()
我将上述包的 zip 文件创建为 sample_package.zip,并将 zip 包含为 pyspark 依赖项
addPyFile(path/to/zip/file)
在我的 pyspark 工作中,当我导入 sample_package 时,导入工作正常,我可以在 main 中调用 sample_func,但是我的 python 包无法读取 sample.ini 文件。在普通的 python 程序中执行时,它可以正常工作,但不能在 pyspark 作业中执行。访问静态文件时,在 pyspark 环境中是否进行了任何路径操作?如何让我的 python 包正确读取配置文件?
【问题讨论】:
标签: python python-2.7 pyspark