【发布时间】:2021-11-17 18:40:52
【问题描述】:
我有一个 apache 光束管道,用于提交到谷歌数据流,它运行成功。随着时间的推移,我的代码不断增长,我想将它构造成多个文件依赖项。这就是为什么我提到 apache 梁部分 Multiple File Dependencies
当我按如下方式构建代码时:
root_dir/
setup.py
main.py
__init__.py
extract/
__init__.py
extract.py
当我在本地执行它时,它运行良好,当我将它提交到数据流时,我收到以下错误:
ModuleNotFoundError: No module named 'extract'
我的 setup.py 看起来像这样:
from setuptools import setup, find_packages
setup(
name="g_dataflow",
version="0.1.0",
install_requires=[
'google-cloud-storage==1.42.0'
],
packages=find_packages()
)
我尝试通过 apache beam 遵循 Juliaset 示例,但没有成功。 以前有人遇到过同样的问题吗?
【问题讨论】:
标签: python google-cloud-dataflow apache-beam