【问题标题】:ModuleNotFoundError while running apache beam job in dataflow using setup.py使用 setup.py 在数据流中运行 apache 光束作业时出现 ModuleNotFoundError
【发布时间】:2021-11-17 18:40:52
【问题描述】:

我有一个 apache 光束管道,用于提交到谷歌数据流,它运行成功。随着时间的推移,我的代码不断增长,我想将它构造成多个文件依赖项。这就是为什么我提到 apache 梁部分 Multiple File Dependencies

当我按如下方式构建代码时:

​root_dir/
  ​setup.py
  ​main.py
  __init__.py
  ​extract/
    __init__.py
    extract.py

当我在本地执行它时,它运行良好,当我将它提交到数据流时,我收到以下错误:

ModuleNotFoundError: No module named 'extract'

我的 setup.py 看起来像这样:

from setuptools import setup, find_packages

setup(
    name="g_dataflow",
    version="0.1.0",
    install_requires=[
        'google-cloud-storage==1.42.0'
    ],
    packages=find_packages()

)

我尝试通过 apache beam 遵循 Juliaset 示例,但没有成功。 以前有人遇到过同样的问题吗?

【问题讨论】:

标签: python google-cloud-dataflow apache-beam


【解决方案1】:

我必须将--save_main_session 添加到我的命令行中,这解决了问题

【讨论】:

    猜你喜欢
    • 2021-05-08
    • 2021-11-12
    • 1970-01-01
    • 2020-02-21
    • 2018-08-15
    • 1970-01-01
    • 1970-01-01
    • 2022-06-12
    • 1970-01-01
    相关资源
    最近更新 更多