【问题标题】:Run ApacheBeam Pipeline on multiple runners(servers)在多个运行器(服务器)上运行 ApacheBeam Pipeline
【发布时间】:2021-08-09 22:52:44
【问题描述】:

我已经编写了一个完整的基于 apacheBeam 的管道,并使用直接运行器在本地对其进行了测试。但是,我想知道是否可以在多个服务器上运行此管道?我看到 ApacheBeam 通常在具有自动缩放功能的 GCP 上运行。但我想定义一组私有服务器作为我的运行器来运行我的管道。

任何指针或建议将不胜感激。

ps:这里是 apache beam 的文档:https://beam.apache.org/releases/pydoc/2.20.0/_modules/apache_beam/options/pipeline_options.html

【问题讨论】:

    标签: apache-beam apache-beam-io


    【解决方案1】:

    您可以在Flink 等OSS 运行器上以分布式方式运行Beam 管道。请参阅compatibility matrix 中支持的跑步者集。

    【讨论】:

    • 感谢您的回答。是的,我同意这就是我要做的。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-04-21
    • 2018-05-12
    • 1970-01-01
    • 2019-07-16
    • 2016-04-14
    相关资源
    最近更新 更多