【问题标题】:how to specify a startup script in dataflow job for Java that will execute on each dataflow VM worker如何在 Java 的数据流作业中指定将在每个数据流 VM 工作者上执行的启动脚本
【发布时间】:2023-04-10 23:09:02
【问题描述】:

我需要修改 ~/.ssh/authorized_keys 以添加用于登录的自定义公钥。我发现这篇文章是针对 python 工作的。 https://beam.apache.org/documentation/sdks/python-pipeline-dependencies/

我们如何为 Java 数据流作业做同样的事情。

【问题讨论】:

    标签: google-cloud-platform google-cloud-dataflow apache-beam


    【解决方案1】:

    您可以创建自定义容器,可能带有自定义入口点。

    见: https://cloud.google.com/dataflow/docs/guides/using-custom-containers

    还有 https://github.com/apache/beam/blob/master/sdks/java/core/src/main/java/org/apache/beam/sdk/harness/JvmInitializer.java ,这可能对这里有所帮助,但它是为不同的目的而编写的。

    【讨论】:

      猜你喜欢
      • 2021-05-28
      • 1970-01-01
      • 1970-01-01
      • 2020-06-09
      • 2021-12-01
      • 2017-09-14
      • 1970-01-01
      • 1970-01-01
      • 2021-01-01
      相关资源
      最近更新 更多