【发布时间】:2020-07-22 13:06:15
【问题描述】:
我们正在使用 Dataflow Flex 模板并遵循本指南 (https://cloud.google.com/dataflow/docs/guides/templates/using-flex-templates) 来暂存和启动作业。这在我们的环境中起作用。但是,当我通过 SSH 连接到 Dataflow VM 并运行 docker ps 时,我看到它引用了与我们在模板中指定的不同的 docker 镜像(绿色下划线):
我启动的模板如下,作业是使用gcloud beta dataflow flex-template run创建的:
{
"image": "gcr.io/<MY PROJECT ID>/samples/dataflow/streaming-beam-sql:latest",
"metadata": {
"description": "An Apache Beam streaming pipeline that reads JSON encoded messages from Pub/Sub, uses Beam SQL to transform the message data, and writes the results to a BigQuery",
"name": "Streaming Beam SQL",
"parameters": [
{
"helpText": "Pub/Sub subscription to read from.",
"label": "Pub/Sub input subscription.",
"name": "inputSubscription",
"regexes": [
".*"
]
},
{
"helpText": "BigQuery table spec to write to, in the form 'project:dataset.table'.",
"is_optional": true,
"label": "BigQuery output table",
"name": "outputTable",
"regexes": [
"[^:]+:[^.]+[.].+"
]
}
]
},
"sdkInfo": {
"language": "JAVA"
}
}
所以我希望docker ps 的输出将gcr.io/<MY PROJECT ID>/samples/dataflow/streaming-beam-sql 显示为Dataflow 上的图像。当我从 GCR 启动图像以在 GCE 实例上运行时,我在运行 docker ps 时得到以下输出:
我是否应该在 Dataflow 虚拟机上看到我在 Dataflow 模板中引用的图像的名称?还是我在某个地方错过了一步?
谢谢!
【问题讨论】:
标签: google-cloud-platform google-cloud-dataflow