【发布时间】:2018-03-27 16:22:17
【问题描述】:
我正在尝试使用这个过程:
https://cloud.google.com/bigtable/docs/exporting-sequence-files
导出我的 bigtable 进行备份。我试过 bigtable-beam-import 版本 1.1.2 和 1.3.0 没有成功。该程序似乎正确地启动了数据流,但无论我使用什么设置,工作人员似乎从未被分配到工作中。日志总是说:
Autoscaling: Raised the number of workers to 0 based on the rate of progress in the currently running step(s).
然后它挂起,工人永远不会被分配。如果我让它运行,日志会说:
2018-03-26 (18:15:03) Workflow failed. Causes: The Dataflow appears to be stuck. Workflow failed. Causes: The Dataflow appears to be stuck. You can get help with Cloud Dataflow at https://cloud.google.com/dataflow/support.
然后它被取消:
Cancel request is committed for workflow job...
我想我已经尝试更改此处描述的所有可能的管道选项:
https://cloud.google.com/dataflow/pipelines/specifying-exec-params
我尝试关闭自动缩放并像这样指定工作人员的数量:
java -jar bigtable-beam-import-1.3.0-shaded.jar export \
--runner=DataflowRunner \
--project=mshn-preprod \
--bigtableInstanceId=[something]\
--bigtableTableId=[something] \
--destinationPath=gs://[something] \
--tempLocation=gs://[something] \
--maxNumWorkers=10 \
--zone=us-central1-c \
--bigtableMaxVersions=1 \
--numWorkers=10 \
--autoscalingAlgorithm=NONE \
--stagingLocation=gs:[something] \
--workerMachineType=n1-standard-4
我还尝试指定工作机器类型。没有什么变化。总是自动缩放到 0 并失败。如果有 Dataflow 团队的人在,您可以查看失败的作业 ID:exportjob-danleng-0327001448-2d391b80。
还有其他人经历过吗?
【问题讨论】:
-
所有不为google工作的人,google的BigTable导出工具的源码在这里(如有错误请指正):github.com/GoogleCloudPlatform/cloud-bigtable-client/tree/…
-
这听起来像是 Dataflow 服务问题,而不是 Cloud Bigtable 问题。它可能与 GCE 配额或类似的东西有关。我建议创建一个支持问题。
-
@SolomonDuskis 我们弄明白了(下)。绝对是它尝试分配虚拟机的部分的数据流问题。你走在正确的轨道上。有帮助,谢谢。
标签: google-cloud-dataflow google-cloud-bigtable