【问题标题】:Google cloud european regions mismatch for bigquery and dataflow谷歌云欧洲地区与大查询和数据流不匹配
【发布时间】:2020-06-05 21:37:12
【问题描述】:

bigquery 数据集的docs 声明以下欧洲区域可用 (A):

  • 欧洲北部1
  • 欧洲西部3
  • 欧洲西部2
  • 欧洲西部6

数据流的docs 表明这些是可用的欧洲区域 (B):

  • 欧洲西部1
  • 欧洲西部4

如您所见,这些区域之间没有重叠。

我们正在构建一个应用程序

  • 从 php 后端创建数据集、bigquery 表等。
  • 使用 python 脚本卸载将数据从各种来源转移到 bigquery 到数据流

我们很愚蠢(事后看来)将我们的项目分成两部分,这些部分是独立完成的。两者都有效。从来没有人想到这会成为我们的问题(现在应该很明显了):

  • php api 不能和 B 一起工作
  • 数据流脚本无法与 A 一起使用
  • 数据流无法在区域之间读写
  • 出于合规原因,我们无法在欧盟以外托管我们的数据。

我们如何解决我们的第 22 个问题?

【问题讨论】:

  • 您可以在任何区域/专区部署 Dataflow。您是否尝试过使用 --zone 覆盖该区域?

标签: google-cloud-platform google-bigquery google-cloud-dataflow


【解决方案1】:

您将 Regional Endpoint 与工作虚拟机为 Dataflow 管道启动并实际处理数据的实际区域/区域混淆了。

Regional Endpoint 处理元数据并协调您的 Dataflow 管道。如果您指定 --zone,那么这就是 Dataflow 的实际工作虚拟机将在其中启动的区域。

【讨论】:

  • 是的,令人困惑的是,zones(具有 -a 或 -b 之类的后缀)在其区域端点内是 listed,我不知何故认为那些该区域唯一可用的区域,但诀窍是从不同的区域端点定义一个区域。如果你同意的话,我会用一个具体的例子来编辑你的答案并接受它。
猜你喜欢
  • 1970-01-01
  • 2020-03-08
  • 1970-01-01
  • 2015-07-17
  • 2018-12-04
  • 1970-01-01
  • 2015-06-29
  • 1970-01-01
  • 2015-05-24
相关资源
最近更新 更多