【发布时间】:2021-07-16 13:36:16
【问题描述】:
我们目前正在观察一个错误(至少我们希望这对我们没有任何影响),它会阻止 BigQuery 使用 Hive 分区 URI 前缀访问存储在 Google Cloud Storage(外部表)中的数据。
我们的设置工作了几个月,没有任何变化,从昨天开始,我们只是遇到了一个错误
错误代码 3:无效值:无效的源 uri 前缀:...
当我们的计划查询尝试运行时。
我们可以在不分区的情况下访问数据,但在 Hive Partitioning URI Prefix 的错误中运行。
还有其他人看到这种行为吗?
干杯
【问题讨论】:
-
没有观察到这一点,但可能是最近添加到 GCS 存储桶中的文件/对象违反了 Hive 分区方案的定义模式?
-
您是否能够创建一个新的外部表来访问该存储桶并指定分区?
-
您似乎需要在存储桶中创建第一个文件夹,然后使用您的配置单元分区字段创建路径(例如:
gs://bucket-name/table-name/{partition_field1:STRING}/{partition_field2:STRING}) -
是的,我们正在经历这个......它影响了我们约 10% 的批量交易 atm 并且 AFAIK 不是来自我们对项目或源数据的更改
标签: google-bigquery google-cloud-storage