【发布时间】:2020-06-04 23:53:18
【问题描述】:
我有一个 DataFlow 管道,它使用来自 Cloud Pub/Sub 的 JSON 消息,将它们转换为 Avro 并将它们存储到 Google Cloud Storage。
有没有办法让 DataFlow 根据某个 JSON 字段将每个 Avro 对象存储到 GCS 中的不同文件夹中,如果它的值实际上可以是任何值?
此文件夹结构的目标是使用 PubSub 通知和 Cloud Functions 将每个结果文件加载到不同的 BigQuery 表中。
【问题讨论】:
-
你是什么JSON字段?
-
例如,一个名为:“type”的字段,带有一个字符串值。
标签: google-bigquery google-cloud-storage google-cloud-dataflow avro google-cloud-pubsub