【发布时间】:2018-12-24 08:17:39
【问题描述】:
从 Google 云存储中移动/流式传输数据的最佳方式是什么?此外,Dataflow 是否提供将数据从 Google 云存储流式传输到 GCP 外部的任何功能?
【问题讨论】:
标签: google-cloud-platform google-cloud-storage google-cloud-dataflow dataflow
从 Google 云存储中移动/流式传输数据的最佳方式是什么?此外,Dataflow 是否提供将数据从 Google 云存储流式传输到 GCP 外部的任何功能?
【问题讨论】:
标签: google-cloud-platform google-cloud-storage google-cloud-dataflow dataflow
将数据移出 Google 云存储的最佳方法可能是使用 gsutil 工具,或者您可以使用它们为简单起见提供的 python 和 boto 插件,您可以在此链接中找到详细信息。 https://cloud.google.com/storage/docs/streaming。 至于问题的第二部分,Kafka 现在可以连接到 Cloud Dataflow,我认为您可以使用它从 GCP 中流式传输数据。 Apache Beam 从 2016 年开始支持 KafkaIO。我想下面的链接会让你很高兴。
https://github.com/apache/beam/tree/master/sdks/java/io/kafka
【讨论】: