【发布时间】:2019-06-02 12:02:42
【问题描述】:
可以将来自主题的 Kafka 数据流式传输、使用和提取到 BigQuery/Cloud 存储中的可能选项有哪些。
根据, is it possible to Use Kafka with Google cloud Dataflow
GCP 附带基于 Apache Beam 编程模型构建的 Dataflow。 KafkaIO 与 Beam Pipeline 一起使用是对传入数据执行实时转换的推荐方式吗?
https://beam.apache.org/releases/javadoc/2.5.0/org/apache/beam/sdk/io/kafka/KafkaIO.html
Kafka 数据可以推送到云端 pub-sub,然后推送到 BigQuery 表中。也可以使用不属于 GCP 的 Kafka 流/Spark 作业。
鉴于数据完全托管在 Google Cloud Platform (GCP) 上,在设计决策期间需要考虑哪些因素?
【问题讨论】:
标签: apache-kafka google-cloud-platform google-cloud-dataflow