【发布时间】:2016-12-17 01:14:00
【问题描述】:
我需要将推送到 Kafka 的消息存储在深层存储中。我们正在使用 Azure 云服务,所以我认为 Azure Blob 存储可能是一个更好的选择。我想使用 Kafka Connect 的接收器连接器 API 将数据推送到 Azure Blob。 Kafka 文档大多建议使用 HDFS 导出数据,但在这种情况下,我需要一个运行 Hadoop 的 Linux VM,我猜这会很昂贵。我的问题是 Azure Blob 存储是存储 JSON 对象的合适选择,而构建自定义接收器连接器是这种情况下的合理解决方案?
【问题讨论】:
-
至于自定义sink,我觉得还可以。目前,Azure Blob 存储没有官方接收器。如果您想要其他解决方案,可以尝试使用 Apache Flume(Kafka 源和 Azure Sink),请参阅此链接以供参考:blogs.msdn.microsoft.com/bigdatasupport/2014/03/18/…
标签: apache-kafka azure-blob-storage apache-kafka-connect