【发布时间】:2017-03-15 18:12:26
【问题描述】:
我使用 Kafka 进行消息队列/处理。我的问题是关于性能/最佳实践。我会自己做性能测试,但也许有人已经有了结果/经验。
数据是 Kafka (0.10) 主题中的原始数据,我想将其结构化传输到 ES 和 HDFS。
现在我看到了两种可能性:
- Logstash(Kafka 输入插件、grok 过滤器(解析)、ES/webhdfs 输出插件)
- Kafka Streams(解析)、Kafka Connect(ES 接收器、HDFS 接收器)
如果没有任何测试,我会说第二种选择更好/更干净,更可靠?
【问题讨论】:
-
我会推荐 Kafka Streams 和 Kafka Connect。 (但我有偏见。)
-
这里问了一个类似的问题stackoverflow.com/q/39459225/2796894
标签: elasticsearch apache-kafka logstash apache-kafka-streams apache-kafka-connect