【发布时间】:2021-08-05 04:13:52
【问题描述】:
您好,我正在尝试将 Kafka 用作日志聚合器和过滤层,以便它们输入到 Splunk 中,例如。
Kafka 的输入端将是 Kafka S3 连接器和其他从 S3 和 Amazon Kinesis 数据流获取日志的连接器。请参阅此图片以供参考:
但是我想知道的是在 Kafka 数据管道内部进行处理或过滤是否有必要执行 Spark 作业?或者这可以通过一个简单的 Kafka 流应用程序来完成,如果我们必须为几个不同的日志进行这种设计,那么实现这一点将是一个有效的解决方案。我正在寻找一种解决方案,我们可以在不同的日志流之间进行复制,而无需每次都进行重大更改。
谢谢
【问题讨论】:
标签: apache-spark apache-kafka apache-kafka-streams