【发布时间】:2017-08-20 14:23:30
【问题描述】:
目前我正在从本地 wlan 接口嗅探数据包,例如:
sudo tshark > sampleData.pcap
但是,我需要将此数据提供给 kafka。
目前,我有一个kafka生产者脚本producer.sh:
../bin/kafka-console-producer.sh --broker-list localhost:9092 --topic 'spark-kafka'
并像这样向 kafka 提供数据:
producer.sh < sampleData.pcap
在 sampleData.pcap 中我有预先捕获的 IP 数据包信息。
但是,我想将流程自动化,如下所示:
sudo tshark > http://localhost:9091
producer.sh < http://localhost:9091
这显然只是一个伪算法。我想要做的是,将嗅探数据发送到一个端口并让 kafka 不断读取它。我不希望 kafka 连续读取文件,因为这意味着来自单个文件的大量读/写操作会导致效率低下。
我在互联网上搜索并发现了 kafka-connect,但我找不到任何有用的文档来实现这样的东西。
实现这样的事情的最佳方式是什么?
谢谢!
【问题讨论】:
标签: linux unix apache-kafka wireshark tshark