【发布时间】:2018-11-23 11:26:03
【问题描述】:
我的任务是创建一个基本的 ETL 应用程序。我们有一个远程位置,每个月都会将 csv 文件拖放到该位置,它们大约是。大小为 250MB。
应用程序将导入 csv --> 应用业务逻辑(如果需要)-> 插入到 SQLServer 表中。
我一直在考虑为此使用 Kafka。不过,我对它还很陌生,无法找到一个可以将 csv 文件导入 Kafka 的连接器。我在 github 上看到过一些项目,但它们似乎已经过时了,而且我在 UnsupportedOperationExceptions 上遇到了各种错误
谁能指出正确的方向?我现在正在考虑使用 confluent_kafka 编写一个连接器
【问题讨论】:
-
Github 上的 spooldir 连接器是普遍推荐的(由 Confluent 员工编写)
标签: apache-kafka kafka-producer-api apache-kafka-connect