【发布时间】:2018-07-27 21:39:19
【问题描述】:
我的用例是使用 Apache Hive 表记录创建生产者并将其发送到 Kafka 主题。
我探索了 Confluent Kafka Connect,但到目前为止,他们只提供了一个使用 HDFS 连接器从 Kafka 主题到 Hive 表的演示。
有没有人使用 Kafka 连接器从源 Hive 表到 Kafka 主题?
或者是否有其他选项,例如编写我们可以使用的自定义 Java API 包?
我对其他选择持开放态度。
【问题讨论】:
-
数据在进入HDFS之前从哪里来?
[data source] --> [Kafka] --> [HDFS]比[data source] --> [HDFS] --> [Kafka]更常见的模式 -
它来自许多来源,不同的 RDBMS。这不是我的决定,但它被放入 Hive(数据存储)中,然后在我们想要将其发送到 Kafka 之前进行一些简单的转换。
标签: hadoop hive apache-kafka hdfs apache-kafka-connect