【发布时间】:2019-01-08 00:23:59
【问题描述】:
对于 ETL 作业,我有一个简单的场景:从 Kafka 主题中获取数据并将其放入 HBase 表中。将来,我将在从主题中读取数据后添加对某些逻辑的支持。 我考虑两种情况:
- 使用 Kafka Streams 从主题中读取数据,并通过原生 HBased 驱动程序进一步写入每条记录
- 使用 Kafka -> HBase connector
我对我的选择有以下顾虑:
- 每次数据到达 Kafka Stream 的窗口时写入数据是个好主意吗? - 建议它会降低性能
- Kafka Hbase 连接器仅由第三方开发人员支持,我不确定此解决方案的代码质量以及是否可以在主题数据上添加自定义聚合逻辑。
【问题讨论】:
-
这个更新比较频繁 - github.com/Landoop/stream-reactor/tree/master/… 如果需要,Landoop 有企业支持
标签: apache-kafka hbase apache-kafka-streams apache-kafka-connect