【发布时间】:2017-11-12 10:40:26
【问题描述】:
目前我在将数据从mysql同步到hbase的过程中遇到了一个问题,我需要从mysql到hbase的近乎实时的数据同步,并且我需要在数据同步期间将多个mysql表合并到一个hbase表中。
我试过 sqoop 好像不能满足我们的要求。
那么是否有任何现有的工具/库可以用于我的案例,或者我可以尝试使用 spark 的任何其他解决方案。
【问题讨论】:
-
您能否详细说明为什么 sqoop 不符合您的要求?
-
感谢您的宝贵时间,例如首先:我有一个表A和表B,它们有一对多的关系,我想将它们合并到hbase表中的一个表C中(应该成为连接的记录)。第二:Sqoop 是基于批处理的,不是近乎实时的解决方案,我们希望表 A 和 B 中的任何新记录,我们希望此记录立即同步到 Hbase 表 C。
标签: mysql apache-spark hbase sqoop