【发布时间】:2016-11-18 22:14:38
【问题描述】:
在从 RDBMS 到 Hbase 的批量数据迁移过程中,区域拆分是否经常发生?如果它发生的次数更多,那么它肯定会影响写入和读取性能。
我知道预分割可以在一定程度上避免这个区域的分裂。
但是在我们的产品设计中,首先我们会在 Hbase 中单独写入新数据(可能会持续 6 个月),一旦 Hbase 系统对新数据的读写稳定,就会开始将数据从 RDBMS 迁移到 Hbase .在这个阶段,我怀疑region split可能过于频繁,因为数据太大,会影响读写性能。
我们的行键将按每个用户的顺序递增。对于不同的用户,它会以不同的方式开始。
请提出一些解决方案,以在数据迁移期间保持服务器的性能。
【问题讨论】: