【发布时间】:2017-08-25 00:52:49
【问题描述】:
- 使用 cassandra 2.2.8
我的挑战如下。在我的数据库中,我们有一堆包含数百万行的表。不幸的是,由于少数表上的松散设计分区键的大小以千兆字节增长 - 这对系统造成了负面压力,并且正在发生诸如 jvm 内存不足/节点崩溃之类的问题。
我们需要重新设计几个表的分区键。我们需要保留/或迁移到新表的表中的数据。
我正在寻找能够将数据从源表导出到目标表的解决方案(即使用重新设计的复合分区键);我希望这将有助于以更平衡的方式分散分区。
我尝试使用 COPY[tablename(column1,column2...)] 命令,但这是探测节点数,导致系统/堆压力,即影响应用程序。我在这里寻求指导,以了解如何最好地应对这一挑战 - 提前感谢您的帮助。
【问题讨论】:
标签: cassandra sharding database-partitioning