【问题标题】:Data partitioning in Cassandra for multiple datacenters with varying dataCassandra 中的数据分区,用于具有不同数据的多个数据中心
【发布时间】:2014-09-09 13:54:22
【问题描述】:

到目前为止,我已经在 Cassandra 中进行了数据分区,并找到了一些基本的做事方式,比如如果你有 6 个节点,每个节点有 3 个在两个独立的数据中心,我们有以下数据复制方法:

通过解析节点来进行数据复制,直到 Cassandra 在环中遇到属于另一个数据中心的节点并将副本放置在那里,重复该过程直到所有数据中心都拥有该节点的一个副本 - 根据 NetworkTopologyStrategy。

所以,我们有整个数据的两份副本,每个数据中心都有一份。但是,如果我想根据业务或地理位置等属性将数据逻辑拆分为两个单独的块,该怎么办?(印度数据中心的印度数据)。因此,我们将在一个地理位置的数据中心中拥有一大块数据,在另一个位置拥有另一块数据,并且它们都不重叠。

这可能吗? 考虑到 Cassandra 和大数据的一般应用,这有意义吗?

【问题讨论】:

    标签: cassandra


    【解决方案1】:

    地理分片当然是可能的。您只需运行多个未连接的数据中心,它们就不会复制。或者,您可以让它们复制,但您基于印度的应用程序仅读取和写入您的印度 DC。是否有意义取决于您的应用程序。

    【讨论】:

    • 但是对于连接的数据中心,没有办法控制将数据放置到一组特定的节点,对吧?
    • 使用 NetworkTopologyStrategy,您可以控制哪些逻辑数据中心将包含每个键空间的数据(独立于其他键空间)。请参阅 Data replicationCreate Keyspace 上的 Cassandra 文档。
    • 从来不知道 Cassandra 提供了这种级别的控制。我一直在看错地方。谢谢!!!
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2013-03-30
    • 2018-05-15
    • 1970-01-01
    • 1970-01-01
    • 2020-07-27
    • 1970-01-01
    • 2020-02-18
    相关资源
    最近更新 更多