【发布时间】:2018-09-27 17:11:50
【问题描述】:
与单独的插入相比,未记录的批次可在插入保持在同一分区内时提高性能。
如果表 t1 和 t2 共享完全相同的分区键怎么办 - 当批处理是 t1 和 t2 插入的混合时,同样的规则是否适用? p>
这意味着各自的t1 和t2 分区存储在同一个节点上 - link
【问题讨论】:
标签: cassandra
与单独的插入相比,未记录的批次可在插入保持在同一分区内时提高性能。
如果表 t1 和 t2 共享完全相同的分区键怎么办 - 当批处理是 t1 和 t2 插入的混合时,同样的规则是否适用? p>
这意味着各自的t1 和t2 分区存储在同一个节点上 - link
【问题讨论】:
标签: cassandra
如果分区键相同,它将路由到相同的副本,所以如果发送到正确的协调器,它不会有额外的网络跃点。但它仍然需要将它们分别应用于不同的内存表。
虽然批处理很有趣,并且即使全部在同一个分区中,它也会在哪里损害性能,这在很大程度上取决于数据模型。如果批处理在您的应用程序中产生了巨大差异,则您的吞吐量更有可能受到延迟(littles law)的影响,在这种情况下,异步查询/处理也会有所帮助,并且会产生可预测的结果。
【讨论】: