批处理到具有相同分区键的不同表

【问题标题】：Batch to different tables with same partition key批处理到具有相同分区键的不同表
【发布时间】：2018-09-27 17:11:50
【问题描述】：

与单独的插入相比，未记录的批次可在插入保持在同一分区内时提高性能。

如果表 t1 和 t2 共享完全相同的分区键怎么办 - 当批处理是 t1 和 t2 插入的混合时，同样的规则是否适用？ p>

这意味着各自的t1 和t2 分区存储在同一个节点上 - link

【问题讨论】：

【解决方案1】：

如果分区键相同，它将路由到相同的副本，所以如果发送到正确的协调器，它不会有额外的网络跃点。但它仍然需要将它们分别应用于不同的内存表。

虽然批处理很有趣，并且即使全部在同一个分区中，它也会在哪里损害性能，这在很大程度上取决于数据模型。如果批处理在您的应用程序中产生了巨大差异，则您的吞吐量更有可能受到延迟（littles law）的影响，在这种情况下，异步查询/处理也会有所帮助，并且会产生可预测的结果。

【讨论】：