【发布时间】:2013-01-05 04:54:53
【问题描述】:
例如,如果我处理大量事务 [timestamp (key)、value、trader,..],我希望进行随机分区以实现负载平衡。
但是为了查询,我希望这些事务按每个节点上的时间戳排序,以便在过去 5 分钟(或其他时间)内完成所有事务并使用 MapReduce 合并总数会非常快.
如果我使用随机分区器,为什么 cassandra 会对文件中的键进行随机排序?
Q1:有解决办法吗?我可以使用索引,但这并不理想。
Q2.出于好奇我想知道为什么一个节点中的键排序与分区策略有关?
【问题讨论】: