【发布时间】:2019-04-10 09:39:15
【问题描述】:
我正在使用 Cassandra 来保存单词及其频率。
表架构会像
CREATE TABLE keywords_rate (
some_id int,
keyword Text,
frequency counter,
PRIMARY KEY (some_id, keyword)
);
问题是,我有数百万条记录,我需要获取每个some_id 的前 100 个关键字
但要做到这一点,我需要获取给定 some_id 的所有关键字并在后端(python)上对它们进行排序,然后获取前 100 条记录。这对我来说是一项非常昂贵的手术。
所以我的问题是:我可以对 Cassandra 内的柜台进行分类吗?如果没有,这种情况的最佳方法是什么?
谢谢。
【问题讨论】:
标签: python database database-design cassandra