【发布时间】:2015-09-03 08:40:07
【问题描述】:
我有 2 种类型的用例 - 搜索和分析。我还有 2 种不同的方法来对我的主键候选字段进行分类。
- 高基数字段的分区键,其中不同值的数量在 100,000 到 10,000,000 之间,例如:
- Customer_id
- Employee_id
- IP地址
- MAC_address
此处的行键查询通常会返回少量结果。二级索引和水龙头很实用,因为它们位于低基数字段 - 请参阅下面的 #2。
- 按低基数字段划分键,其中唯一值的数量小于 100,例如:
- event_type - 比如“购买”或“authenticated_OK”
- 平台 - 如 5 种操作系统或 50 种应用程序
- metric_type - 类似于 CPU_utilization
- 协议 - 如 http 或 ftp
- SNMP MIB 名称
- 国家/地区代码,例如我们、ca、uk
- 州,如德州,纽约州
按行键的典型查询会返回数百万个结果,可能需要进一步分析。 二级索引在这里不太实用,因为它们通常位于上述 #1 的高基数字段上。
我的问题:: 正在对上面#1 中的数据进行建模,更适合 DSE 搜索;和 像上面 #2 这样的数据建模更适合 DSE 分析?
谢谢
【问题讨论】: