如何在 C* (Cassandra) 中执行高效的 SELECT * 查询答案

【问题标题】：How to perform efficient SELECT * queries in C* (Cassandra)如何在 C* (Cassandra) 中执行高效的 SELECT * 查询
【发布时间】：2020-10-15 20:36:34
【问题描述】：

由于表中有大量数据，SELECT * 查询似乎效率低下。怎么可能解决这个问题？

对于 C* 基础架构的设计或表本身的设计有什么想法吗？

是否有任何特殊的查询结构可以更有效地执行选择所有元素？

【问题讨论】：

标签： database performance cassandra architecture nosql

【解决方案1】：

由于表中有大量数据，SELECT * 查询似乎效率低下。怎么可能解决这个问题？

对于关系型数据库，SELECT * FROM 无限制 == 全表扫描

使用像 Cassandra 这样的分布式数据库，SELECT * FROM 无限制 == 完整的 CLUSTER 扫描，可能在 100 多台机器的集群上......

长话短说，它不是为全表扫描设计的。

如果您需要扫描表中的所有数据，请使用带有 Spark/Cassandra 连接器的 Apache Spark 来完成这项工作。

是否有任何特殊的查询结构可以更有效地执行选择所有元素？

不，魔法不存在。如果有人找到一种方法在分布式数据库中非常快速地执行全表扫描，那么他已经成为百万富翁了。

【讨论】：

加一个表示：“如果有人找到一种方法可以极快地在分布式数据库中执行全表扫描，那么他已经成为百万富翁了。”