【发布时间】:2020-10-15 20:36:34
【问题描述】:
由于表中有大量数据,SELECT * 查询似乎效率低下。 怎么可能解决这个问题?
对于 C* 基础架构的设计或表本身的设计有什么想法吗?
是否有任何特殊的查询结构可以更有效地执行选择所有元素?
【问题讨论】:
标签: database performance cassandra architecture nosql
由于表中有大量数据,SELECT * 查询似乎效率低下。 怎么可能解决这个问题?
对于 C* 基础架构的设计或表本身的设计有什么想法吗?
是否有任何特殊的查询结构可以更有效地执行选择所有元素?
【问题讨论】:
标签: database performance cassandra architecture nosql
由于表中有大量数据,SELECT * 查询似乎效率低下。怎么可能解决这个问题?
对于关系型数据库,SELECT * FROM 无限制 == 全表扫描
使用像 Cassandra 这样的分布式数据库,SELECT * FROM 无限制 == 完整的 CLUSTER 扫描,可能在 100 多台机器的集群上......
长话短说,它不是为全表扫描设计的。
如果您需要扫描表中的所有数据,请使用带有 Spark/Cassandra 连接器的 Apache Spark 来完成这项工作。
是否有任何特殊的查询结构可以更有效地执行选择所有元素?
不,魔法不存在。如果有人找到一种方法在分布式数据库中非常快速地执行全表扫描,那么他已经成为百万富翁了。
【讨论】: