【问题标题】:Redshift Composite Sortkey - how many columns should we use?Redshift Composite Sortkey - 我们应该使用多少列?
【发布时间】:2018-02-04 23:15:35
【问题描述】:

我正在 Amazon Redshift 上构建几个非常大的数据表,这些数据表应该包含涵盖多个具有相关指标的频繁查询属性的数据。

我们使用均匀分布样式(“diststyle even”)让所有节点都参与查询计算,但我不确定排序键的长度。

它绝对应该是复合的——每个查询都将使用日期和网络上的第一个过滤器——但在那个级别之后,我有大约 7 个额外的相关因素可以查询。 我见过的所有示例都使用 2-3 个字段的复合排序键,最多 4 个。

我的问题是 - 为什么不使用包含表中所有关键字段的排序键?长排序键有什么缺点?

【问题讨论】:

  • 好吧,如果你建立一个包含表中所有列的索引,它会比你建立一个只包含几个列的索引占用更多的空间。因此,如果空间是一个问题,那么这可能是您问题的答案。

标签: amazon-redshift


【解决方案1】:

如果您有多个排序键,VACUUM 也会花费更长的时间。

【讨论】:

    猜你喜欢
    • 2019-03-08
    • 1970-01-01
    • 2016-12-24
    • 1970-01-01
    • 2010-09-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-06-11
    相关资源
    最近更新 更多