【问题标题】:Performance of Post-Aggregations in Apache DruidApache Druid 中后聚合的性能
【发布时间】:2021-10-15 21:55:09
【问题描述】:

在启用汇总时使用后聚合而不是在摄取规范中定义指标时,我必须考虑哪些性能权衡?

【问题讨论】:

    标签: druid


    【解决方案1】:

    我想这一切都取决于结果集。

    当您在摄取时执行此操作时,将数据推送到您的 druid 集群只需要一些时间。选择数据只是从段中检索数据的问题。

    后聚合将遍历您的查询结果,然后“重新处理”结果。所以这会有一些开销。多少很难说。

    当您需要更高的速度或想要减少 CPU 时,我建议您在摄取时进行更改。但是,缺点是这会占用额外的磁盘空间,因为您将计算结果存储为新列。

    如果磁盘空间有问题,我想你最好使用后聚合。

    【讨论】:

      猜你喜欢
      • 2020-08-23
      • 2017-07-18
      • 2015-02-17
      • 2016-04-09
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-03-23
      相关资源
      最近更新 更多