【发布时间】:2018-10-24 19:41:57
【问题描述】:
我有多个不同模式的输入源。为了使用 Clickhouse 进行一些分析,我想到了两种处理分析工作负载的方法,使用 join 或 aggregation 操作:
使用连接涉及定义与每个输入对应的表。
-
使用聚合函数需要一个表,其中包含一组预定义的列,列的数量和列的类型将基于我的近似值,并且将来可能会发生变化。
我的问题是:如果我采用第二种方法,定义很多列,比如说数百列。它如何影响性能、存储成本...等?
【问题讨论】:
标签: database clickhouse