【发布时间】:2019-10-25 14:54:04
【问题描述】:
我们正在考虑将 ODS 从 S3 迁移到 Snowflake,但对性能有些担忧。从 15 亿行(这将是较小的一侧)行表中删除 3900 万行在 x-small 仓库中需要 15 分钟,在小型仓库中需要 8 分钟,在中型仓库中需要 5 分钟。我们可以在更大的情况下投入资金,但在探索所有其他措施之前真的不想这样做。
我们也在考虑实施手动分区系统,以将表分块,但创建支持功能需要开发成本。
Snowflake 是否有一个我不知道的分区系统,它相当于 SQL Server?我知道这是一个范围,但交换分区很棒。
感谢您的任何反馈!
【问题讨论】:
-
费用为 0.50 学分 (XS)、0.53 学分 (s) 和 0.67 学分 (m)。在我们的例子中是 1 美元。根据您这样做的频率,我不确定这应该被视为“问题”
-
虽然人们提到你可以集群来排序数据,你应该命令它保存你最常做的操作,(经常读取)以避免读取所有分区,不用担心关于删除等微小的成本..
-
我很惊讶 S3 在您的情况下更快或更便宜。你能告诉我们你的删除查询的执行计划吗? Snowflake 中唯一的性能旋钮仍然是集群键(如果不集群,则为排序)。
标签: snowflake-cloud-data-platform