【发布时间】:2019-11-06 13:56:53
【问题描述】:
作为 Redshift 日常负载的一部分,我有几个表要删除并全部加载(数据量很小,不到 100 万)。
我的问题是,就 Redshift 中的 CPU 利用率和内存而言,以下两种策略中哪一种更好: 1) 截断数据 2) 删除并重新创建表。
如果我截断表,我是否应该每天对表执行真空操作,因为我已经读到数据库中频繁删除和重新创建表会导致页面碎片。
还有一张我想启用压缩的表。那么,每天使用编码创建 DDL 有什么缺点吗?
请指教!谢谢!
【问题讨论】:
标签: amazon-redshift truncate vacuum