【发布时间】:2013-10-29 13:45:35
【问题描述】:
我正在尝试了解数据仓库的基础知识。 在加载事实表时,我发现了两条建议。
- 加载期间单独插入、更新
- 删除索引并在加载后构建它们。
关注他们有什么好处?
【问题讨论】:
标签: data-warehouse etl
我正在尝试了解数据仓库的基础知识。 在加载事实表时,我发现了两条建议。
关注他们有什么好处?
【问题讨论】:
标签: data-warehouse etl
简单回答,不赘述:
通常,您希望使用新数据(插入)或更改的数据(根据您处理更改的方式更新或插入)进行不同的处理
更改表时需要重新创建索引,导致在加载每行数据后索引重新创建速度很慢。当您加载大量数据(这是数据仓库中的典型场景)时,您会无缘无故地显着减慢加载过程。因此,强烈建议在加载大量数据之前删除索引,并在加载完成后仅重新创建一次
【讨论】: