【问题标题】:Fact Table with Different Update Schedules具有不同更新计划的事实表
【发布时间】:2010-10-12 20:11:46
【问题描述】:

我有两组粒度相同的数据,例如发票编号。由于我们确认了以前发票的收入,因此所需的大部分数据每天都会更新。但是,其中一些数据每月一次通过单独的成本核算系统提供,然后与其他信息一起提供给数据仓库。我应该创建一个包含两组数据的事实表,然后在导入其他数据时每月对事实表运行一次更新,还是应该因为更新计划不同而创建两个事实表。数据是相关的,许多查询 (~35%) 需要来自两组数据的信息(如果可用)。系统每天导入 30,000 行到事实表中,其中大约有 38,000,000 行,每月更新将影响 660,000 行。

【问题讨论】:

  • 从您的帖子中不清楚您是否会创建重复条目。 “一些数据是通过成本核算系统提供的”。这是否意味着它直到成本核算系统步骤之后才进入 DWH,还是所有数据都进入 DWH 并且一些数据也发送到成本核算系统?
  • 不会有重复。输入成本核算系统的数字已经在数据仓库中,不会重新输入。只会插入新的数据元素(事实)。

标签: database-design data-warehouse


【解决方案1】:

如果在第二步中没有修改已经存在的度量,您可以将事实表视为“累积快照”。 该表描述了具有明确开始和结束的流程——一种工作流。在 Kimball 的 Data Warehouse Toolkit 中查找,或者在 Google 中查找“Kimball 累积快照事实表”。

【讨论】:

  • 这看起来很适合我正在做的事情,谢谢。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-11-09
  • 1970-01-01
  • 1970-01-01
  • 2022-06-14
  • 1970-01-01
相关资源
最近更新 更多