【发布时间】:2011-04-04 15:28:37
【问题描述】:
有人要求我向我们的数据仓库添加一个新表。目前,我们将事实分为月度、季度和年度表,每个表都有时间维度。每个事实记录都有一个时间值。数据在源系统中按开始和结束期间生成,结束日期成为事实记录的时间维度值。事实流向月、季度或年事实表的过程告诉人们如何理解记录中的日期以及如何使用它们。
我被要求让新表在每条记录中包含开始日期和结束日期。有人告诉我,这违反了数据仓库原则,但它更好地代表了数据的生成方式,并允许更灵活地查询数据,例如滚动周期等。
我不是数据仓库专家。我知道每个事实的单一时间维度是一个原则。我的问题是,违反该原则的后果是什么?换句话说,反对这样做的理由是什么?将来我这样做可能会遇到什么问题?在我看来,每个事实的开始和结束时间段确实可以更好地代表数据,但我承认我的知识不足以全面评估这种设计选择的含义。谁能提供一些先见之明?
编辑: 我很欣赏这些答案。他们至少告诉我,这并不像我被引导相信的那样糟糕。我将澄清有关日期的一件事:它们不代表有效期,而是汇总的时期。因此,事实记录可以代表在任意月份计算的某种成分的平均使用磅数。不知道这是否有什么不同,但确实有。
【问题讨论】:
标签: database-design data-warehouse