【发布时间】:2017-05-16 16:19:14
【问题描述】:
假设我有一个日期维度,并且根据我的业务需求,我知道我需要做的最细致的工作是检查事件发生的具体日期。
我获得的数据为我提供了事件发生的确切时间 (YYYY-MM-DD HH:MM:SS)。我有两个选项:
- 在将数据加载到日期维度之前,从日期中切出 HH:MM:SS。
- 在我的日期维度中创建时间属性并插入完整的日期时间。
在我看来,我应该选择选项 1。这将删除冗余数据并节省一些空间。但是,如果我选择选项 2,如果业务需求发生变化,或者如果我的经理突然想要更细化,我就不需要修改我的原始设计。哪个选项更常用?还有其他我没有考虑过的选择吗?
更新 - 跟进问题
我每个月都会收到新数据。如果我使用包含所有日期的预构建日期维度,那么我是否需要每个月运行我的脚本以使用该月的新日期填充表格,或者我是否会有一个连续的过程,每天在表格中插入一行,那是哪一天?
【问题讨论】:
标签: date datetime data-warehouse business-intelligence dimensional-modeling