【发布时间】:2017-08-09 23:13:50
【问题描述】:
我一直在从事一个 SAS ETL 项目,其中我们首先在每个月初从 teradata 仓库中提取上个月的数据,然后将其进一步处理。
这是通过每个表的提取脚本完成的,然后将数据存储到每月文件夹结构 (yyyymm) 中。以这种方式工作了几个月后,我们现在开始收到对产品每日、每周等提取物的请求。 当前数据存储文件夹结构为:
Library/Data/YYYYMM 文件夹在一个库中。
我必须更改结构(对当前结构的影响最小)以适应不同的时间范围请求,例如每日、每周、每两周、每季度等。
我想到了两个选项:在当前结构(每月文件夹)中,添加
- 每日、每周和每月文件夹
- 图书馆/YYYYMM/每月
- 图书馆/YYYYMM/每日
- 图书馆 / YYYYMM / 每周
文件夹。
选项 2: 在数据库下创建文件夹,如
- 每月
- 每天
- 每周
- 每两周一次
- 季刊
在每个文件夹下都存在带有当前日期/月份/季度的单独文件夹。
谁能推荐其他更实用的设计方法?
【问题讨论】:
标签: sas data-warehouse