【问题标题】:SAS Data Mart files structure suggestionsSAS 数据集市文件结构建议
【发布时间】:2017-08-09 23:13:50
【问题描述】:

我一直在从事一个 SAS ETL 项目,其中我们首先在每个月初从 teradata 仓库中提取上个月的数据,然后将其进一步处理。

这是通过每个表的提取脚本完成的,然后将数据存储到每月文件夹结构 (yyyymm) 中。以这种方式工作了几个月后,我们现在开始收到对产品每日、每周等提取物的请求。 当前数据存储文件夹结构为:

Library/Data/YYYYMM 文件夹在一个库中。

我必须更改结构(对当前结构的影响最小)以适应不同的时间范围请求,例如每日、每周、每两周、每季度等。

我想到了两个选项:在当前结构(每月文件夹)中,添加

  • 每日、每周和每月文件夹
  • 图书馆/YYYYMM/每月
  • 图书馆/YYYYMM/每日
  • 图书馆 / YYYYMM / 每周

文件夹。

选项 2: 在数据库下创建文件夹,如

  • 每月
  • 每天
  • 每周
  • 每两周一次
  • 季刊

在每个文件夹下都存在带有当前日期/月份/季度的单独文件夹。

谁能推荐其他更实用的设计方法?

【问题讨论】:

    标签: sas data-warehouse


    【解决方案1】:

    也许 SAS 生成数据集是一个选项:http://support.sas.com/documentation/cdl/en/lrcon/62955/HTML/default/viewer.htm#a000934566.htm

    这里是 SAS 的摘录:

    世代数据集是 SAS 数据集的存档版本,存储为世代组的一部分。每次替换文件时都会创建一个生成数据集。一个世代组中的每个世代数据集都有相同的根成员名称,但每个都有不同的版本号。生成数据集的最新版本称为基础版本。

    【讨论】:

    • 感谢 Zuluk 的回复,但这就像使当前流程更加复杂。我想添加一个新的文件结构,对现有流程的更新最少。您能否建议任何其他选项来添加定期数据集?
    • 不,但是在我看来,您的第一个选项是最适用的。
    猜你喜欢
    • 1970-01-01
    • 2015-06-18
    • 2015-05-18
    • 2016-05-21
    • 2019-10-26
    • 2013-03-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多