【问题标题】:Fact table reconciliation or verify事实表核对或验证
【发布时间】:2021-02-16 05:03:17
【问题描述】:

在数据仓库项目中,如何验证通过 SSIS ETL 加载在数据仓库数据库中加载的事实表与我的暂存表是否正确,以便以后不会出现错误报告?

【问题讨论】:

    标签: ssis etl data-warehouse fact-table datamart


    【解决方案1】:

    好问题,人们为此创建了不同的系统。所以你明白这是开发人员构建的最复杂的检查/核对过程之一。我试图给你三种方法来做到这一点。我会推荐第一个,因为它更容易且最有效。

    你可以-

    1. 加载后报告:创建将在加载后协调数据的报告。编写 SQL 来比较源数据和目标数据 - 比较计数、比较数量、比较空值、比较每日数据等。如果比较生成标志/警报 - 这意味着负载存在问题。
    2. 随时检查:您可以创建一些可重用的函数或映射来比较传入的源数据和目标数据 - 比较计数、比较数量、比较空值、比较每日数据等并存储在一个表中。脚本将继续检查这些值,如果有任何问题,脚本将通知支持团队。
    3. 流程前检查:在开始任何 ETL 之前,您可以检查源数据 - 如计数、空值、每日计数等,以验证数据如何,是否有任何文件丢失等。

    【讨论】:

    • 我已经制作了事实表,我在其中添加了维度表的所有代理键(注意业务键仍在维度表中),并将这些维度与基于代理键的事实连接起来。我已经在事实表中包含了所有符合事实条件的列,包括临时表中某个维度的发票号,您能否详细说明如何检查我的设计是否正确并给出正确的结果。此外,构建事实表时的任何提示都应牢记应包含/排除哪一列......谢谢
    • 如何检查设计是否正确并给出正确的结果 - 您的报告/业务应进行测试以验证正确的数据。在构建事实时,大多数影响是数据和度量的粒度,相关维度。然后是代理键上的索引(主要是位图)。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多