【发布时间】:2016-11-17 21:22:56
【问题描述】:
我正在从事一个数据仓库项目,该项目将涉及集成来自多个源系统的数据。我设置了一个 SSIS 包,用于填充客户维度并使用渐变维度工具来跟踪客户的更新。
我遇到了一些问题。举个例子:
源系统 A 可能有如下记录:
名字、姓氏、邮政编码 简,母鹿,14222
源系统 B 可能有同一个客户端的记录,如下所示:
名字、姓氏、邮政编码 Jane, Doe, 未知
如果我首先从系统 A 导入记录,我将拥有名字、姓氏和种族。伟大的。现在,如果我从系统B导入客户记录,我可以做模糊匹配识别这是同一个人,并使用渐变维度工具更新信息。但在这种情况下,我会丢失邮政编码,因为“未知”会覆盖有效数据。
我想知道我是否以错误的方式处理这个问题。 SCD 工具似乎没有提供任何根据新数据是否有效来选择性地更新属性的方法。合并语句会更好吗?我是否犯了一些我没有看到的基本设计错误?
感谢您的建议!
【问题讨论】:
标签: sql-server ssis data-warehouse scd