【发布时间】:2018-04-05 13:23:39
【问题描述】:
对于一项学校作业,我们必须为一家虚构的航运公司设计和填充一个数据仓库。我用所有“脏”数据制作了一个 PSA 数据库,现在正在设计 ETL 过程。整个过程需要在 SSIS 中完成,除了一些基础教程之外,我对这个程序的了解非常有限。
我被困在清理表格中某些国家/地区书写不正确的列的过程中。我制作了一个参考表,其中一列是语法错误,另一列是国名的正确格式。这里可以看到知识库表的一个sn-p:
在这里您可以看到带有“脏”数据的表的 sn-p:
如何在 SSIS 数据流中使用知识库表中的正确数据搜索并替换“国家/地区”列中的错误数据?我认为我不能使用模糊查找,因为错误数据包含国家名称的缩写。
我们不能使用 Microsoft DQS,因为我猜这会让事情变得太容易......
提前致谢!
【问题讨论】:
-
你可以做的是:通过简单的连接将错误数据加入另一个表中。
-
如果您特别想使用 SSIS,请在 Id 列上使用合并转换,使用查找来更新数据。在 SSMS 中使用合并脚本更简单
标签: sql-server ssis etl