【发布时间】:2008-12-12 05:09:04
【问题描述】:
是否有技术可以比较存储在不同模式中的相同数据?情况是这样的。如果我有一个带有模式 A 的数据库,并且它将某个功能的数据存储在 5 个表中。 Schema A -> Schema B 在升级过程中完成。在升级过程中,应用了一些转换逻辑,数据存储在 Schema B 的 7 个表中。 我追求的是某种验证数据完整性的方法,基本上我必须在考虑转换逻辑的同时比较不同的模式。缺少编写一些自定义 t-sql 存储过程来比较数据,是否有替代方法?我倾向于使用 python 来自动执行此操作,是否有任何 python 模块可以帮助我? 为了更好地说明我的问题,下图是我需要比较的众多数据集之一的粗略图片,属性 1、2、3 和 4 从模式源迁移到目标,但它们分布在不同的表中。
Table1Src Table1Dest
| |
--ID(Primary Key) --ID(Primary Key)
--Property1 --Property1
--Property2 --Property5
--Property3 --Property6
Table2Src Table2Dest
| |
--ID(Foreign Key->Table1Src) --ID(Foreign Key->Table1Dest)
--Property4 --Property2
--Property3
Table3Dest
|
--ID(Foreign Key->Table1Dest)
--Property4
--Property7
【问题讨论】:
-
这在一定程度上取决于我们谈论的数据量,以及您的比较需要有多严格。数据的顺序基本一致吗? ID是否一致?您是否需要以严格的、依赖于数据类型的方式比较它们?所有这些问题都会影响战略。
-
显示每个模式的基本图,以便我有一些想法?
-
感谢您的回复,我有大约 10-15 次比较需要在 40-50 张桌子上进行。大多数比较具有一致的 ID,但在转换过程中,额外的数据将被添加到目标,我需要对其进行分类。没有必要进行严格的比较。
-
我将发布一个基本架构图