【发布时间】:2021-12-14 16:35:31
【问题描述】:
我们正在为我们的项目构建一个新的数据管道,我们必须将全天在我们的 SQL 服务器上发生的增量更新移动到 Azure 突触中以进行一些数字处理。 我们必须将发生在 60 多个表中的更新(每天 1-2 百万次更新)转化为突触,以处理全天发生的一些聚合和统计数据。
其中一个要求是接近实时,并且批量导入突触并不理想,因为对所有数据进行完整计算需要 10 多分钟。
我一直在阅读有关突触https://docs.microsoft.com/en-us/azure/data-factory/tutorial-incremental-copy-change-data-capture-feature-portal 的 CDC 馈送信息,这是一种可能的解决方案。 想知道是否有其他替代方案或建议来实现近乎实时的数据处理以进行数据库更新的最终目标。
【问题讨论】:
-
你需要保留历史变化吗?
标签: sql azure architecture dataflow azure-synapse