【发布时间】:2021-04-11 22:23:49
【问题描述】:
我在 Azure 上部署了一个 Django Web 应用程序,其中包含一个事务性 SQL DB,即 PostgreSQL。
在 Django 应用程序中,每天都需要从 ADLS 访问这些历史数据(例如:显示几年、几个月等期间的模式)。
但是,ADLS 将只返回单个/多个文件,并且我的应用程序需要 Azure Synapse 之类的中间件将这些非结构化数据转换为结构化 DB,以便对这些历史数据执行查询在 Web 应用程序中显示它。
问题。 A) Azure Synapse 会满足这种“非结构化到结构化转换”的要求,还是有另一种 Azure 替代方案。
问题。 B) 由于 Django 本质上与 ORM(对象关系映射)相关联,因此 Web 应用的 PostgreSQL 和 Azure Synapse(即 ArrayField、JSONField 等)之间是否存在兼容性问题
正在进行整个练习,以便将较旧的历史数据存储在大型存储库中,并在需要时访问/查询该 ADLS 存储库中的数据。
请指导在这种情况下哪些 Azure 替代方案可能有效。
【问题讨论】:
-
您能提供一个数据示例吗?它以什么形式存储在 ADLS 中? JSON、镶木地板、文本、csv……?简而言之,是的 Synapse 可以做到这一点。
-
JSON 格式。 Synapse 是否必须通过 Azure 数据工厂在管道系统中同时配置 App DB 和 ADLS?这对于 PostgreSQL 数据库是否可以实现?因为我无法专门讨论 PostgreSQL DB ADLS 连接的 Azure 文档。
-
我认为您可以使用 Azure 数据工厂将 json 文件复制到 Azure Synapse。
-
如果我不使用 Synapse,我是否仍然能够利用 Azure 数据工厂创建往返 PostgreSQL DB 和 ADLS 的管道?
-
@Simran,我想你可以。有几个Supported data stores,我们可以看到Copy Activity支持PostgreSQL作为source,ADLS作为sink。
标签: django postgresql azure azure-data-lake azure-synapse