【问题标题】:Data Lineage in purview insufficient权限范围内的数据沿袭不足
【发布时间】:2021-07-01 05:48:39
【问题描述】:
Azure Purview 目前仅显示来自 ADF 的复制活动的数据沿袭。这足够了吗?
在这个article 中给出:“通过将元数据从 Azure 数据工厂推送到 Azure Purview,可以启用可靠且透明的沿袭跟踪。”这是否超出了复制活动?如果是,我们怎样才能做到这一点?
在 Azure 中还有其他方法可以查看完整的数据沿袭吗?假设我们正在使用 ADF/Synapse/Azure Databricks。
【问题讨论】:
标签:
azure-synapse
azure-purview
data-lineage
【解决方案1】:
Data Factory、Data Share、Synapse、Azure Databricks 等工具都属于数据系统的范畴。当前与 Purview for lineage 集成的数据处理系统列表见此处Azure Purview Data Catalog lineage user guide
当前 Azure 数据工厂,支持范围:Copy activity、Data flow activity、Execute SSIS package activity
并且数据工厂和 Purview 之间的集成仅支持数据工厂支持的数据系统的子集,如 here 所述。
Azure Purview 当前不支持用于沿袭或扫描的查询或存储过程。 Lineage 仅限于表和视图源。
在沿袭视图中查找信息的其他一些方法包括:
- 在 Lineage 选项卡中,将鼠标悬停在形状上可在工具提示中预览有关资产的其他信息。
- 选择节点或边以查看其所属的资产类型或切换资产。
- 数据集的列显示在 Lineage 选项卡的左侧。有关列级沿袭的更多信息,请参阅Dataset column lineage。
还通过 Atlas 挂钩和 REST API 支持自定义血统报告。数据集成和 ETL 工具可以在执行时将沿袭推送到 Azure Purview。
将 Azure Purview 帐户连接到 Synapse 工作区可让您发现 Azure Purview 资产并通过 Synapse 功能与它们进行交互。
以下是 Synapse 中可用的 Azure Purview 功能列表:
- 使用顶部的搜索框根据关键字查找 Purview 资产
- 了解基于元数据、沿袭、注释的数据
- 使用链接服务或集成数据集将这些数据连接到您的工作区
- 使用 Synapse Apache Spark、Synapse SQL 和 Data Flow 分析这些数据集
- 元数据概览、查看和编辑元数据架构以及分类、词汇表术语、数据类型和描述
- 查看lineage以了解依赖关系并进行影响分析。
- 查看和编辑联系人以了解谁是数据集的所有者或专家
-
相关以了解特定数据集的层次依赖关系。这种体验有助于浏览数据层次结构。